本文【作成中】
AI(人工知能)入門の王道『画像認識』を始めよう!
【第1段階】
【『YOLO V8』使い方】
『YOLO V8』で提供される学習済ファイルを使い任意の画像データで検証することができる
【静止画】 に適用 | |
【元画像】 | |
【認識後】 人物:4人 バス:1台 自転車:1台 を認識 |
【動画】 に適用 |
【元画像】 |
【認識後】 |
【第2段階】
【データ活用、Webカメラ】
得られた結果データは画像解析に応用。例えば、イベント参加者人数のカウント、商品などの不良品判定など
【人数カウント】 に適用 |
【元画像】 |
【認識後】 |
人数カウント、16人が写っています |
【Webカメラ撮影から解析】
ペンギン16羽、人間2人と認識
【第3段階】
【転移学習の活用】
YOLOv8の学習済モデルをもとに自分のオリジナル画像の機械学習をさせ物体検知を行うことができる
【商品欠陥の検知】 などに活用 |
学習用画像の収集、下記サンプルからターゲットとなる画像を切り出す、アノテーションと呼ばれる手法。 |
【元画像】 |
↓ |
【x、y 座標で画像切り出し】 |
x座標 y座標 0.135156 0.192969 0.204687 0.210938 0.417187 0.318750 0.196875 0.200000 0.746094 0.219531 0.226562 0.226562 0.527344 0.871875 0.210938 0.203125 |
【転移学習を実行】 機械学習 |
学習用データの収集が終わったら、YOLO V8 学習済データを使って転移学習を行う、得られたオリジナル学習済データから任意の画像に適用し 『みかん』個数を数えてみます。 |
【第4段階】
【生成AIの進化】
ChatGPT、Gemini、Copilot、他などブラウザ経由の活用と、プログラミングによるAPIの学習
【Google Colabの活用】 |
Google Colabは、Googleクラウドサービスの一つ、ブラウザから Python を記述、実行、GPUモードを利用などができます |
【Stable Diffusion】 web UI AI画像の生成 |
Stable Diffusion web UIを使って画像を生成したい場合には、自分のPCにアプリをインストールことが必要、さらに高速CPU/GPU動作ができないと相当時間がかかる。 Googleクラウドサービスを使うとGPUモードが活用できますが『Google Colab PRO(有料版)』が必要となります |
本文【作成中】