AI学習は画像認識から|マンツーマン教室ではじめよう!


AI(人工知能)入門の王道『画像認識』を始めよう!

無料ながら画像認識率が高いソフト『YOLO V8』を使いこなしてオリジナルAI画像認識装置を作ろう!
AI画像認識技術の入門編から活用・応用まで楽しめる感動学習が体現できます。  『YOLO V8』はPython環境で動作、パソコンはもちろんラズパイなどのマイコン環境でも動作します! ラズパイは組み込み装置としても最適です。 機械学習では大量の画像データを扱うため高性能PCやGPU(グラフィックボード)であるほうが処理スピードで有利となりますが、『Google Colab』を活用することによりGPU処理が可能となります。 また『生成AI』をカスタマイズする場合でも『Google Gemini』であれば無料でGemini APIキー活用でカスタマイズできます

【第1段階】
【『YOLO V8』使い方】
『YOLO V8』で提供される学習済ファイルを使い任意の画像データで検証することができる

【静止画】 に適用
画像認識前 【元画像】
矢印  
画像認識後 【認識後】

人物:4人
バス:1台
自転車:1台
を認識

【動画】 に適用

【元画像】
矢印

【認識後】

【第2段階】
【データ活用、Webカメラ】
得られた結果データは画像解析に応用。例えば、イベント参加者人数のカウント、商品などの不良品判定など

【人数カウント】 に適用
 
画像認識前
【元画像】
矢印
画像認識後
【認識後】
人数カウント、16人が写っています

【Webカメラ撮影から解析】


 ペンギン16羽、人間2人と認識

【第3段階】
【転移学習の活用】
YOLOv8の学習済モデルをもとに自分のオリジナル画像の機械学習をさせ物体検知を行うことができる

【商品欠陥の検知】 などに活用
学習用画像の収集、下記サンプルからターゲットとなる画像を切り出す、アノテーションと呼ばれる手法。
画像認識前
【元画像】
     ↓

【x、y 座標で画像切り出し】
  x座標    y座標
  0.135156 0.192969 0.204687 0.210938
  0.417187 0.318750 0.196875 0.200000
  0.746094 0.219531 0.226562 0.226562
  0.527344 0.871875 0.210938 0.203125
【転移学習を実行】 機械学習
学習用データの収集が終わったら、YOLO V8 学習済データを使って転移学習を行う、得られたオリジナル学習済データから任意の画像に適用し 『みかん』個数を数えてみます。
矢印
みかん大使

【第4段階】
【生成AIの進化】
ChatGPT、Gemini、Copilot、他などブラウザ経由の活用と、プログラミングによるAPIの学習

【Google Colabの活用】
Google Colabは、Googleクラウドサービスの一つ、ブラウザから Python を記述、実行、GPUモードを利用などができます
画像認識前
  
【Stable Diffusion】 web UI
 AI画像の生成
Stable Diffusion web UIを使って画像を生成したい場合には、自分のPCにアプリをインストールことが必要、さらに高速CPU/GPU動作ができないと相当時間がかかる。 Googleクラウドサービスを使うとGPUモードが活用できますが『Google Colab PRO(有料版)』が必要となります
矢印
レトロ画像





    本文【作成中】