用語集

画像認識

画像認識によってAIがどのようにビジュアルを分類・理解し、ヘルスケア、小売、セキュリティなどのイノベーションを推進しているかをご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

画像認識は人工知能の重要な一分野であり、コンピュータやソフトウェアシステムに、画像内の物体、人物、場所、行動を識別・分類する能力を与える。単に物体を検出するだけでなく、人間が行うのと同じように、画像に何が描かれているかを理解し、ラベル付けすることが含まれる。この技術は、様々な産業における多くの高度なアプリケーションの基礎であり、機械が視覚データを「見て」解釈することを可能にする。

画像認識とは?

画像認識はコンピュータビジョン(CV)のサブセットで、画像内の物体や特徴を識別・分類することに重点を置いている。機械学習(ML)アルゴリズム、特に畳み込みニューラルネットワーク(CNN)のような深層学習(DL)技術を活用して画像を分析し、意味のある情報を抽出する。画像内の物体の位置を特定し、その周囲にバウンディングボックスを描く物体検出とは異なり、画像認識は主に画像全体または画像内の領域の内容を分類することに重点を置いている。

このプロセスでは通常、ラベル付けされた画像の大規模なデータセットでモデルを学習する。この学習段階により、モデルは異なるカテゴリーに関連するパターンと特徴を学習する。一旦学習されると、モデルは新しい未見の画像を分析し、存在するカテゴリやコンテンツを予測することができる。のようなフレームワーク PyTorchOpenCVのようなツールは、画像認識システムの構築や実装によく使用される。

画像認識の応用

画像認識技術は、さまざまな分野で幅広く応用されている:

  • 医療画像解析:ヘルスケアにおいて、画像認識は医療画像解析に不可欠であり、MRIやCTスキャンから腫瘍などの疾患を検出するのに役立ちます。放射線科医が診断精度と効率を向上させ、患者の予後改善に貢献する。例えば、Ultralytics YOLO11 、医療画像診断では脳腫瘍の検出に役立つ
  • 小売業と在庫管理小売業では、よりスマートな小売在庫管理のために画像認識を使用しています。システムは自動的に棚の商品を認識し、在庫レベルを追跡し、さらには顧客の買い物行動を分析することができます。これにより、在庫レベルの最適化、ロスの削減、顧客体験の向上につながります。
  • 自律走行車: 自動運転車のAIは、道路シーンを理解し、交通標識を認識し、歩行者を識別し、安全にナビゲートするために、画像認識に大きく依存している。これは、安全運転のために車両が環境を正確に認識することを保証する重要な要素である。
  • セキュリティと監視: Ultralytics YOLOv8 、最先端のセキュリティアラームシステムの構築に使用できます
  • 農業農業では、画像認識は、植物の病気を特定し、作物の健康状態を監視し、異なる種類の作物や雑草を区別することで、精密農業をサポートする。これは、YOLOv5 の作物病害検出アプリケーションに見られるように、資源利用を最適化し、農業収量を向上させるのに役立つ。

画像認識と物体検出の比較

画像認識と物体検出はどちらもコンピュータ・ビジョンのタスクであるが、その目的は異なる。画像認識は、画像に写っているものを分類し、「これは何ですか?一方、物体検出は、画像内の物体の位置をピンポイントで特定し、「物体はどこにあり、それらは何なのか」という質問に答えます。Ultralytics YOLO モデルは汎用性があり、特定のアプリケーションとモデル構成に応じて、両方のタスクに使用することができます。

まとめると、画像認識は視覚情報を解釈し理解する能力を機械に提供する強力な技術であり、多くの産業でイノベーションと効率化を推進している。AIが進化を続ける中、画像認識は、テクノロジーや私たちを取り巻く世界との相互作用を形成する上で、ますます重要な役割を果たすことは間違いない。

すべて読む