用語集

物体検出

物体検出のパワーを発見しましょう。YOLO のような最先端のモデルを使って、画像やビデオ内の物体を識別し、位置を特定します。実世界のアプリケーションを探求する!

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

物体検出はコンピュータビジョンにおける重要なタスクであり、機械が画像やビデオ内の特定の物体を識別し、位置を特定することを可能にする。画像中の物体の存在のみを判定する画像分類とは異なり、物体検出は検出された各物体の周囲にバウンディングボックスを描き、その位置を特定する。この技術は、機械が視覚データを認識する方法と、人間が周囲の環境を理解する方法のギャップを埋めるものである。

物体検出のコアコンセプト

オブジェクト検出は、分類と定位という2つの重要なプロセスを組み合わせたものである。分類は、どのような物体(車、人、木など)が存在するかを特定し、ローカライゼーションは、通常、物体の周囲にバウンディングボックスを描くことによって、これらの物体が画像内のどこにあるかを特定する。これは通常、高度なアルゴリズムを使用して達成され、多くの場合、異なる物体を特徴付けるパターンと特徴を認識するように学習する畳み込みニューラルネットワーク(CNN)をベースにしている。物体検出モデルの精度は、Intersection over Union (IoU)mean Average Precision (mAP)のようなメトリクスを用いて評価されることが多い。

物体検出モデルの種類

物体検出モデルは、1段検出器と2段検出器の2種類に大別できる。R-CNNのような2段階検出器は、まず領域プロポーザルを生成し、次にこれらの領域を分類することで精度を優先する。対照的に、1段検出器、例えば Ultralytics YOLOのような1段検出器は、1回のパスで直接バウンディング・ボックスとクラス確率を予測することで、より速い性能を提供する。アンカー・フリー検出器は、事前に定義されたアンカー・ボックスの必要性を排除することによって検出プロセスを単純化する新しいアプローチであり、潜在的に汎化を改善し、複雑さを軽減する。

物体検出の応用

物体検出は、様々な業界において、実世界での応用範囲が広い:

  • 自律走行車:自動運転車は、歩行者、車両、交通標識、障害物をリアルタイムで識別し、環境を認識するために物体検出に大きく依存している。これは、自律走行システムにおけるナビゲーション、安全性、意思決定に不可欠です。自動運転車におけるAIの詳細については、こちらをご覧ください。
  • セキュリティと監視物体検知は、セキュリティシステムにおいて、侵入検知、人数カウント、異常検知などのタスクに使用される。例えば、セキュリティアラームシステムでは、物体検出を使用して、許可されていない個人や不審な行動をリアルタイムで識別することができます。盗難防止のためのコンピュータ・ビジョンについては、こちらをご覧ください。
  • ヘルスケア医療画像診断において、物体検出は、X線、CTスキャン、MRIにおける腫瘍や病変などの異常の特定と局在化を支援します。この技術は診断精度とスピードを向上させ、医療従事者の医療画像解析を支援します。
  • 小売業物体検知は、小売環境における在庫管理、顧客行動分析、自動レジシステムに使用されています。棚に陳列された商品の追跡、顧客動線の分析、盗難防止などに役立ちます。よりスマートな小売在庫管理のためのAIをご覧ください。

ツールとフレームワーク

物体検出モデルの開発と導入には、しばしば強力なツールとフレームワークが必要になる。 Ultralytics YOLOのようなモデルを提供し、その速度と精度の高さから人気の高い選択肢となっている。 YOLOv8YOLOv11のようなモデルを提供している。OpenCVは、画像処理や物体検出を含むコンピュータ・ビジョン・タスクのための豊富な機能を提供する、もう1つの広く使用されているライブラリです。Ultralytics HUBのようなプラットフォームは、モデルのトレーニング、デプロイ、管理のプロセスを簡素化します。 Ultralytics YOLOモデルを簡素化します。

課題と今後の方向性

大きな進歩にもかかわらず、物体検出は、小さな物体を正確に検出すること、オクルージョン(部分的に隠れた物体)を処理すること、照明条件や物体の外観が変化してもロバスト性を維持することなどの課題に直面している。現在進行中の研究は、モデルの効率、精度、汎化能力の向上に重点を置いています。ヴィジョン・トランスフォーマー(ViT)やより効率的なアーキテクチャのような分野での進歩は、リアルタイム物体検出で可能なことの限界を押し広げ続けています。

すべて読む