用語集

二段式物体検出器

複雑なコンピュータビジョンタスクにおける正確な物体検出のための精度を重視したソリューションです。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

二段階物体検出器は、コンピュータビジョンにおける物体検出アーキテクチャのカテゴリを表し、検出プロセスを2つの異なる段階に分けることで精度を優先している。これらの検出器は、まず画像内で物体が存在する可能性のある関心領域を特定し、次に第2段階でこれらの領域内の物体を分類し、その位置を絞り込むように設計されています。この方法論的アプローチにより、各物体の可能性をより詳細に分析することができ、特に複雑なシナリオにおいて、より高い検出精度につながります。

概要

2段検出器は物体検出の進化における礎石であり、画像内の物体を識別し位置を特定するための強固なフレームワークを提供する。1段検出器とは異なり、2段検出器は物体検出を逐次的に行うことで、速度よりも精度を重視します。これは、最初に物体位置の候補を特定する提案段階を含み、次にこれらの提案を分類し、正確に位置を特定する洗練段階が続く。この綿密なプロセスにより、2段階検出器は様々なコンピュータビジョンタスクにおいて最先端の精度を達成することができる。

二段式検出器の仕組み

2段階検出器の動作は、主に2つの段階に分けることができる:

  • 領域の提案:最初の段階では、アーキテクチャは、オブジェクトを含む可能性が高い候補バウンディングボックスのセットを生成する。これは多くの場合、選択的探索や領域提案ネットワーク(RPN)のようなアルゴリズムを使って実現される。これらの方法は効率的に画像をスキャンし、さらに調べる価値のある領域を提案する。
  • オブジェクトの分類とローカライズ:第二段階は、第一段階からの提案を改良する。各提案領域は、その中のオブジェクトを分類し、より正確なローカライゼーションのためにバウンディングボックスを調整するために、畳み込みニューラルネットワーク(CNN)に通される。このステージでは、提案された領域に計算資源を集中させることで、より正確な分類とバウンディングボックスの回帰につながる。

この2段階のプロセスによって、モデルは潜在的な物体を識別し、それらを正確に分類して位置を特定するためにリソースを割くことができ、精度の高さに貢献している。

メリットとデメリット

二段階検出器には、主に検出精度の点でいくつかの利点がある。領域提案と物体分類に別々のステージを割くことで、これらのモデルはより詳細なレベルとコンテキスト認識を達成することができる。しかし、この精度はトレードオフを伴う:

利点がある:

  • 高精度:2段階のプロセスにより、特に重なり合う物体や小さな物体が存在するシナリオにおいて、より正確な物体検出が可能となる。
  • 正確な位置決め:精密化ステージでは、検出されたオブジェクトの周囲に、より正確なバウンディングボックスを配置することができます。
  • 複雑なシーンに効果的:第2段階での詳細な分析により、複雑なシーンやオクルージョンをよりうまく処理できる。

デメリット

  • 推論速度の低下:2段検出の逐次的な性質により、1段検出に比べて速度が低下する。
  • 計算強度:領域プロポーザルを処理し、それらを分類する必要があるため、2段階検出器は計算コストが高くなる。
  • 複雑さ:アーキテクチャとトレーニングのプロセスは、1段階の代替案よりも複雑になる可能性がある。

実世界での応用

その計算負荷にもかかわらず、2段検出器の高い精度は、精度が最も重要なアプリケーションにおいて非常に貴重なものとなっている:

  • 医用画像解析: 医療画像解析では、腫瘍などの異常を正確に検出することが重要です。二段検出器は、医療スキャンにおける微妙な異常を正確に見つけ、分類する能力により採用され、診断や治療計画に役立っている。例えば、Ultralytics YOLO11 in medical imagingのアプリケーションで紹介されているように、脳MRIスキャンにおける腫瘍の検出に使用することができる。
  • 自律走行: 自動運転技術にはリアルタイム処理が欠かせませんが、歩行者や交通標識の検知のような特定の側面では、2段階検知器の高い精度が役立ちます。例えば、様々な状況下で歩行者を正確に識別することは安全にとって不可欠であり、2段階検出器は混雑した状況や視界の悪い状況でも信頼性の高い検出を提供することでこれに貢献します。

段検出器との比較

2段式物体検出器と1段式物体検出器の主な違いは、物体検出のアプローチにある。のような1ステージ検出器は、オブジェクトの定位と分類を1回のパスで行うことにより、プロセスを効率化する。 Ultralytics YOLOのような1ステージ検出器では、オブジェクトのローカライズと分類を1回のパスで実行することで、プロセスを効率化します。そのため、リアルタイム・アプリケーションに理想的な高速化を実現している。しかし、Faster R-CNNやMask R-CNNのような2段階検出器は、先に述べたように、これらのタスクを別々の段階に分けることで、より高い精度を達成する。

1段式ディテクタと2段式ディテクタのどちらを選択するかは、速度の必要性と精度の必要性のバランスを取る必要があります。リアルタイムのビデオ監視や自律航法など、迅速な検出が必要なアプリケーションでは、1ステージディテクタが好まれることが多い。一方、医療診断や詳細な画像解析のような精度が最優先されるアプリケーションでは、2ステージ・ディテクタが好まれます。

すべて読む