用語集

アンカーフリーディテクター

精度、効率、適応性を向上させた合理的な物体検出で、実世界のアプリケーションに対応します。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

アンカーフリー検出器は、あらかじめ定義されたアンカーボックスに依存することなく、オブジェクトの位置を直接予測することでプロセスを簡素化する、オブジェクト検出における最新のアプローチである。様々なサイズやアスペクト比の定義済みボックスのセットを使って物体の位置を特定するアンカーベースの検出器とは異なり、アンカーフリーの手法は画像の特徴から中心点や角のキーポイントのような物体の特性を直接予測します。これにより、モデル設計がシンプルになり、学習時の計算オーバーヘッドが削減され、特にCOCOのようなデータセットによく見られる型破りな形状やスケールの物体に対する性能が向上します。

主要概念と方法論

アンカーなし検出器は通常、物体検出を畳み込みニューラルネットワーク(CNN)によって生成された特徴マップ内のキーポイント推定または中心予測問題として扱うことで動作する。予測値をアンカーボックスの密な集合にマッチさせる代わりに、これらのモデルは特定の位置のオブジェクト特性を直接回帰する。一般的なアプローチには以下が含まれる:

  • キーポイント・ベースの手法CornerNetのようなモデルは、各オブジェクトのコーナーキーポイントのペアを予測し、それらをグループ化してバウンディングボックスを形成する。
  • 中心ベースの手法CenterNetのようなモデルは、各オブジェクトの中心点をその寸法(幅と高さ)とともに予測する。
  • 高密度予測法FCOS (Fully Convolutional One-Stage Object Detection)のようなモデルは、FCN (Fully Convolutional Networks)を使ったセマンティックセグメンテーションと同様に、出力特徴マップの各位置について、オブジェクトの存在とバウンディングボックスの座標を直接予測する。

これらの方法は、アンカーベースのアプローチで必要とされる複雑なアンカー設計とマッチングロジックを排除する。

アンカーなし検出の利点

アンカーフリー検出器の主な利点は、そのシンプルさと柔軟性です。主な利点は以下の通りです:

  • ハイパーパラメータの削減:アンカーボックスがなくなることで、アンカースケール、比率、密度を設計、調整する必要がなくなり、トレーニングプロセスが簡素化されます。
  • 汎化性の向上:あらかじめ定義されたアンカーにうまく当てはまらない、多様な形や大きさのオブジェクトに対して、より優れた性能を発揮することが多い。
  • 潜在的な効率性:学習中にIntersection over Union (IoU)計算のようなアンカーに関連する計算を取り除くことで、アンカーフリーのモデルはより高速でメモリ効率に優れる場合がある。
  • 概念の単純さ:直接予測アプローチは、アンカーベースのパイプラインと比較して、より直感的で実装が容易である。

アンカーベースの検出器との比較

主な違いは、オブジェクトの定位提案の取り扱いにあります。YOLOv4のような古いモデルのような、アンカー・ベースの検出器は、画像全体に分布する定義済みのアンカー・ボックスのセットに大きく依存している。ネットワークはこれらのアンカーからのオフセットを予測し、アンカーが物体を含むかどうかを分類する。これには、データセットの統計に基づいた慎重なアンカー設定が必要である。

アンカーフリー検出器 Ultralytics YOLOのような YOLO11のような最近のUltraltics YOLOモデルを含むアンカーフリー検出器は、このステップをバイパスします。YOLO11のようなUltralticsのYOLOモデルは、このステップをバイパスし、グリッドセルやフィーチャーマップの位置に対してオブジェクトの位置やキーポイントを直接予測します。これにより、非最大抑制(NMS)のような後処理ステップがよりシンプルになり、不規則な形状の物体の検出精度を向上させることができます。アンカーフリー検出器であるUltralytics YOLO11 利点については、こちらをご覧ください。

実世界での応用

アンカーフリー検出器は、様々なコンピュータビジョンタスクにおいて有効である:

  • 自律走行:歩行者、自転車、様々な大きさや縦横比の車両を正確に検出することは、自律走行車の安全にとって極めて重要である。アンカーを使わない方法は、このような多様な対象物にうまく適応し、知覚の信頼性を向上させます。Computer Vision Foundationのようなリソースを探索し、研究の進歩に役立ててください。
  • 医療画像解析医用画像解析では、腫瘍や病変のような小さい、あるいは不規則な形状の異常の識別に、直接予測アプローチが役立ちます。腫瘍検出にYOLO11 使用した例などをご覧ください。

ツールとテクノロジー

アンカーフリー検出器の開発は、以下のような主要なディープラーニングフレームワークでサポートされています。 PyTorchTensorFlow.Ultralytics エコシステムは、アンカーフリー設計を活用したツールと事前学習済みモデルを提供します。Ultralytics ドキュメントで実装の詳細を調べたり、Ultralytics HUBを使用してモデルのトレーニングとデプロイを効率化することができます。Papers With Codeのようなリソースには、最先端のモデルが掲載されており、その多くはアンカーフリーです。基礎知識については、DeepLearning.AIのようなプラットフォームのコースをご検討ください。

すべて読む