用語集

アンカーベースの検出器

アンカーベースのディテクタが、正確なローカライゼーション、スケール適応性、実世界でのアプリケーションにより、物体検出にどのような革命をもたらすかをご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

アンカーベースの検出器は、物体検出を行うためのコンピュータビジョン(CV)の基礎的なアプローチである。これらのモデルは、「アンカー」または「プリオール」として知られる、特定のサイズとアスペクト比を持つ、事前に定義された参照ボックスのセットに依存しています。これらのアンカーは画像全体の出発点またはテンプレートとして機能し、モデルが潜在的な物体の位置とクラスをより効果的に予測するのに役立ちます。以前に成功した多くの物体検出アーキテクチャは、この方法を利用していた。

アンカー型探知機の仕組み

アンカー・ベースの検出器の核となる考え方は、入力画像全体の様々な位置に、高密度のグリッドのアンカー・ボックスを配置することである。各アンカーボックスは、あらかじめ定義されたスケールとアスペクト比を持つ物体候補を表す。学習プロセスにおいて、モデルは各アンカーについて主に2つのことを学習する。1つ目は、アンカーに関連するオブジェクトが含まれているかどうか(分類)、2つ目は、実際のオブジェクトのバウンディングボックスにぴったり合うようにアンカーの位置と寸法を調整する方法(回帰)である。

大きな駐車場の画像からさまざまな車両を検索することを想像してみてください。ピクセル単位でスキャンするのではなく、あらかじめ定義された長方形のテンプレート(アンカー)を使う。縦長の小さなものはオートバイ用、中くらいの四角いものは自動車用、横長の大きなものはバス用だ。これらのテンプレートを画像全体に重ね合わせる。テンプレートが車と大きく重なると、モデルは「はい、これは車です」と確認するように学習し、車の境界線に完全に一致するようにテンプレートを少しずらしたり、サイズを変更したりします。背景をほとんど覆っているアンカーは、そのように分類される。この方法は、あらかじめ定義された形状に導かれながら、可能性を体系的にカバーする。性能はしばしば、Intersection over Union (IoU)mean Average Precision (mAP)のようなメトリクスを用いて測定される。

主な特徴と利点

アンカーベースの検出器は、しばしば畳み込みニューラルネットワーク(CNN)をベースに構築されるが、いくつかの特筆すべき特徴がある:

  • スケールとアスペクト比の変化に対応:事前に定義されたアンカーは、異なるオブジェクトのサイズと形状を明示的にカバーし、検出のロバスト性を向上させます。
  • 構造化された提案生成:アンカーは、画像全体でオブジェクトのプロポーザルを生成する構造化された方法を提供し、以前のいくつかの方法と比較して検出の初期段階を簡素化します。
  • 実証された性能: Faster R-CNNや SSD(Single Shot MultiBox Detector)のようなアーキテクチャは、様々なベンチマークデータセットで強力なパフォーマンスを実証しました。

アンカーベースのディテクターとアンカーフリーのディテクターの比較

物体検出における重要な発展は、アンカーを使わない検出器の台頭である。アンカーベースのモデル(YOLOv4など)とは異なり、アンカーフリーの手法は、多くの場合、キーとなる点(角や中心など)を特定したり、点から物体境界までの距離を予測したりすることで、事前に定義されたアンカー形状に依存することなく、物体の位置や大きさを直接予測する。

主な違いは以下の通り:

  • 複雑さ:アンカー・ベースの手法は、アンカー・パラメーター(スケール、比率、密度)の慎重な設計とチューニングを必要とするが、これは複雑でデータセットに依存する可能性がある。アンカーを使わない手法では、このチューニングのステップが不要になります。
  • 柔軟性:アンカーフリーの検出器は、固定されたアンカーセットではうまく表現できないような特殊なアスペクト比や大きさの物体にも適応できる可能性がある。
  • 効率:アンカー生成とマッチングのステップを削除することで、よりシンプルで高速なモデルを実現できる場合がある。

のような最新モデル Ultralytics YOLO11のような最新のモデルは、アンカーフリーのアプローチを利用し、その効率性とシンプルさの利点を活用している。 YOLO11アンカーなし検出の利点については、こちらをご覧ください。

実世界での応用

アンカーを使用しない方法へのトレンドにもかかわらず、アンカーを使用した検出器は多くのアプリケーションで成功を収めている:

  1. 自律走行:車両、歩行者、自転車、交通標識を検出することは、自動運転車にとって極めて重要である。アンカーベースのモデルは、様々な距離や視点にわたってこれらの物体を確実に識別するために広く使用されている。自動運転車と関連する自律走行 研究におけるAIの詳細を読む。
  2. リテール・アナリティクス在庫レベルの棚を監視したり、置き忘れた商品を検出したり、顧客の通行パターンを分析したりするには、多くの場合、多数の小さな物体(商品)を識別する必要があります。アンカーベースのシステムは、小売環境で見られる特定のスケールと縦横比を処理するように構成できます。よりスマートな小売在庫管理と一般的な小売分析のトレンドを AIがどのようにサポートしているかをご覧ください。

アンカーフリーの手法が人気を集める一方で、アンカーベースの検出器を理解することは、物体検出の進化や、特定のコンテキストやレガシーシステムにおける継続的な関連性を理解するために不可欠である。以下のようなツールがある。 PyTorchTensorFlowのようなツールは、アンカーベースとアンカーフリーの両方のモデル開発をサポートし、Ultralytics HUBのようなプラットフォームは、最新の検出器のトレーニングとデプロイメントを効率化します。

すべて読む