用語集

アンカーベースの検出器

アンカーベースのディテクタが、正確なローカライゼーション、スケール適応性、実世界でのアプリケーションにより、物体検出にどのような革命をもたらすかをご覧ください。

アンカーに基づく検出器は、コンピュータビジョンにおける 物体検出モデルの基礎的なクラスである。これらのモデルは、アンカーボックスとして知られる、あらかじめ定義されたボックスのセットを用いて動作し、画像内のオブジェクトを識別し、位置を特定する。アンカーボックスは基本的に、画像全体にタイル状に配置された様々なサイズと縦横比を持つテンプレートのグリッドである。モデルは、オブジェクトの存在を示す信頼度スコアとともに、オブジェクトのグランドトゥルースのバウンディングボックスに一致するように、これらのアンカーをどのようにシフトし、スケーリングするかを予測する。このアプローチは、物体を見つける問題を、これらの固定アンカーに対する回帰と分類のタスクに変えることによって単純化する。

アンカーベースのアーキテクチャの顕著な例としては、Faster R-CNNのようなR-CNNファミリー、SSD(Single Shot MultiBox Detector)のような初期のシングルステージ検出器、大成功を収めたUltralytics YOLOv5を含む多くのYOLOモデルなどがある。

アンカー型探知機の仕組み

アンカー・ベースの検出の核となる考え方は、事前に定義された参照ボックスのセットを出発点として使用することである。モデルの学習過程において、検出器は各アンカーボックスに対して2つの主要なタスクを実行することを学習する:

  1. 分類:アンカーボックスが対象物を含むか、単なる背景かを判断する。
  2. 回帰:検出されたオブジェクトをしっかりと囲むようにアンカーボックスを調整するために必要な正確なオフセット(x、y、幅、高さ)を計算します。

これらの予測は、バックボーンによって抽出された画像特徴を処理した後、モデルの検出ヘッドによって行われる。1つの物体が複数のアンカーボックスで検出されることがあるため、非最大抑制(NMS)と呼ばれる後処理ステップを使用して、冗長な検出をフィルタリングし、最も適合するボックスのみを保持します。これらのモデルの性能は、平均平均精度(mAP)やIntersection over Union(IoU)などのメトリクスを用いて評価されることが多い。

アンカーベースのディテクターとアンカーフリーのディテクターの比較

近年、アンカーを使わない検出器が、よく使われる代替手段として台頭してきた。アンカーベースのモデルとは異なり、アンカーフリーのアプローチは物体の位置や大きさを直接予測する。多くの場合、キーポイント(物体の中心や角など)を特定したり、点から物体の境界までの距離を予測したりすることで、あらかじめ定義されたアンカー形状を必要としない。

主な違いは以下の通り:

  • 複雑さ:アンカーベースのモデルは、アンカーパラメータ(サイズ、比率、スケール)の慎重な設計とチューニングを必要とし、データセットに依存する可能性がある。アンカーを使わないモデルは、検出ヘッドの設計を単純化する。
  • 柔軟性:アンカーを使わない方法は、固定されたアンカーセットではうまく表現できないような、特殊な縦横比や形状のオブジェクトにも適応できる可能性がある。
  • 効率:アンカーを排除することで、モデルが行う必要のある予測数を減らすことができ、推論の高速化や後処理の簡素化につながる可能性がある。

YOLOv4のようなアンカーベースの検出器は大きな成功を収めましたが、Ultralytics YOLO11を含む多くの最新のアーキテクチャは、シンプルさと効率性の利点を活用するために、アンカーフリーの設計を採用しています。YOLO11のアンカーなし検出の利点を探り、異なるYOLOモデル間の比較を見ることができます。

実世界での応用

アンカーベースの検出器は、対象物の形状やサイズが比較的標準的な様々なアプリケーションで広く使用されています。

  • 自律走行自動車産業向けのソリューションでは、これらの検出器は車両、歩行者、交通標識を識別するのに優れています。これらの物体の予測可能な形状は、事前に定義されたアンカーとうまく整列するため、NVIDIAや テスラのような企業にとって信頼性の高い検出が可能になります。
  • リテール・アナリティクスAIを活用した在庫管理では、アンカーベースのモデルが効率的に棚をスキャンして商品を数えることができる。パッケージ商品はサイズや形状が均一であるため、このアプローチに最適で、在庫監視の自動化に役立ちます。
  • セキュリティと監視:固定された監視カメラの映像から人物や車両を特定することも、強力なユースケースです。これは、Ultralyticsセキュリティアラームシステムガイドのようなアプリケーションの基礎となるものです。

ツールとトレーニング

アンカーベースであれアンカーフリーであれ、物体検出モデルの開発とデプロイには、PyTorchや TensorFlowのようなフレームワークとOpenCVのようなライブラリが必要です。Ultralytics HUBのようなプラットフォームは、カスタムモデルのトレーニング、データセットの管理、ソリューションのデプロイのための合理化されたワークフローを提供し、様々なモデルアーキテクチャをサポートします。さらに学習するには、Papers With Codeのようなリソースが最先端のモデルをリストアップし、DeepLearning.AIのようなプラットフォームからのコースが基礎概念をカバーしています。

Ultralyticsコミュニティに参加する

AIの未来に参加しませんか。世界のイノベーターとつながり、協力し、成長する

今すぐ参加する
クリップボードにコピーされたリンク