アンカーベースの検出器は、画像内のオブジェクトの位置とカテゴリを予測するために、事前定義されたボックス(アンカー)を使用するコンピュータビジョンにおけるオブジェクト検出モデルのカテゴリです。これらのアンカーは、潜在的なオブジェクトの提案を生成するための参照として機能する。アンカーは様々なスケールやアスペクト比の物体を扱う上で不可欠であり、多くの一般的な物体検出アーキテクチャで広く使われている。
アンカー型探知機の仕組み
アンカー・ベースのディテクターは、オブジェクトを正確に検出するために、これらのアンカー・ボックスの位置を分類し、改良する。アンカーボックスは、異なるスケールとアスペクト比のグリッドを使用し、画像上をスライドすることで動作する。各ボックスは、オブジェクトによりフィットするように学習過程で調整され、明確なクラススコアを持つバウンディングボックスに変化する。
注目モデル
- より高速なR-CNN:このアーキテクチャは領域提案を使用し、その精度で有名である。物体提案を生成する領域提案ネットワーク(RPN)で構成され、2段階のフレームワークを含む。
- レティナネット フォーカルロスの使用で知られるRetinaNetは、クラスの不均衡に対処しながら、高い精度と効率を維持する1段検出器です。
- Ultralytics YOLOv8:このモデルは、アンカーベースの手法を統合しながら、卓越したリアルタイム検出能力をさらに強化しています。詳しくは YOLOv8.
AIとMLの応用
アンカーベースの検出器は、その堅牢性と適応性により、さまざまな産業で広く応用されている:
- 自律走行車:歩行者、車両、障害物をリアルタイムで認識し、交通安全を高める。
- ヘルスケア:医療用画像処理で、スキャン内の異常や病気を検出するために使用される。ヘルスケアにおけるAIの詳細をご覧ください。
- 農業:精密農業で作物を識別し、成長を監視するために使用されます。農業におけるAIについて学ぶ。
特徴
- アンカーフリー検出器との比較:CenterNetのようなアンカーフリーのモデルは、事前に定義されたアンカーなしでオブジェクトの中心や寸法を予測することで、異なるアプローチを提案します。どちらの手法も有効ですが、画像内の多様なオブジェクトのスケールを扱うには、アンカーベースのモデルが好まれることが多いです。
実例
- 製造業アンカーベースの検出器は、製品の欠陥を検出することで品質管理を合理化し、高水準を保証します。
- 小売:在庫管理に使用し、高度な物体検出ストラテジーを使用して棚にある在庫商品を識別します。
関連リンク
アンカーベースの検出器は、オブジェクトの検出、追跡、および処理にニュアンスに富んだ洞察を提供し、実世界のアプリケーションでAI機能を向上させるために不可欠な存在であり続けています。Ultralytics HUBを使って、Ultralytics がどのようにこのようなテクノロジーを簡単に展開できるかをご覧ください。