物体検出のための非最大抑制(NMS)をご覧ください。NMSがどのように結果を洗練させ、精度を高め、YOLO のようなAIアプリケーションを強化するかをご覧ください。
非最大抑制(NMS)は、コンピュータビジョン、特に物体検出パイプラインで使用される重要な後処理技術である。NMSの主な機能は、検出モデルからの生の出力をクリーンアップすることであり、同じオブジェクトに対して複数のオーバーラップするバウンディングボックスを識別することがよくあります。これらの冗長なボックスをインテリジェントにフィルタリングすることで、NMSは、画像やビデオフレーム内の各特異なオブジェクトが単一の最適なバウンディングボックスで表現されるようにし、検出結果の明瞭性と精度を大幅に向上させます。
物体検出モデルは通常、物体の周囲に多数の境界ボックスの候補を生成し、それぞれに、ボックスが物体を含み、特定のクラスに属する可能性を示す関連する信頼度スコアを付ける。NMSは、信頼度スコアと空間的重複に基づいて、これらの提案を体系的に削減することで動作する。このプロセスでは一般に、検出されたすべてのボックスを信頼度スコアで降順にソートする。信頼スコアが最も高いボックスが最終的な検出として選択される。次に、この選択されたボックスと有意に重複する(事前に定義されたIntersection over Union (IoU)の閾値以上)他のすべてのボックスが抑制または破棄される。この手順は、すべてのボックスが選択または抑制されるまで、残りのボックスで繰り返し行われる。これにより、最も確実で、重ならないボックスだけが残り、Learn OpenCVのNMSの説明などのリソースで説明されているように、よりクリーンな出力が得られます。
人工知能(AI)や機械学習(ML)において、NMSは、特にUltralytics YOLOようなモデルで、信頼性の高い物体検出性能を達成するために不可欠です。NMSがなければ、出力は1つのオブジェクトに対して複数のボックスで乱雑になり、オブジェクト追跡やシーン理解などの下流のタスクで潜在的なエラーにつながります。このような冗長な検出(しばしば偽陽性と呼ばれる)を排除することで、NMSはモデルの予測精度を大幅に向上させます。この精度の向上は、高い信頼性が要求されるアプリケーションにとって極めて重要です。平均平均精度(mAP)のようなメトリクスがNMS後にどのように計算されるかは、YOLO パフォーマンス・メトリクス・ガイドで調べることができます。
NMSは多くの実用的なAIアプリケーションの基本である:
NMSは、モデルが最初の検出を生成した後に適用される後処理ステップである。NMSは、アンカーベースの検出器や アンカーフリーの検出器のような、検出メカニズムそのものとは異なる。これらのアーキテクチャは、候補となるボックスがどのように提案されるかを定義するのに対し、NMSはこれらの提案を洗練させる。興味深いことに、最近の進歩により、YOLOv10のようなNMSフリーの検出を目指すモデルが登場しており、これは学習中の冗長な予測を回避するメカニズムを統合し、推論の待ち時間を短縮する可能性がある。これは YOLOv8や YOLOv5のような従来のアプローチとは対照的である。YOLO11 YOLOv10のようなモデルの比較については、我々のドキュメントを参照してほしい。
NMSはUltralytics エコシステム内にシームレスに統合されています。Ultralytics YOLO モデルは、予測と検証の段階でデフォルトでNMSを適用し、クリーンで正確な出力を保証します。Ultralytics HUBのようなツールはさらにプロセスを簡素化し、NMSが自動的に処理されるモデルのトレーニングとデプロイを可能にします。基本的な実装の詳細については、Ultralytics ユーティリティリファレンスを参照してください。この統合により、ユーザーは様々なコンピュータビジョンタスクですぐに最適化された検出結果を得ることができます。また、Ultralytics 用語集では、その他のAI概念についても調べることができます。