用語集

ノンマキシマムサプレッション(NMS)

物体検出のための非最大抑制(NMS)をご覧ください。NMSがどのように結果を洗練させ、精度を高め、YOLO のようなAIアプリケーションを強化するかをご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

非最大抑制(NMS)は、コンピュータビジョン(CV)、特に物体検出パイプラインで広く使用されている重要な後処理技術である。NMSの主な役割は、検出モデルによって生成された生の出力を洗練させることであり、同じオブジェクトインスタンスに対して複数の重複するバウンディングボックスを識別することが多い。これらの冗長なボックスをインテリジェントにフィルタリングすることで、NMSは画像やビデオフレーム内の各特異なオブジェクトが単一の最適なバウンディングボックスで表現されるようにします。これにより、最終的な検出結果の明瞭性と精度が大幅に向上し、後続のタスクでより有用なものとなります。

非最大限の抑制の仕組み

様々な物体検出モデル Ultralytics YOLOなどの物体検出モデルは、通常画像をスキャンし、検出された物体の周囲に多数の境界ボックス候補を提案します。提案された各ボックスには信頼スコアがついており、そのボックスがオブジェクトを含み、特定のクラスに属するというモデルの確信度を示している。NMSは、信頼度スコアと空間的重複に基づいて、これらの提案を体系的に削減することによって動作します。

一般的には以下のような手順で行われる:

  1. すべての提案されたバウンディングボックスは、信頼度スコアに基づいて、通常は降順にソートされる。
  2. 最も信頼度の高いバウンディングボックスが決定的な検出として選択される。
  3. この選択されたボックスと有意なオーバーラップを持つ他のすべてのバウンディングボックスは、抑制または削除されます。重なりはIntersection over Union (IoU)という指標を使って測定され、IoUがあらかじめ定義されたしきい値(例えば0.5)を超えると抑制されます。このコアコンセプトの詳細な説明はPyImageSearch の NMS ガイドなどにあります。
  4. 残っている箱の中から次に得点の高い箱が選択され、重なっている箱は削除される。
  5. これは、すべてのボックスが最終検出として選択されるか、抑制されるまで続けられる。

これにより、多くのコンピュータ・ビジョンのチュートリアルで視覚化されているように、最も確実で重なり合わないボックスだけが残り、よりクリーンで解釈しやすい出力が得られる。

AIと機械学習における重要性

人工知能(AI)や機械学習(ML)の広い分野において、NMSは信頼性の高い物体検出性能を達成するための基本である。NMSなしには、次のような検出器の出力は得られません。 YOLO11のような検出器の出力は、1つの物体に対して複数のボックスが存在することになる。この冗長性は、物体の計数(物体計数ガイド)、物体追跡ロボット工学における複雑なシーン理解など、下流のアプリケーションでエラーを引き起こす可能性がある。

このような冗長な検出(しばしば偽陽性の原因となる)を排除することで、NMSはモデルの予測精度を大幅に向上させる。この改良は、高い信頼性と精度が要求されるアプリケーションにとって非常に重要です。NMSの影響は、YOLO Performance Metricsガイドに詳述されているように、通常NMSが適用された後に計算される平均平均精度(mAP)のような評価メトリクスに反映されます。

実世界での応用

NMSは、数多くの実用的なAIアプリケーションを可能にする基盤技術である:

関連技術との比較

NMSは特に、物体検出モデルが候補バウンディングボックスの初期セットを生成した後に適用される後処理ステップである。これは、アンカーベースの検出器と アンカーフリーの検出器の違いのような、検出アーキテクチャそのものと混同してはならない。これらのアーキテクチャは、候補となるボックスがどのように提案されるかを定義し、NMSはこれらの提案を洗練させる。

興味深いことに、NMSに関連する計算コストと潜在的なボトルネックは、NMSフリーの物体検出器の研究に拍車をかけている。YOLOv10のようなモデルは、冗長なボックスの予測を本質的に回避するために、(一貫性のあるデュアル割り当てのような)学習中のメカニズムを統合し、推論の待ち時間を短縮し、真にエンドツーエンドの検出を可能にすることを目指しています(YOLOv10 NMS-freeアプローチ)。これは Ultralytics YOLOv8YOLOv5のような従来のアプローチとは対照的で、NMSは推論パイプラインの標準的かつ不可欠な部分である。YOLOv10とYOLOv8ような技術的な比較は、我々のドキュメントで調べることができる。Soft-NMS(Soft-NMSに関する論文)のようなバリエーションは、オーバーラップするボックスのスコアを完全に除去するのではなく、減衰させる代替アプローチを提供します。

Ultralytics ツールとの統合

NMSはUltralytics エコシステムにシームレスに統合されています。Ultralytics YOLO モデルは、NMSを自動的に適用します。 予測predict) そして バリデーション(val) モードは、デフォルトでクリーンで正確な検知出力を確実にユーザーに提供する。NMSの動作を制御するパラメータ(IoUしきい値や信頼度しきい値など)は、特定のアプリケーションのニーズに合わせて調整できることが多い。

Ultralytics HUBのようなプラットフォームは、これらの詳細をさらに抽象化し、ユーザがモデルをトレーニング(クラウドトレーニングガイド)し、最適化されたパイプラインの一部としてNMSが自動的に処理される場所にデプロイすることを可能にします。この統合により、ユーザーはMLOpsの深い技術的専門知識の有無に関わらず、様々なコンピュータビジョンタスクのための最先端の物体検出結果の恩恵を受けることができる。Ultralytics フレームワーク内の具体的な実装の詳細については、Ultralytics ユーティリティリファレンスを参照してください。その他の定義については、Ultralytics 用語集をご覧ください。

すべて読む