Glossar

Nicht-Maximum-Unterdrückung (NMS)

Entdecken Sie Non-Maximum Suppression (NMS) für die Objekterkennung. Erfahren Sie, wie es die Ergebnisse verfeinert, die Genauigkeit erhöht und KI-Anwendungen wie YOLO unterstützt.

Non-Maximum Suppression (NMS) ist ein grundlegender Nachbearbeitungsalgorithmus, der in der Computer Vision verwendet wird, insbesondere bei Aufgaben der Objekterkennung. Sein Hauptzweck besteht darin, die Ausgabe eines Erkennungsmodells zu bereinigen, indem redundante und sich überschneidende Bounding Boxes herausgefiltert werden, um sicherzustellen, dass jedes Objekt nur einmal erkannt wird. Wenn ein Objekterkennungsmodell, wie z. B. Ultralytics YOLO, Vorhersagen macht, erzeugt es oft mehrere Kandidatenboxen um dasselbe Objekt, jede mit einem anderen Konfidenzwert. NMS wählt auf intelligente Weise die beste Bounding Box für jedes Objekt aus und unterdrückt bzw. eliminiert alle anderen überlappenden Boxen, die als nicht optimal angesehen werden.

So funktioniert die Nicht-Maximum-Unterdrückung

Der NMS-Algorithmus arbeitet, indem er die vorhergesagten Bounding Boxes iterativ durchläuft und Entscheidungen auf der Grundlage von zwei Schlüsselmetriken trifft: Konfidenzwerte und der Schwellenwert für Intersection over Union (IoU). Der Prozess lässt sich in diesen Schritten zusammenfassen:

  1. Nach Konfidenz sortieren: Alle vorhergesagten Boundingboxen werden zunächst in absteigender Reihenfolge nach ihrer Vertrauensbewertung sortiert. Die Box mit der höchsten Punktzahl wird als die wahrscheinlichste angesehen.
  2. Wählen Sie die beste Box: Die Bounding Box mit dem höchsten Konfidenzwert wird ausgewählt, und alle anderen Boxen, die einen hohen IoU-Wert mit dieser ausgewählten Box haben (d. h. sie überschneiden sich erheblich), werden aus der Liste entfernt.
  3. Wiederholen: Der Vorgang wird mit den verbleibenden Begrenzungsrahmen wiederholt, bis alle Rahmen entweder ausgewählt oder unterdrückt wurden.

Der IoU-Schwellenwert ist ein kritischer, benutzerdefinierter Hyperparameter. Ein niedriger IoU-Schwellenwert führt zu weniger Erkennungen, da er Boxen unterdrückt, die sich auch nur geringfügig überlappen, während ein hoher Schwellenwert möglicherweise mehrere Erkennungen für dasselbe Objekt zulässt. Die Feinabstimmung dieses Schwellenwerts ist oft Teil der Optimierung der Leistung eines Modells für einen bestimmten Datensatz.

Anwendungen der Nicht-Maximum-Unterdrückung

NMS ist eine entscheidende Komponente in vielen realen KI-Anwendungen, die auf eine genaue Objekterkennung angewiesen sind.

  • Autonome Fahrzeuge: In selbstfahrenden Autos müssen Objekterkennungssysteme Fußgänger, Radfahrer und andere Fahrzeuge anhand verschiedener Kamera- und LiDAR-Daten genau identifizieren. NMS stellt sicher, dass ein einzelner Fußgänger nicht als mehrere Personen erkannt wird, und liefert so einen sauberen Input für die Wegplanungs- und Entscheidungssysteme des Fahrzeugs. Dadurch wird unberechenbares Verhalten, wie z. B. unnötiges Bremsen aufgrund redundanter Erkennungen, verhindert. Weitere Einzelheiten finden Sie in der Forschung zur 3D-Objekterkennung für autonomes Fahren.
  • Medizinische Bildgebung: In der medizinischen Bildanalyse wird NMS eingesetzt, um die Erkennung von Anomalien wie Tumoren oder Läsionen in CT- oder MRT-Scans zu verfeinern. Wenn beispielsweise ein Modell wie YOLO11 zur Erkennung von Tumoren verwendet wird, hilft NMS sicherzustellen, dass ein einzelner Tumor mit einer Bounding Box lokalisiert wird, was die Genauigkeit von Diagnosen und Behandlungsplanungen verbessert, wie sie in der medizinischen Bildgebungsforschung untersucht werden.

Vergleich mit verwandten Techniken

NMS ist speziell ein Nachbearbeitungsschritt, der angewendet wird , nachdem ein Objekterkennungsmodell seine anfängliche Menge von Kandidaten-Bounding-Boxen erzeugt hat. Er ist nicht zu verwechseln mit der Erkennungsarchitektur selbst, z. B. dem Unterschied zwischen ankerbasierten und ankerfreien Erkennungsmodellen. Diese Architekturen legen fest, wie potenzielle Boxen vorgeschlagen werden, während NMS diese Vorschläge verfeinert.

Interessanterweise haben die mit NMS verbundenen Rechenkosten und potenziellen Engpässe die Forschung zu NMS-freien Objekterkennern vorangetrieben. Modelle wie YOLOv10 integrieren Mechanismen während des Trainings, um von vornherein die Vorhersage redundanter Boxen zu vermeiden, und zielen darauf ab, die Inferenzlatenz zu reduzieren und eine wirklich durchgängige Erkennung zu ermöglichen. Dies steht im Gegensatz zu traditionellen Ansätzen wie Ultralytics YOLOv8 oder YOLOv5, bei denen NMS ein standardmäßiger und wesentlicher Bestandteil der Inferenzpipeline bleibt. Technische Vergleiche, wie YOLOv10 vs. YOLOv8, können Sie in unserer Dokumentation nachlesen. Varianten wie Soft-NMS bieten alternative Ansätze, die die Werte überlappender Boxen abbauen, anstatt sie vollständig zu eliminieren.

Integration mit Ultralytics-Tools

NMS ist nahtlos in das Ultralytics-Ökosystem integriert. Ultralytics YOLO-Modelle wenden NMS automatisch während der Vorhersage (predict) und Validierung (val) Modi, so dass die Benutzer standardmäßig saubere und genaue Erkennungsergebnisse erhalten. Die Parameter, die das Verhalten des NMS steuern (wie der IoU-Schwellenwert und der Konfidenzschwellenwert), können häufig auf die spezifischen Anforderungen der Anwendung abgestimmt werden.

Plattformen wie Ultralytics HUB abstrahieren diese Details weiter und ermöglichen es den Benutzern, Modelle zu trainieren und einzusetzen, wobei NMS automatisch als Teil der optimierten Pipeline behandelt wird. Durch diese Integration wird sichergestellt, dass die Benutzer unabhängig von ihren tiefgreifenden technischen Kenntnissen in MLOps von den modernsten Objekterkennungsergebnissen für verschiedene Computer-Vision-Aufgaben profitieren können. Die spezifischen Implementierungsdetails innerhalb des Ultralytics-Rahmens können in der Ultralytics-Utilities-Referenz nachgelesen werden. Weitere Definitionen finden Sie im Ultralytics-Hauptglossar.

Werden Sie Mitglied der Ultralytics-Gemeinschaft

Beteiligen Sie sich an der Zukunft der KI. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert