Glossar

Nicht-Maximum-Unterdrückung (NMS)

Entdecke die Non-Maximum Suppression (NMS) für die Objekterkennung. Erfahre, wie sie die Ergebnisse verfeinert, die Genauigkeit erhöht und KI-Anwendungen wie YOLO unterstützt.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Non-Maximum Suppression (NMS) ist ein wichtiger Nachbearbeitungsschritt bei vielen Computer Vision Aufgaben, insbesondere bei der Objekterkennung. Sie wird verwendet, um die Ergebnisse von Objekterkennungsmodellen zu verfeinern, indem überflüssige Bounding Boxes eliminiert werden und sichergestellt wird, dass jedes Objekt nur einmal erkannt wird. Dieser Prozess verbessert die Genauigkeit und Interpretierbarkeit der Erkennungsergebnisse erheblich und ist daher ein unverzichtbarer Bestandteil moderner Objekterkennungspipelines.

So funktioniert die Nicht-Maximum-Unterdrückung

Die Hauptfunktion von NMS besteht darin, überlappende Boundingboxen herauszufiltern, die dasselbe Objekt vorhersagen. Dies geschieht durch die Auswertung der Intersection over Union (IoU) zwischen den Bounding Boxes und der zugehörigen Konfidenzwerte. Der Prozess umfasst in der Regel die folgenden Schritte:

  1. Score Thresholding: Zunächst werden Bounding Boxes mit einem Konfidenzwert unter einem bestimmten Schwellenwert verworfen, da diese als Erkennungen mit geringer Konfidenz gelten.
  2. Sortierung nach Konfidenz: Die verbleibenden Boundingboxen werden in absteigender Reihenfolge nach ihrem Vertrauenswert sortiert.
  3. Iterative Auswahl und Unterdrückung: Das Begrenzungsrechteck mit dem höchsten Vertrauenswert wird als gültige Erkennung ausgewählt. Dann werden alle anderen Bounding Boxen, die eine erhebliche Überschneidung (IoU über einem vordefinierten Schwellenwert) mit der ausgewählten Box aufweisen, unterdrückt oder entfernt. Das liegt daran, dass diese Boxen wahrscheinlich dasselbe Objekt erkennen.
  4. Wiederholen: Die Schritte 2 und 3 werden so lange wiederholt, bis keine Boundingboxen mehr zu bearbeiten sind.

Dieser iterative Prozess stellt sicher, dass nur die sichersten und nicht redundanten Bounding Boxes beibehalten werden, was zu einer saubereren und genaueren Reihe von Objekterkennungen führt. Du kannst mehr darüber erfahren, wie NMS die Ergebnisse der Objekterkennung verfeinert und die Genauigkeit verbessert.

Bedeutung für KI und maschinelles Lernen

Im Bereich der künstlichen Intelligenz (KI) und des maschinellen Lernens (ML), insbesondere bei Modellen wie Ultralytics YOLO , spielt NMS eine entscheidende Rolle bei der Verbesserung der Genauigkeit der Objekterkennungsergebnisse. Ohne NMS erzeugen Modelle zur Objekterkennung möglicherweise mehrere Bounding Boxes für ein einziges Objekt, was vor allem in dichten Szenen zu falsch positiven Ergebnissen und Verwirrung führt. Durch die Beseitigung dieser überflüssigen Erkennungen stellt NMS sicher, dass die Ergebnisse des Modells präzise und genau sind, was für Anwendungen, die eine hohe Zuverlässigkeit erfordern, wie z. B. autonome Fahrzeuge und Sicherheitssysteme, unerlässlich ist. Ein tieferes Verständnis der Modellevaluation findest du unter YOLO Leistungsmetriken.

Anwendungen in der realen Welt

NMS ist ein wesentlicher Bestandteil zahlreicher Anwendungen in der Praxis, die auf eine genaue Objekterkennung angewiesen sind:

  • Autonomes Fahren: In selbstfahrenden Autos ist NMS entscheidend für die genaue Erkennung und Verfolgung von Fußgängern, Fahrzeugen und Verkehrszeichen. Es stellt sicher, dass das Wahrnehmungssystem des Fahrzeugs ein klares und eindeutiges Bild von der Umgebung liefert, um potenzielle Gefahren zu vermeiden. Erfahre mehr über die Rolle von Computer Vision in autonomen Fahrzeugen.
  • Bestandsmanagement im Einzelhandel: NMS wird auch im Einzelhandel für eine effiziente Bestandsverwaltung eingesetzt. Durch die genaue Erfassung und Zählung der Produkte in den Regalen hilft NMS dabei, optimale Lagerbestände zu halten, Unstimmigkeiten zu verringern und die betriebliche Effizienz zu verbessern. Dadurch wird die Verfügbarkeit der Produkte sichergestellt und die Kundenzufriedenheit erhöht.

Vergleich mit verwandten Techniken

NMS ist zwar eine Nachbearbeitungstechnik, aber es ist wichtig, sie von anderen Komponenten der Objekterkennungsarchitekturen zu unterscheiden. Ankerbasierte Detektoren und ankerlose Detektoren sind unterschiedliche Ansätze, um erste Objektvorschläge zu generieren. Ankerbasierte Methoden verwenden vordefinierte Bounding Boxes, während ankerfreie Methoden die Objektzentren direkt vorhersagen. Beide Arten von Detektoren verlassen sich oft auf NMS, um ihre endgültigen Ergebnisse zu verfeinern, indem sie überlappende Erkennungen entfernen.

Integration mit Ultralytics Tools

NMS ist nahtlos in die Modelle von Ultralytics YOLO integriert und verbessert deren Leistung und Benutzerfreundlichkeit. Plattformen wie Ultralytics HUB vereinfachen den Einsatz dieser Modelle und machen fortschrittliche Objekterkennung auch für Nutzer/innen ohne umfassende technische Kenntnisse zugänglich. Ultralytics HUB bietet eine no-code Umgebung zum Trainieren, Validieren und Einsetzen von YOLO Modellen, wobei NMS im Hintergrund arbeitet, um die Erkennungsergebnisse zu optimieren.

Zusammenfassend lässt sich sagen, dass die Non-Maximum Suppression eine grundlegende Technik zur Verfeinerung von Objekterkennungsergebnissen ist. Ihre Fähigkeit, redundante Erkennungen zu eliminieren, ist entscheidend für genaue und zuverlässige Ergebnisse in einer Vielzahl von KI-Anwendungen, von selbstfahrenden Autos bis hin zur Einzelhandelsautomatisierung, und ist eine Schlüsselkomponente in Modellen wie Ultralytics YOLO .

Alles lesen