Glossar

Nicht-Maximum-Unterdrückung (NMS)

Entdecke die Non-Maximum Suppression (NMS) für die Objekterkennung. Erfahre, wie sie die Ergebnisse verfeinert, die Genauigkeit erhöht und KI-Anwendungen wie YOLO unterstützt.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Non-Maximum Suppression (NMS) ist eine wichtige Nachbearbeitungstechnik in der Computer Vision, insbesondere bei der Objekterkennung. Ihre Hauptaufgabe besteht darin, die Rohdaten von Erkennungsmodellen zu bereinigen, die oft mehrere überlappende Bounding Boxes für dasselbe Objekt identifizieren. Durch intelligentes Filtern dieser redundanten Boxen stellt NMS sicher, dass jedes einzelne Objekt in einem Bild oder Videobild durch eine einzige, optimale Bounding Box dargestellt wird, was die Klarheit und Genauigkeit der Erkennungsergebnisse erheblich verbessert.

So funktioniert die Nicht-Maximum-Unterdrückung

Modelle zur Objekterkennung erzeugen in der Regel zahlreiche potenzielle Bounding Boxes um Objekte, die jeweils mit einem Konfidenzwert versehen sind, der die Wahrscheinlichkeit angibt, dass die Box ein Objekt enthält und zu einer bestimmten Klasse gehört. NMS reduziert diese Vorschläge systematisch auf der Grundlage ihrer Konfidenzwerte und räumlichen Überlappung. In der Regel werden dabei alle erkannten Kästchen nach ihrem Konfidenzwert in absteigender Reihenfolge sortiert. Das Kästchen mit dem höchsten Konfidenzwert wird als endgültige Erkennung ausgewählt. Dann werden alle anderen Kästchen, die sich mit diesem ausgewählten Kästchen signifikant überschneiden (über einem vordefinierten Schwellenwert für Intersection over Union (IoU) ), unterdrückt oder aussortiert. Dieses Verfahren wird iterativ mit den verbleibenden Kästchen wiederholt, bis alle Kästchen entweder ausgewählt oder unterdrückt worden sind. Auf diese Weise wird sichergestellt, dass nur die sichersten, sich nicht überschneidenden Boxen übrig bleiben, was zu einer saubereren Ausgabe führt, wie in Ressourcen wie Learn OpenCV's NMS explanation erklärt wird.

Bedeutung für KI und maschinelles Lernen

In der Künstlichen Intelligenz(KI) und im Maschinellen Lernen(ML) ist NMS entscheidend für eine zuverlässige Objekterkennungsleistung, insbesondere bei Modellen wie Ultralytics YOLO. Ohne NMS wäre die Ausgabe mit mehreren Kästchen für einzelne Objekte überladen, was zu potenziellen Fehlern bei nachgelagerten Aufgaben wie der Objektverfolgung oder dem Szenenverständnis führen würde. Durch die Eliminierung dieser überflüssigen Erkennungen (oft als "False Positives" bezeichnet) verbessert NMS die Genauigkeit der Vorhersagen des Modells erheblich. Diese Verfeinerung ist entscheidend für Anwendungen, die eine hohe Zuverlässigkeit erfordern. Wie Kennzahlen wie die mittlere Genauigkeit (Mean Average Precision, mAP) nach NMS berechnet werden, erfährst du im YOLO Performance Metrics Guide.

Anwendungen in der realen Welt

NMS ist grundlegend für viele praktische KI-Anwendungen:

  • Autonome Fahrzeuge: In selbstfahrenden Autos hilft NMS sicherzustellen, dass Fußgänger, andere Fahrzeuge und Verkehrszeichen genau und eindeutig erkannt werden, was für eine sichere Navigation und Entscheidungsfindung entscheidend ist. Redundante Erkennungen könnten das Fahrsystem verwirren, wie in den Diskussionen über KI in autonomen Fahrzeugen beschrieben.
  • Medizinische Bildanalyse: Bei der Analyse von Röntgen- oder MRT-Aufnahmen auf Anomalien wie Tumore können Objekterkennungsmodelle zunächst mehrere sich überschneidende Bereiche für ein einziges potenzielles Problem markieren. NMS filtert diese, um den wahrscheinlichsten Bereich herauszufiltern, und unterstützt so Radiologen bei der Diagnose - ein wichtiger Bestandteil der KI im Gesundheitswesen. Mehr zu diesem Thema findest du in den Ressourcen der Radiological Society of North America (RSNA).

Vergleich mit verwandten Techniken

NMS ist ein Nachbearbeitungsschritt, der angewendet wird, nachdem ein Modell erste Erkennungen erzeugt hat. Er unterscheidet sich von den eigentlichen Erkennungsmechanismen, wie sie z. B. von ankerbasierten oder ankerfreien Erkennern verwendet werden. Während diese Architekturen festlegen, wie Kandidatenboxen vorgeschlagen werden, verfeinert die NMS diese Vorschläge. Interessanterweise haben die jüngsten Fortschritte zu Modellen geführt, die auf eine NMS-freie Erkennung abzielen, wie z. B. YOLOv10, das Mechanismen zur Vermeidung redundanter Vorhersagen während des Trainings integriert, was die Latenzzeit für die Schlussfolgerungen verringern kann. Dies steht im Gegensatz zu traditionellen Ansätzen wie YOLOv8 oder YOLOv5 wo NMS ein Standardbestandteil der Inferenzpipeline ist. Weitere Vergleiche zwischen Modellen wie YOLO11 und YOLOv10 findest du in unserer Dokumentation.

Integration mit Ultralytics Tools

NMS ist nahtlos in das Ultralytics Ökosystem integriert. Ultralytics YOLO wenden NMS standardmäßig während der Vorhersage- und Validierungsphasen an, um saubere und genaue Ergebnisse zu gewährleisten. Tools wie Ultralytics HUB vereinfachen den Prozess weiter und ermöglichen es den Nutzern, Modelle zu trainieren und einzusetzen, bei denen NMS automatisch angewendet wird. Die zugrundeliegenden Implementierungsdetails können in der Ultralytics nachgelesen werden. Diese Integration stellt sicher, dass die Nutzer/innen von optimierten Erkennungsergebnissen für verschiedene Computer Vision Aufgaben profitieren. Du kannst auch andere KI-Konzepte im Ultralytics erkunden.

Alles lesen