Grüner Scheck
Link in die Zwischenablage kopiert

Die Vorteile von Ultralytics YOLO11 als ankerloser Detektor

Verstehe, wie Ultralytics YOLO11 die verankerungsfreie Objekterkennung unterstützt und welche Vorteile diese Modellarchitektur für verschiedene Anwendungen mit sich bringt.

Wenn wir einen Blick auf die Geschichte der KI-Modelle werfen, zeigt sich, dass es das Konzept der Objekterkennung - eine Kernaufgabe der Computer Vision, bei der es um die Identifizierung und Lokalisierung von Objekten in einem Bild oder Video geht - bereits seit den 1960er Jahren gibt. Der Hauptgrund für seine Bedeutung bei den heutigen Spitzeninnovationen ist jedoch, dass sich die Objekterkennungstechniken und Modellarchitekturen seither weiterentwickelt und schnell verbessert haben. 

In einem früheren Artikel haben wir die Entwicklung der Objekterkennung und den Weg zu den Ultralytics YOLO Modellen beschrieben. Heute konzentrieren wir uns auf einen speziellen Meilenstein auf diesem Weg: den Sprung von ankerbasierten Detektoren zu ankerfreien Detektoren. 

Ankerbasierte Detektoren verlassen sich auf vordefinierte Boxen, sogenannte "Anker", um vorherzusagen, wo sich Objekte in einem Bild befinden. Im Gegensatz dazu überspringen die ankerlosen Detektoren diese vordefinierten Boxen und sagen stattdessen die Objektpositionen direkt voraus.

Auch wenn diese Veränderung einfach und logisch erscheint, hat sie doch zu erheblichen Verbesserungen bei der Genauigkeit und Effizienz der Objekterkennung geführt. In diesem Artikel erfahren wir, wie ankerlose Detektoren die Computer Vision durch Fortschritte wie die folgenden verändert haben Ultralytics YOLO11.

Was sind ankerbasierte Detektoren?

Ankerbasierte Detektoren verwenden vordefinierte Boxen, die sogenannten Anker, um Objekte in einem Bild zu lokalisieren. Stell dir diese Anker als ein Raster aus Kästchen unterschiedlicher Größe und Form vor, das über das Bild gelegt wird. Das Modell passt diese Boxen dann an die erkannten Objekte an. Wenn das Modell zum Beispiel ein Auto erkennt, passt es die Ankerboxen an, um die Position und Größe des Autos genauer zu bestimmen.

Jeder Anker ist mit einem möglichen Objekt im Bild verknüpft, und während des Trainings lernt das Modell, wie es die Ankerboxen anpassen kann, um die Position, die Größe und das Seitenverhältnis des Objekts besser zu erfassen. So kann das Modell Objekte in verschiedenen Maßstäben und Ausrichtungen erkennen. Die Auswahl der richtigen Ankerboxen kann jedoch zeitaufwändig sein, und die Feinabstimmung kann fehleranfällig sein.

Abb. 1. Was ist eine Ankerbox?

Ankerbasierte Detektoren wie YOLOv4 haben sich zwar in vielen Anwendungen bewährt, aber sie haben auch einige Nachteile. Zum Beispiel passen die Ankerboxen nicht immer gut zu Objekten unterschiedlicher Form oder Größe, wodurch es für das Modell schwieriger wird, kleine oder unregelmäßig geformte Objekte zu erkennen. Die Auswahl und Feinabstimmung der Größe der Ankerboxen kann außerdem zeitaufwändig sein und erfordert viel manuellen Aufwand. Außerdem haben ankerbasierte Modelle oft Probleme mit der Erkennung von verdeckten oder überlappenden Objekten, da sich die vordefinierten Boxen nicht gut an diese komplexeren Szenarien anpassen lassen.

Die Umstellung auf ankerfreie Objekterkennung

Ankerfreie Detektoren gewannen 2018 mit Modellen wie CornerNet und CenterNet an Aufmerksamkeit, die einen neuen Ansatz zur Objekterkennung verfolgten, indem sie die Notwendigkeit vordefinierter Ankerboxen eliminierten. Im Gegensatz zu traditionellen Modellen, die sich auf Ankerboxen unterschiedlicher Größe und Form stützen, um vorherzusagen, wo sich Objekte befinden, sagen ankerfreie Modelle die Positionen von Objekten direkt voraus. Sie konzentrieren sich auf Schlüsselpunkte oder Merkmale des Objekts, wie z. B. den Mittelpunkt, was den Erkennungsprozess vereinfacht und ihn schneller und genauer macht.

So funktionieren die ankerlosen Modelle im Allgemeinen:

  • Keypoint Erkennung: Anstatt vordefinierte Kästchen zu verwenden, identifizieren einige Modelle wichtige Punkte auf einem Objekt, wie die Mitte oder bestimmte Ecken. Anhand dieser Schlüsselpunkte können die Modelle herausfinden, wo sich das Objekt befindet und wie groß es ist.
  • Zentrum Vorhersage: Einige Modelle konzentrieren sich auf die Vorhersage des Mittelpunkts eines Objekts. Sobald der Mittelpunkt gefunden ist, kann das Modell von dort aus die Größe und Position des gesamten Objekts vorhersagen.
  • Heatmap-Regression: Viele ankerfreie Modelle verwenden Heatmaps, bei denen jedes Pixel einen möglichen Standort eines Objekts darstellt. Stärkere Heatmap-Werte zeigen an, dass ein Objekt mit größerer Wahrscheinlichkeit an diesem Punkt vorhanden ist.
Abb. 2. Ankergestützte Erkennung vs. ankerfreie Erkennung.

Da ankerfreie Modelle nicht auf Ankerboxen angewiesen sind, sind sie einfacher aufgebaut. Das bedeutet, dass sie rechenintensiver sind. Da sie nicht mehrere Ankerboxen verarbeiten müssen, können sie Objekte schneller erkennen - ein wichtiger Vorteil für Echtzeitanwendungen wie autonomes Fahren und Videoüberwachung. 

Modelle ohne Anker sind auch viel besser für kleine, unregelmäßige oder verdeckte Objekte geeignet. Da sie sich auf die Erkennung von Schlüsselpunkten konzentrieren, anstatt zu versuchen, Ankerboxen einzupassen, sind sie viel flexibler. Dadurch können sie Objekte in unübersichtlichen oder komplexen Umgebungen genau erkennen, in denen ankerbasierte Modelle versagen können.

Ultralytics YOLO11: Ein ankerfreier Detektor

Ursprünglich auf Schnelligkeit und Effizienz ausgelegt, haben sich die Modelle von YOLO allmählich von ankerbasierten Methoden hin zu ankerfreier Erkennung entwickelt, wodurch Modelle wie YOLO11 schneller, flexibler und besser für eine Vielzahl von Echtzeitanwendungen geeignet sind.

Hier ist ein kurzer Blick darauf, wie sich das ankerlose Design in den verschiedenen Versionen von YOLO entwickelt hat:

  • Ultralytics YOLOv5u: Mit der Einführung des ankerfreien Split-Kopfes Ultralytics entfällt die Notwendigkeit vordefinierter Ankerboxen. Stattdessen sagt das Modell direkt voraus, wo sich Objekte in einem Bild befinden, was den Prozess vereinfacht und die Flexibilität und Geschwindigkeit erhöht.
  • YOLOv6: Es wurde eine neue Methode namens Anchor-Aided Training (AAT) verwendet, bei der Anker nur während des Trainings verwendet wurden. Dadurch konnte das Modell während des Trainings von der Struktur der ankerbasierten Methoden profitieren, während die ankerfreie Erkennung zur Laufzeit für eine bessere Geschwindigkeit und Anpassungsfähigkeit genutzt wurde.
  • Ultralytics YOLOv8: Vollständige Umstellung auf ankerfreie Erkennung mit dem ankerfreien geteilten Ultralytics Kopf. Dadurch wurde das Modell schneller und genauer, insbesondere bei kleinen oder seltsam geformten Objekten, die nicht gut in die Ankerboxen passen.
  • Ultralytics YOLO11: Aufbauend auf dem ankerfreien Ansatz von YOLOv8wird die Erkennung noch weiter optimiert, indem Ankerboxen vollständig eliminiert werden. Das Ergebnis ist eine schnellere und genauere Erkennung für Echtzeitanwendungen wie die Überwachung des Verhaltens von Tieren und die Analyse des Einzelhandels.
Abb. 3. Vergleich von Ultralytics YOLOv8 und Ultralytics YOLO11 .

Anwendungen in der realen Welt von YOLO11

Ein gutes Beispiel für die Vorteile der ankerlosen Erkennung mit YOLO11 sind autonome Fahrzeuge. In selbstfahrenden Autos ist es für die Sicherheit entscheidend, Fußgänger, andere Fahrzeuge und Hindernisse schnell und genau zu erkennen. YOLO11 Der ankerfreie Ansatz von vereinfacht den Erkennungsprozess, indem er die Schlüsselpunkte von Objekten, wie z. B. den Mittelpunkt eines Fußgängers oder die Grenzen eines anderen Fahrzeugs, direkt vorhersagt, anstatt sich auf vordefinierte Ankerboxen zu verlassen. 

Abb. 4. Vorteile der ankerfreien Erkennung in YOLO11 (Bild vom Autor).

YOLO11 muss nicht für jedes Objekt ein Raster von Ankern einstellen oder anpassen, was rechenintensiv und langsam sein kann. Stattdessen konzentriert sich das System auf die wichtigsten Merkmale, was es schneller und effizienter macht. Wenn z. B. ein Fußgänger in den Weg des Fahrzeugs tritt, kann YOLO11 seine Position schnell identifizieren, indem es die wichtigsten Punkte festhält, selbst wenn die Person teilweise versteckt ist oder sich bewegt. Dank der Fähigkeit, sich an unterschiedliche Formen und Größen ohne Ankerboxen anzupassen, kann YOLO11 Objekte zuverlässiger und mit höherer Geschwindigkeit erkennen, was für die Entscheidungsfindung in autonomen Fahrsystemen in Echtzeit unerlässlich ist.

Andere Anwendungen, bei denen die ankerlosen Fähigkeiten von YOLO11besonders hervorstechen, sind:

  • Einzelhandel und Bestandsmanagement: YOLO11 macht es einfacher, die Produkte in den Regalen zu überwachen, auch wenn sie gestapelt oder teilweise blockiert sind. Das hilft bei einer schnelleren und genaueren Bestandsverfolgung und reduziert Fehler.
  • Medizinische Bildgebung: YOLO11 kann auch im Gesundheitswesen eingesetzt werden, um Tumore oder andere Anomalien in medizinischen Scans zu erkennen. Seine Fähigkeit, mit unregelmäßig geformten Objekten zu arbeiten, trägt dazu bei, die Genauigkeit bei der Diagnose komplexer Zustände zu verbessern.
  • Überwachung von Wildtieren: In der Wildtierforschung kann YOLO11 Tiere in dichten Wäldern oder unwegsamem Gelände aufspüren und den Forschern helfen, ihr Verhalten zu beobachten oder gefährdete Arten zu schützen.
  • Sportanalytik: YOLO11 kann verwendet werden, um Spieler, Ballbewegungen oder andere Elemente während Sportereignissen in Echtzeit zu verfolgen und so wertvolle Erkenntnisse für Teams, Trainer und Fernsehsender zu gewinnen.

Überlegungen bei der Arbeit mit verankerungsfreien Modellen

Ankerfreie Modelle wie YOLO11 bieten zwar viele Vorteile, haben aber auch einige Einschränkungen. Eine der wichtigsten praktischen Überlegungen ist, dass selbst verankerungsfreie Modelle Probleme mit verdeckten oder stark überlappenden Objekten haben können. Der Grund dafür ist, dass das Computersehen das menschliche Sehen nachahmen soll, und so wie wir manchmal Schwierigkeiten haben, verdeckte Objekte zu erkennen, können KI-Modelle vor ähnlichen Herausforderungen stehen.

Ein weiterer interessanter Faktor hängt mit der Verarbeitung der Modellvorhersagen zusammen. Obwohl die Architektur von ankerfreien Modellen einfacher ist als die von ankerbasierten, sind in bestimmten Fällen zusätzliche Verfeinerungen erforderlich. So können zum Beispiel Nachbearbeitungstechniken wie die nicht-maximale Unterdrückung (NMS) erforderlich sein, um überlappende Vorhersagen zu bereinigen oder die Genauigkeit in überfüllten Szenen zu verbessern.

Verankerung in der Zukunft der KI mit YOLO11

Der Wechsel von der ankerbasierten zur ankerfreien Erkennung war ein bedeutender Fortschritt bei der Objekterkennung. Mit ankerlosen Modellen wie YOLO11 wird der Prozess vereinfacht, was zu Verbesserungen bei der Genauigkeit und Geschwindigkeit führt.

Mit YOLO11 haben wir gesehen, wie sich die verankerungsfreie Objekterkennung in Echtzeitanwendungen wie selbstfahrenden Autos, Videoüberwachung und medizinischer Bildgebung auszeichnet, wo eine schnelle und präzise Erkennung entscheidend ist. Dieser Ansatz ermöglicht es YOLO11 , sich leichter an unterschiedliche Objektgrößen und komplexe Szenen anzupassen, und sorgt so für eine bessere Leistung in verschiedenen Umgebungen.

Mit der Weiterentwicklung der Computer Vision wird die Objekterkennung immer schneller, flexibler und effizienter werden.

Erkunde unser GitHub-Repository und werde Teil unserer engagierten Community, um in Sachen KI auf dem Laufenden zu bleiben. Erfahre, wie sich Vision AI auf Branchen wie die Fertigung und die Landwirtschaft auswirkt.

Facebook-LogoTwitter-LogoLinkedIn-LogoKopier-Link-Symbol

Lies mehr in dieser Kategorie

Lass uns gemeinsam die Zukunft
der KI gestalten!

Beginne deine Reise in die Zukunft des maschinellen Lernens