Glossar

Objekt-Erkennung

Entdecke die Möglichkeiten der Objekterkennung: Identifiziere, lokalisiere und klassifiziere Objekte in Bildern mit Präzision. Erforsche Werkzeuge, Konzepte und praktische Anwendungen!

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Die Objekterkennung ist eine Computer-Vision-Technik, mit der KI-Systeme Objekte in einem Bild oder Video identifizieren und lokalisieren können. Diese Technologie geht über die bloße Klassifizierung eines Bildes hinaus. Sie bestimmt die genaue Position von Objekten und zeichnet Begrenzungsrahmen um sie herum, um sowohl das "Was" als auch das "Wo" von Objekten in einer visuellen Szene zu bestimmen. Diese Fähigkeit ist für viele KI-Anwendungen von grundlegender Bedeutung, da sie es Maschinen ermöglicht, die visuelle Welt auf eine Weise wahrzunehmen und mit ihr zu interagieren, die dem menschlichen Sehen sehr ähnlich ist.

Schlüsselkonzepte der Objekterkennung

Die Objekterkennung umfasst mehrere wichtige Konzepte, die für das Verständnis der Funktionsweise dieser Systeme entscheidend sind. Bounding Boxes sind rechteckige Rahmen, die um erkannte Objekte gezogen werden und eine klare visuelle Darstellung ihrer Position liefern. Eine weitere wichtige Kennzahl ist Intersection over Union (IoU), die die Überlappung zwischen der vorhergesagten Bounding Box und der Ground Truth Bounding Box misst und dabei hilft, die Genauigkeit der Erkennung zu bewerten. Darüber hinaus wird die durchschnittliche Genauigkeit (mean Average Precision, mAP) verwendet, um die Gesamtleistung von Objekterkennungsmodellen zu bewerten, indem sowohl die Genauigkeit als auch die Wiedererkennung über mehrere Klassen hinweg berücksichtigt werden.

Arten von Objekterkennungsarchitekturen

Es gibt hauptsächlich zwei Arten von Objekterkennungsarchitekturen: einstufige Detektoren und zweistufige Detektoren. Einstufige Detektoren, wie z. B. Ultralytics YOLO , sind auf Schnelligkeit und Effizienz ausgelegt. Sie verarbeiten das gesamte Bild in einem einzigen Durchgang, um Bounding Boxes und Klassenwahrscheinlichkeiten gleichzeitig vorherzusagen. Das macht sie ideal für Echtzeitanwendungen, bei denen eine schnelle Verarbeitung wichtig ist. Im Gegensatz dazu erzeugen zweistufige Detektoren zunächst Regionsvorschläge und klassifizieren diese Regionen dann. Sie bieten in der Regel eine höhere Genauigkeit, allerdings auf Kosten einer langsameren Verarbeitungsgeschwindigkeit.

Objekterkennung vs. verwandte Konzepte

Obwohl die Objekterkennung eine leistungsstarke Technik ist, ist es wichtig, sie von verwandten Computer Vision Aufgaben zu unterscheiden. Bei der Bildklassifizierung wird einem gesamten Bild ein einziges Label zugewiesen, das das primäre Objekt oder die Szene angibt. Die semantische Segmentierung geht noch weiter, indem sie jedes Pixel eines Bildes in vordefinierte Kategorien einteilt und so eine detaillierte Karte der Szene erstellt. Die Objekterkennung kombiniert jedoch Aspekte von beiden, indem sie nicht nur mehrere Objekte in einem Bild klassifiziert, sondern sie auch mit Hilfe von Begrenzungsrahmen genau lokalisiert.

Anwendungen der Objekterkennung in der realen Welt

Die Objekterkennung hat eine breite Palette von Anwendungen in verschiedenen Branchen, die die Art und Weise, wie Unternehmen arbeiten, verändern und das tägliche Leben verbessern. Hier sind zwei bemerkenswerte Beispiele:

Autonome Fahrzeuge

In der Automobilindustrie ist die Objekterkennung entscheidend für die Entwicklung autonomer Fahrzeuge. Selbstfahrende Autos sind auf die Objekterkennung angewiesen, um Fußgänger, andere Fahrzeuge, Ampeln und Straßenschilder in Echtzeit zu erkennen und zu verfolgen. So kann das Fahrzeug sicher navigieren und fundierte Entscheidungen treffen, z. B. wann es bremsen, beschleunigen oder die Spur wechseln soll. Eine genaue und schnelle Objekterkennung ist entscheidend für die Sicherheit und Zuverlässigkeit von autonomen Fahrsystemen. Erfahre mehr über KI in selbstfahrenden Autos.

Einzelhandel

Die Objekterkennung revolutioniert auch die Einzelhandelsbranche, indem sie verschiedene Prozesse automatisiert und verbessert. An der automatisierten Kasse im Einzelhandel können Objekterkennungssysteme zum Beispiel Produkte identifizieren, wenn sie in den Einkaufswagen gelegt werden, so dass das Abrechnungssystem automatisch aktualisiert und der Kassiervorgang rationalisiert wird. Dies verbessert nicht nur das Kundenerlebnis durch kürzere Wartezeiten, sondern verbessert auch die Bestandsverwaltung und reduziert Fehler. Außerdem kann die Objekterkennung zur Regalüberwachung eingesetzt werden, um sicherzustellen, dass die Produkte richtig gelagert und präsentiert werden.

Tools und Rahmenwerke

Für die Entwicklung und den Einsatz von Objekterkennungsmodellen gibt es verschiedene Tools und Frameworks. Ultralytics YOLO OpenCV ist ein führendes Framework, das für seine Ausgewogenheit von Geschwindigkeit und Genauigkeit bekannt ist und sich daher für eine Vielzahl von Anwendungen eignet. Ultralytics YOLO Modelle, wie z. B. YOLOv8, sind so konzipiert, dass sie benutzerfreundlich und effizient sind und es Entwicklern ermöglichen, Modelle für die Objekterkennung in Echtzeit einfach zu trainieren und einzusetzen. Außerdem bietet OpenCV eine umfassende Bibliothek mit Funktionen für die Bild- und Videoverarbeitung, die für die Entwicklung robuster Anwendungen zur Objekterkennung unerlässlich sind.

Für alle, die die Objekterkennung ohne umfangreiche Programmierkenntnisse erforschen möchten, bietet Ultralytics HUB eine No-Code-Plattform für das Training und den Einsatz von Modellen. So können Nutzer/innen mit unterschiedlichen technischen Kenntnissen die Möglichkeiten der Objekterkennung in ihren Projekten nutzen.

Alles lesen