Objekt-Erkennung

Entdecken Sie die Leistungsfähigkeit der Objekterkennung - identifizieren und lokalisieren Sie Objekte in Bildern oder Videos mit modernsten Modellen wie YOLO. Erforschen Sie Anwendungen aus der realen Welt!

Die Objekterkennung ist eine grundlegende Aufgabe der Computer Vision (CV), bei der es um die Identifizierung und Lokalisierung eines oder mehrerer Objekte in einem Bild oder Video geht. Dabei geht es nicht nur darum, die Objekte zu klassifizieren, sondern auch ihre Position zu bestimmen, in der Regel durch das Zeichnen eines Begrenzungsrahmens um jedes Objekt. Diese Technologie bildet den Grundstein für viele fortschrittliche Anwendungen der künstlichen Intelligenz (KI), die es Maschinen ermöglichen, ihre physische Umgebung mit einem hohen Maß an Verständnis wahrzunehmen und zu interpretieren.

Wie die Objekterkennung funktioniert

Modelle zur Objekterkennung werden in der Regel mit Hilfe von Deep Learning (DL) erstellt, insbesondere mit Convolutional Neural Networks (CNNs). Dabei wird ein Bild in das Netzwerk eingespeist, das dann eine Liste der erkannten Objekte ausgibt, jeweils mit einer Klassenbezeichnung (z. B. "Person", "Auto", "Hund"), einem Vertrauenswert und den Koordinaten der Bounding Box.

Moderne Objekterkennungsarchitekturen bestehen aus zwei Hauptteilen: einem Grundgerüst zur Extraktion von Merkmalen aus dem Eingabebild und einem Erkennungskopf zur Vorhersage der Bounding Boxes und Klassen. Diese Architekturen werden oft als einstufige oder zweistufige Detektoren kategorisiert.

Einstufige Objektdetektoren: Modelle wie die YOLO-Familie von Ultralytics führen die Erkennung in einem einzigen Durchgang durch, wodurch sie sehr schnell und für Echtzeit-Inferenz geeignet sind. Sie sagen alle Bounding Boxes und Klassenwahrscheinlichkeiten gleichzeitig voraus.
Zweistufige Objektdetektoren: Architekturen wie R-CNN und seine Varianten schlagen zunächst Regionen von Interesse vor und klassifizieren dann Objekte innerhalb dieser Regionen. Obwohl sie oft sehr genau sind, können sie langsamer sein als einstufige Detektoren.

Objekterkennung im Vergleich zu anderen CV-Aufgaben

Es ist wichtig, die Objekterkennung von anderen verwandten Bildverarbeitungsaufgaben zu unterscheiden:

Bild-Klassifizierung: Weist einem ganzen Bild ein einziges Etikett zu (z. B. "Dies ist ein Bild von einer Katze"). Das Objekt wird dabei nicht lokalisiert.
Bildsegmentierung: Klassifiziert jedes Pixel in einem Bild und liefert einen genauen Umriss der Objekte. Bei der Instanzsegmentierung wird zwischen verschiedenen Instanzen derselben Objektklasse unterschieden, während bei der semantischen Segmentierung alle Instanzen einer Klasse als eine Einheit behandelt werden.
Objektverfolgung: Eine Erweiterung der Objekterkennung, bei der ein bestimmtes Objekt über mehrere Frames in einem Video verfolgt wird, wobei seine Identität über die Zeit erhalten bleibt. Weitere Informationen finden Sie in unserem Leitfaden zur Verfolgung bewegter Objekte in Videos.

Anwendungen in der realen Welt

Die Objekterkennung ist eine transformative Technologie, die in vielen Branchen eingesetzt wird.

Autonome Fahrzeuge: In selbstfahrenden Autos ist die Objekterkennung entscheidend für die Erkennung von Fußgängern, Radfahrern, anderen Fahrzeugen und Verkehrssignalen, um sicher zu navigieren. Unternehmen wie Waymo und Tesla haben stark in diese Technologie investiert, um ihre autonomen Systeme zu betreiben.
KI in der Fertigung: An Montagelinien erkennen Erkennungsmodelle automatisch Defekte oder überprüfen, ob die Komponenten richtig zusammengebaut wurden. Dadurch wird die Qualitätskontrolle verbessert und die Produktionseffizienz erhöht.
Sicherheit und Überwachung: Automatisierte Systeme nutzen die Objekterkennung, um unbefugte Personen, verlassene Pakete oder ungewöhnliche Aktivitäten in Echtzeit zu erkennen, wie in unserem Leitfaden für den Aufbau einer Sicherheitsalarmanlage beschrieben.
KI im Gesundheitswesen: In der medizinischen Bildanalyse unterstützen Modelle Radiologen bei der Erkennung und Hervorhebung von Anomalien wie Tumoren oder Frakturen in Röntgenbildern und CT-Scans. Lesen Sie in unserem Blog über den Einsatz von YOLO11 zur Tumorerkennung.
KI in der Landwirtschaft: Drohnen und bodengestützte Roboter, die mit Objekterkennung ausgestattet sind, können den Gesundheitszustand von Nutzpflanzen überwachen, Schädlinge erkennen und Erträge mit hoher Präzision schätzen.

Tools und Schulungen

Die Entwicklung und Bereitstellung von Objekterkennungsmodellen umfasst ein umfangreiches Ökosystem von Tools und Techniken.

Rahmenwerke: Beliebte Deep-Learning-Frameworks wie PyTorch und TensorFlow bieten die Kernbibliotheken für die Erstellung von Modellen.
Modelle: Ultralytics bietet hochmoderne Modelle wie YOLOv8 und YOLO11, die für ein ausgewogenes Verhältnis von Geschwindigkeit und Genauigkeit optimiert sind. Wie sie im Vergleich zu anderen Modellen abschneiden, können Sie auf unseren Modellvergleichsseiten sehen.
Plattformen: Ultralytics HUB vereinfacht den gesamten Arbeitsablauf, von der Verwaltung von Datensätzen wie dem beliebten COCO-Datensatz bis hin zum Training benutzerdefinierter Modelle und der Erleichterung der Modellbereitstellung.
Techniken: Der Trainingsprozess profitiert oft von Techniken wie der Datenerweiterung zur Verbesserung der Robustheit und dem Transfer-Lernen zur Nutzung von Wissen aus bereits trainierten Modellen. Die Modellleistung wird anhand von Metriken wie mAP und IoU bewertet, wie in unserem Leitfaden für Leistungsmetriken erläutert.

Objekt-Erkennung

Flexible Lizenzierungslösung für Unternehmen zur Förderung Ihrer Innovation

Trainieren Sie AI-Modelle in Sekundenschnelle mit Ultralytics YOLO

Trainieren Sie YOLO-Modelle einfach mit Ultralytics HUB

Wie die Objekterkennung funktioniert

Objekterkennung im Vergleich zu anderen CV-Aufgaben

Anwendungen in der realen Welt

Tools und Schulungen

Lesen Sie mehr in dieser Kategorie

Die Entwicklung und Zukunft der Robotik in der Fertigung

Verbessern Sie die intelligente Überwachung mit Ultralytics YOLO11

Ein Leitfaden zur U-Net-Architektur und ihren Anwendungen

Werden Sie Mitglied der Ultralytics-Gemeinschaft