Glossar

Objekt-Erkennung

Entdecken Sie die Leistungsfähigkeit der Objekterkennung - identifizieren und lokalisieren Sie Objekte in Bildern oder Videos mit modernsten Modellen wie YOLO. Erforschen Sie Anwendungen aus der realen Welt!

Die Objekterkennung ist eine grundlegende Aufgabe der Computer Vision (CV), bei der es um die Identifizierung und Lokalisierung eines oder mehrerer Objekte in einem Bild oder Video geht. Dabei geht es nicht nur darum, die Objekte zu klassifizieren, sondern auch ihre Position zu bestimmen, in der Regel durch das Zeichnen eines Begrenzungsrahmens um jedes Objekt. Diese Technologie bildet den Grundstein für viele fortschrittliche Anwendungen der künstlichen Intelligenz (KI), die es Maschinen ermöglichen, ihre physische Umgebung mit einem hohen Maß an Verständnis wahrzunehmen und zu interpretieren.

Wie die Objekterkennung funktioniert

Modelle zur Objekterkennung werden in der Regel mit Hilfe von Deep Learning (DL) erstellt, insbesondere mit Convolutional Neural Networks (CNNs). Dabei wird ein Bild in das Netzwerk eingespeist, das dann eine Liste der erkannten Objekte ausgibt, jeweils mit einer Klassenbezeichnung (z. B. "Person", "Auto", "Hund"), einem Vertrauenswert und den Koordinaten der Bounding Box.

Moderne Objekterkennungsarchitekturen bestehen aus zwei Hauptteilen: einem Grundgerüst zur Extraktion von Merkmalen aus dem Eingabebild und einem Erkennungskopf zur Vorhersage der Bounding Boxes und Klassen. Diese Architekturen werden oft als einstufige oder zweistufige Detektoren kategorisiert.

  • Einstufige Objektdetektoren: Modelle wie die YOLO-Familie von Ultralytics führen die Erkennung in einem einzigen Durchgang durch, wodurch sie sehr schnell und für Echtzeit-Inferenz geeignet sind. Sie sagen alle Bounding Boxes und Klassenwahrscheinlichkeiten gleichzeitig voraus.
  • Zweistufige Objektdetektoren: Architekturen wie R-CNN und seine Varianten schlagen zunächst Regionen von Interesse vor und klassifizieren dann Objekte innerhalb dieser Regionen. Obwohl sie oft sehr genau sind, können sie langsamer sein als einstufige Detektoren.

Objekterkennung im Vergleich zu anderen CV-Aufgaben

Es ist wichtig, die Objekterkennung von anderen verwandten Bildverarbeitungsaufgaben zu unterscheiden:

  • Bild-Klassifizierung: Weist einem ganzen Bild ein einziges Etikett zu (z. B. "Dies ist ein Bild von einer Katze"). Das Objekt wird dabei nicht lokalisiert.
  • Bildsegmentierung: Klassifiziert jedes Pixel in einem Bild und liefert einen genauen Umriss der Objekte. Bei der Instanzsegmentierung wird zwischen verschiedenen Instanzen derselben Objektklasse unterschieden, während bei der semantischen Segmentierung alle Instanzen einer Klasse als eine Einheit behandelt werden.
  • Objektverfolgung: Eine Erweiterung der Objekterkennung, bei der ein bestimmtes Objekt über mehrere Frames in einem Video verfolgt wird, wobei seine Identität über die Zeit erhalten bleibt. Weitere Informationen finden Sie in unserem Leitfaden zur Verfolgung bewegter Objekte in Videos.

Anwendungen in der realen Welt

Die Objekterkennung ist eine transformative Technologie, die in vielen Branchen eingesetzt wird.

  1. Autonome Fahrzeuge: In selbstfahrenden Autos ist die Objekterkennung entscheidend für die Erkennung von Fußgängern, Radfahrern, anderen Fahrzeugen und Verkehrssignalen, um sicher zu navigieren. Unternehmen wie Waymo und Tesla haben stark in diese Technologie investiert, um ihre autonomen Systeme zu betreiben.
  2. KI in der Fertigung: An Montagelinien erkennen Erkennungsmodelle automatisch Defekte oder überprüfen, ob die Komponenten richtig zusammengebaut wurden. Dadurch wird die Qualitätskontrolle verbessert und die Produktionseffizienz erhöht.
  3. Sicherheit und Überwachung: Automatisierte Systeme nutzen die Objekterkennung, um unbefugte Personen, verlassene Pakete oder ungewöhnliche Aktivitäten in Echtzeit zu erkennen, wie in unserem Leitfaden für den Aufbau einer Sicherheitsalarmanlage beschrieben.
  4. KI im Gesundheitswesen: In der medizinischen Bildanalyse unterstützen Modelle Radiologen bei der Erkennung und Hervorhebung von Anomalien wie Tumoren oder Frakturen in Röntgenbildern und CT-Scans. Lesen Sie in unserem Blog über den Einsatz von YOLO11 zur Tumorerkennung.
  5. KI in der Landwirtschaft: Drohnen und bodengestützte Roboter, die mit Objekterkennung ausgestattet sind, können den Gesundheitszustand von Nutzpflanzen überwachen, Schädlinge erkennen und Erträge mit hoher Präzision schätzen.

Tools und Schulungen

Die Entwicklung und Bereitstellung von Objekterkennungsmodellen umfasst ein umfangreiches Ökosystem von Tools und Techniken.

Werden Sie Mitglied der Ultralytics-Gemeinschaft

Beteiligen Sie sich an der Zukunft der KI. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert