Entdecke die Objektverfolgung mit Ultralytics! Lerne, wie du Bewegungen, Verhalten und Interaktionen in Videos mit YOLO Modellen für Echtzeitanwendungen verfolgen kannst.
Die Objektverfolgung ist eine grundlegende Aufgabe der Computer Vision (CV), bei der es darum geht, bestimmte Objekte zu identifizieren und zu verfolgen, während sie sich durch eine Abfolge von Videobildern oder Kameraaufnahmen bewegen. Im Gegensatz zur Objekterkennung, die sich auf die Lokalisierung von Objekten in einzelnen statischen Bildern oder Einzelbildern konzentriert, werden bei der Objektverfolgung die Identität und die Flugbahn dieser Objekte über die Zeit hinweg verfolgt. Diese kontinuierliche Überwachung ermöglicht es Systemen, die Bewegung, das Verhalten und die Interaktionen von Objekten in dynamischen Umgebungen zu verstehen, und liefert damit umfassendere Erkenntnisse als die reine Erkennung. Es ist eine Kernkomponente in vielen Vision AI-Anwendungen.
Die Objektverfolgung beginnt in der Regel mit der Erkennung von Objekten im ersten Bild mithilfe eines Objektdetektors, wie z. B. einem Ultralytics YOLO Modell. Sobald ein Objekt erkannt wurde, das häufig durch eine Bounding Box dargestellt wird, weist der Tracking-Algorithmus ihm eine eindeutige ID zu. In den folgenden Frames prognostiziert der Algorithmus den neuen Standort des Objekts auf der Grundlage seines vorherigen Zustands, der Position, Geschwindigkeit und Aussehen umfassen kann. Für diese Vorhersage werden oft Techniken wie die Bewegungsschätzung verwendet. Das System verknüpft dann die neu erkannten Objekte im aktuellen Bild mit den bereits verfolgten Objekten, aktualisiert ihre Pfade und behält ihre eindeutigen IDs bei.
Bei diesem Prozess müssen verschiedene Herausforderungen bewältigt werden, z. B. das vorübergehende Verdecken von Objekten (Okklusion), Veränderungen im Erscheinungsbild von Objekten, komplexe Interaktionen zwischen mehreren Objekten und Veränderungen der Beleuchtung oder des Kamerastandpunkts. Zu den gängigen Techniken zur Bewältigung dieser Herausforderungen gehören Filtermethoden wie der Kalman-Filter (KF) zur Bewegungsvorhersage und -zuordnung sowie fortschrittlichere Deep Learning (DL)-Ansätze wie SORT (Simple Online and Realtime Tracking) und DeepSORT, die Bewegungs- und Erscheinungsmerkmale für ein robusteres Tracking kombinieren. Ultralytics Modelle unterstützen verschiedene verfügbare Tracker für die Umsetzung dieser Techniken. Ein effektiver Umgang mit Verdeckungen ist entscheidend für die Aufrechterhaltung der Spurenkontinuität.
Es ist wichtig, die Objektverfolgung von anderen verwandten Computer Vision Aufgaben zu unterscheiden:
Die Objektverfolgung, insbesondere das Multiple Object Tracking (MOT), ist für zahlreiche KI-Anwendungen in der realen Welt entscheidend:
Bei der Implementierung der Objektverfolgung werden häufig Modelle zur Objekterkennung mit Verfolgungsalgorithmen kombiniert. Beliebte Bibliotheken wie OpenCV bieten grundlegende Tracking-Funktionen. Frameworks wie PyTorch und TensorFlow werden verwendet, um die zugrunde liegenden Erkennungsmodelle zu erstellen und zu trainieren. Ultralytics vereinfacht diesen Prozess durch die Integration von Tracking-Funktionen direkt in seine Modelle wie YOLO11. Die Nutzer können das Tracking ganz einfach über den speziellen Tracking-Modus aktivieren. Plattformen wie Ultralytics HUB bieten umfassende Tools für die Verwaltung des gesamten Workflows von der Datenkommentierung bis zum Einsatz. Für den Einstieg kannst du Anleitungen wie die YOLO11 Object Tracking Anleitung befolgen.