Grüner Scheck
Link in die Zwischenablage kopiert

Verwendung von Ultralytics YOLO11 für die Objekterkennung

Erfahre, wie das neue Modell Ultralytics YOLO11 zur Objekterkennung eingesetzt werden kann, um eine höhere Präzision in verschiedenen Anwendungen in unterschiedlichen Branchen zu erreichen.

Computer Vision ist ein Bereich der künstlichen Intelligenz (KI), der Maschinen hilft, visuelle Informationen zu interpretieren und zu verstehen, um wichtige Aufgaben wie die Objekterkennung zu ermöglichen. Anders als bei der Bildklassifizierung wird bei der Objekterkennung nicht nur festgestellt, welche Objekte in einem Bild vorhanden sind, sondern auch, wo sie sich genau befinden. Das macht sie zu einem wichtigen Werkzeug für KI-Anwendungen wie selbstfahrende Autos, Echtzeit-Sicherheitssysteme und Lagerautomatisierung.

Im Laufe der Zeit ist die Technologie zur Objekterkennung immer fortschrittlicher und benutzerfreundlicher geworden. Auf der jährlichen Hybrid-Veranstaltung von Ultralytics, YOLO Vision 2024 (YV24), wurde mit der Einführung des ModellsUltralytics YOLO11 ein großer Schritt nach vorn angekündigt. YOLO11 verbessert die Genauigkeit und Leistung und unterstützt dabei die gleichen Aufgaben wie YOLOv8Das macht es den Nutzern früherer Modelle leicht, nahtlos umzusteigen.

Abb. 1. Ein Beispiel für die Verwendung des Ultralytics YOLO11 Modells zur Objekterkennung.

In diesem Artikel erklären wir dir, was Objekterkennung ist, wie sie sich von anderen Aufgaben der Computer Vision unterscheidet und wie sie in der Praxis angewendet wird. Außerdem zeigen wir dir, wie du das Modell YOLO11 mit dem PaketUltralytics Python und der PlattformUltralytics HUB verwenden kannst. Los geht's!

Was ist Objekterkennung?

Die Objekterkennung ist eine Kernaufgabe der Computer Vision, die mehr als nur Objekte in einem Bild identifiziert. Im Gegensatz zur Bildklassifizierung, bei der nur festgestellt wird, ob ein bestimmtes Objekt vorhanden ist, erkennt die Objekterkennung mehrere Objekte und bestimmt ihre genaue Position mithilfe von Begrenzungsrahmen. 

Er kann zum Beispiel Gesichter auf einem Gruppenfoto, Autos auf einer belebten Straße oder Produkte in einem Ladenregal erkennen und lokalisieren. Die Kombination von Objekterkennung und Lokalisierung macht sie besonders nützlich für Anwendungen wie Überwachung, Beobachtung von Menschenmengen und automatisierte Bestandsverwaltung.

Abb. 2. Verwendung von YOLO11 zur Erkennung von Gesichtern.

Was die Objekterkennung von anderen Aufgaben wie der semantischen oder Instanzensegmentierung unterscheidet, ist ihr Fokus und ihre Effizienz. 

Die semantische Segmentierung kennzeichnet jedes Pixel in einem Bild, unterscheidet aber nicht zwischen einzelnen Objekten desselben Typs (z. B. würden alle Gesichter in einem Foto als "Gesicht" gruppiert werden). Die Instanzensegmentierung geht noch einen Schritt weiter, indem sie jedes Objekt trennt und seine genaue Form umreißt, auch bei Objekten derselben Klasse. 

Die Objekterkennung hingegen bietet einen effizienteren Ansatz, indem sie Objekte identifiziert und klassifiziert und gleichzeitig ihre Position markiert. Das macht sie ideal für Echtzeitaufgaben wie die Erkennung von Gesichtern in Sicherheitsvideos oder die Identifizierung von Hindernissen für autonome Fahrzeuge.

Anwendungen von YOLO11 und Objektdetektion

YOLO11Die fortschrittlichen Funktionen der Objekterkennung machen sie in vielen Branchen nützlich. Werfen wir einen Blick auf einige Beispiele.

YOLO11 für Einzelhandelsanalysen nutzen

YOLO11 und Objekterkennung definieren die Einzelhandelsanalytik neu, indem sie die Bestandsverwaltung und Regalüberwachung effizienter und genauer machen. Die Fähigkeit des Modells, Objekte schnell und zuverlässig zu erkennen, hilft Einzelhändlern dabei, Lagerbestände zu verfolgen, Regale zu organisieren und Fehler bei der Inventur zu reduzieren.

Zum Beispiel, YOLO11 bestimmte Artikel wie Sonnenbrillen in einem Ladenregal erkennen. Aber warum sollte ein Einzelhändler ein Regal überwachen wollen? Ein gut gefülltes und organisiertes Regal ist wichtig, damit die Kunden finden, was sie brauchen, was sich direkt auf den Umsatz auswirkt. Durch die Überwachung der Regale in Echtzeit können Einzelhändler schnell erkennen, wenn Artikel zur Neige gehen, falsch platziert werden oder überfüllt sind, und so für eine geordnete und attraktive Auslage sorgen, die das Einkaufserlebnis verbessert.

Abb. 3. Ein Beispiel für die Verwendung von YOLO11 zur Erkennung von Produkten in Regalen.

YOLO11 in Smart City Anwendungen

Eine belebte Stadt ist auf einen reibungslosen Verkehrsfluss und sichere Straßen angewiesen, um effizient zu funktionieren, und YOLO11 kann dabei helfen, dies zu ermöglichen. Viele Smart-City-Anwendungen können mit YOLO11 integriert werden. 

Ein interessantes Beispiel ist die Objekterkennung, um Nummernschilder an fahrenden Fahrzeugen zu identifizieren. Auf diese Weise kann YOLO11 eine schnellere Mauterhebung, ein besseres Verkehrsmanagement und eine schnellere Durchsetzung von Vorschriften unterstützen. 

Abb. 4. Verwendung von Objekterkennung und YOLO11 zur Erkennung von Nummernschildern.

Erkenntnisse aus Vision AI-Systemen, die Straßen überwachen, können Behörden auf Verkehrsverstöße oder Staus aufmerksam machen, bevor diese zu größeren Problemen eskalieren. YOLO11 Sie können auch Fußgänger und Radfahrer erkennen und so die Straßen für alle sicherer und effizienter machen. 

Die Fähigkeit von YOLO11, visuelle Daten zu verarbeiten, macht es zu einem leistungsstarken Werkzeug für die Verbesserung der städtischen Infrastruktur. So kann es zum Beispiel helfen, die Ampelschaltung zu optimieren, indem es die Bewegungen von Fahrzeugen und Fußgängern analysiert. Es kann auch die Sicherheit in Schulzonen erhöhen, indem es Kinder erkennt und die Fahrer warnt, langsamer zu fahren. Mit YOLO11 können Städte proaktive Maßnahmen ergreifen, um Herausforderungen anzugehen und eine effizientere Umgebung für alle zu schaffen.

Videodetektion in Echtzeit mit YOLO11: Mehr Barrierefreiheit

Unter Objekterkennung in Echtzeit versteht man die Fähigkeit eines Systems, Objekte in einem Live-Video zu identifizieren und zu klassifizieren, sobald sie auftauchen. YOLO11 wurde für eine überragende Echtzeitleistung entwickelt und unterstützt diese Fähigkeit in hervorragender Weise. Seine Anwendungen gehen über die bloße Rationalisierung von Prozessen hinaus - es kann auch dazu beitragen, eine integrativere und zugänglichere Welt zu schaffen.

Zum Beispiel, YOLO11 kann sehbehinderten Menschen helfen, indem es Objekte in Echtzeit identifiziert. Basierend auf den Erkennungen können Audiobeschreibungen bereitgestellt werden, die den Nutzern helfen, sich in ihrer Umgebung unabhängiger zu bewegen.

Stell dir vor, eine sehbehinderte Person kauft Lebensmittel ein. Die richtigen Artikel auszusuchen, kann eine Herausforderung sein, aber YOLO11 kann dabei helfen. Während sie die Artikel in den Einkaufswagen legen, kann ein in YOLO11 integriertes System jeden Artikel - wie Bananen, Avocados oder eine Packung Milch - identifizieren und in Echtzeit akustische Beschreibungen liefern. So können sie ihre Wahl bestätigen und sicherstellen, dass sie alles haben, was sie brauchen. Durch die Erkennung von Alltagsgegenständen kann YOLO11 das Einkaufen einfacher machen.

Abb. 5. Die Objekterkennung kann dazu beitragen, die Welt für sehbehinderte Menschen zugänglicher zu machen.

Schritt-für-Schritt-Anleitung zur Objekterkennung mit YOLO11 

Nachdem wir nun die Grundlagen der Objekterkennung und ihre vielfältigen Anwendungsmöglichkeiten behandelt haben, wollen wir uns ansehen, wie du das Modell Ultralytics YOLO11 für Aufgaben wie die Objekterkennung nutzen kannst.

Es gibt zwei einfache Möglichkeiten, YOLO11 zu nutzen: über das Ultralytics Python Paket oder den Ultralytics HUB. Beginnen wir mit dem Python Paket und schauen uns beide Methoden an.

Rückschlüsse ziehen mit YOLO11

Inferencing bedeutet, dass ein KI-Modell neue, ungesehene Daten analysiert, um Vorhersagen zu treffen, Informationen zu klassifizieren oder Erkenntnisse zu gewinnen, die auf dem basieren, was es beim Training gelernt hat. In Bezug auf die Objekterkennung bedeutet das, dass bestimmte Objekte in einem Bild oder Video identifiziert und lokalisiert werden, dass Bounding Boxes um sie herum gezeichnet werden und dass sie auf der Grundlage des Trainings des Modells beschriftet werden.

Um das YOLO11 Objekterkennungsmodell zu verwenden, musst du zuerst das Ultralytics Python Paket über pip, conda oder Docker installieren. Wenn du bei der Installation Probleme hast, findest du in der Anleitung zur Fehlerbehebung Tipps und Tricks, wie du sie lösen kannst. Nach der Installation kannst du den folgenden Code verwenden, um das YOLO11 Objekterkennungsmodell zu laden und Vorhersagen für ein Bild zu treffen.

Abb. 6. Durchführung einer Inferenz auf einem Bild mit YOLO11n.

Schulung eines benutzerdefinierten YOLO11 Modells

YOLO11 unterstützt auch benutzerdefiniertes Training, um deine spezifischen Anwendungsfälle besser zu erfüllen. Durch die Feinabstimmung des Modells kannst du es so anpassen, dass es Objekte erkennt, die für dein Projekt relevant sind. Beim Einsatz von Computer Vision im Gesundheitswesen könnte ein individuell trainiertes YOLO11 Modell zum Beispiel dazu verwendet werden, bestimmte Anomalien in medizinischen Bildern zu erkennen, wie z. B. Tumore in MRT-Scans oder Frakturen in Röntgenbildern.

Das folgende Codeschnipsel zeigt, wie du ein YOLO11 Modell zur Objekterkennung lädst und trainierst. Du kannst mit einer YAML-Konfigurationsdatei oder einem bereits trainierten Modell beginnen, Gewichte übertragen und auf Datensätzen wie COCO trainieren, um die Objekterkennung zu verfeinern.


from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.yaml")  # build a new model from YAML
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)
model = YOLO("yolo11n.yaml").load("yolo11n.pt")  # build from YAML and transfer weights

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Nachdem du ein Modell trainiert hast, kannst du das trainierte Modell in verschiedenen Formaten exportieren, um es in unterschiedlichen Umgebungen einzusetzen.

YOLO11 Objekterkennung auf Ultralytics HUB

Für diejenigen, die eine Alternative ohne Code suchen, bietet Ultralytics HUB eine einfach zu bedienende Vision AI-Plattform für das Training und den Einsatz von YOLO Modellen, einschließlich YOLO11.

Um die Objekterkennung auf Bildern durchzuführen, musst du nur ein Konto erstellen, zum Bereich "Modelle" navigieren und die Modellvariante YOLO11 für die Objekterkennung auswählen. Lade dein Bild hoch, und die Plattform zeigt die erkannten Objekte in einer Vorschau an.

Abb. 7. Durchführung von Schlussfolgerungen auf Ultralytics HUB.

Durch die Kombination der Flexibilität des Python Pakets mit der Einfachheit des HUBs macht YOLO11 es Entwicklern und Unternehmen gleichermaßen leicht, sich die Leistung der fortschrittlichen Objekterkennungstechnologie zunutze zu machen.

Die wichtigsten Erkenntnisse

YOLO11 setzt einen neuen Standard in der Objekterkennung und kombiniert hohe Genauigkeit mit Vielseitigkeit, um den Anforderungen verschiedener Branchen gerecht zu werden. Von der Verbesserung der Einzelhandelsanalyse bis hin zur Verwaltung der Smart-City-Infrastruktur - YOLO11 ist für eine zuverlässige Leistung in Echtzeit bei unzähligen Anwendungen ausgelegt.

Mit den Optionen für individuelle Schulungen und der benutzerfreundlichen Oberfläche von Ultralytics HUB war es noch nie so einfach, YOLO11 in deine Arbeitsabläufe zu integrieren. Egal, ob du ein Entwickler bist, der sich mit Computer Vision beschäftigt, oder ein Unternehmen, das mit KI innovativ sein will: YOLO11 bietet dir die Werkzeuge, die du für deinen Erfolg brauchst.

Um mehr zu erfahren, besuche unser GitHub-Repository und beteilige dich an unserer Community. Entdecke KI-Anwendungen für selbstfahrende Autos und Computer Vision für die Landwirtschaft auf unseren Lösungsseiten. 🚀

Facebook-LogoTwitter-LogoLinkedIn-LogoKopier-Link-Symbol

Lies mehr in dieser Kategorie

Lass uns gemeinsam die Zukunft
der KI gestalten!

Beginne deine Reise in die Zukunft des maschinellen Lernens