Grüner Scheck
Link in die Zwischenablage kopiert

Alles, was du über Ultralytics YOLO11 und seine Anwendungen wissen musst

Erfahre alles über das neue Modell Ultralytics YOLO11, seine Funktionen und Echtzeitanwendungen in verschiedenen Branchen. Wir führen dich durch alles, was du wissen musst.

Am Montag, den 30. September, stellte Ultralytics offiziell Ultralytics YOLO11 vor, die neueste Entwicklung im Bereich Computer Vision, die auf der YOLO Vision 2024 (YV24), dem jährlichen Hybrid-Event von Ultralytics, vorgestellt wurde. Die KI-Gemeinde ist begeistert und erkundet eifrig die Möglichkeiten des Modells. Mit schnellerer Verarbeitung, höherer Genauigkeit und Modellen, die sowohl für Edge-Geräte als auch für den Einsatz in der Cloud optimiert sind, definiert YOLO11 die Möglichkeiten von Echtzeit-Computer-Vision-Anwendungen neu.

In einem Interview sagte der Gründer und CEO von Ultralytics , Glenn Jocher: "Die Welt entwickelt sich in Richtung saubere Energie, aber nicht schnell genug. Wir wollen, dass unsere Modelle in weniger Epochen, mit weniger Erweiterungen und weniger Daten trainiert werden können, also arbeiten wir hart daran. Das kleinste Objekterkennungsmodell, YOLO11n, hat nur 2,6 Millionen Parameter - etwa so groß wie ein JPEG, was wirklich verrückt ist. Das größte Objekterkennungsmodell, YOLO11x, hat etwa 56 Millionen Parameter, und selbst das ist unglaublich klein im Vergleich zu anderen Modellen. Du kannst sie auf einem billigen GPU trainieren, z. B. auf einem fünf Jahre alten Nvidia GPU , mit nur etwas Aufregung und ein bisschen Kaffee."

In diesem Artikel werfen wir einen genaueren Blick auf YOLO11 und untersuchen seine Funktionen, Verbesserungen, Leistungsvergleiche und realen Anwendungen, damit du verstehst, was dieses Modell alles kann. Los geht's!

YOLO11 verstehen: Verbesserungen gegenüber den Vorgängerversionen

YOLO11 ist die neueste Weiterentwicklung der YOLO (You Only Look Once) Reihe von Computer Vision Modellen und bietet erhebliche Verbesserungen gegenüber früheren Versionen wie YOLOv5 und YOLOv8. Das Team von Ultralytics hat das Feedback der Community und neueste Forschungsergebnisse berücksichtigt, um YOLO11 schneller, genauer und effizienter zu machen. YOLO11 unterstützt dieselben Computer-Vision-Aufgaben wie YOLOv8, einschließlich Objekterkennung, Instanzsegmentierung und Bildklassifizierung. Die Nutzer/innen können ganz einfach zu YOLO11 wechseln, ohne ihre bestehenden Arbeitsabläufe ändern zu müssen.

Eines der wichtigsten Highlights von YOLO11 ist seine überlegene Leistung in Bezug auf Genauigkeit und Geschwindigkeit im Vergleich zu seinen Vorgängern. Mit 22 % weniger Parametern als YOLOv8m erreicht YOLO11m eine höhere durchschnittliche Genauigkeit (mAP) im COCO-Datensatz, was bedeutet, dass es Objekte präziser und effizienter erkennen kann. In Bezug auf die Verarbeitungsgeschwindigkeit übertrifft YOLO11 frühere Modelle und ist damit ideal für Echtzeitanwendungen, bei denen eine schnelle Erkennung und Reaktion entscheidend sind und jede Millisekunde zählt.

Die Benchmarking-Grafik unten zeigt, wie sich YOLO11 von früheren Modellen abhebt. Auf der horizontalen Achse wird die durchschnittliche Genauigkeit (AP) der COCO Box angezeigt, die die Genauigkeit der Objekterkennung misst. Die vertikale Achse zeigt die Latenzzeit mit TensorRT10 FP16 auf einem NVIDIA T4 GPU, die angibt, wie schnell das Modell Daten verarbeitet. 

Abb. 1. YOLO11 bietet modernste Echtzeit-Objekterkennungsfunktionen.

YOLO11 Modelleinführung: Open Source und Enterprise Optionen

Mit der Markteinführung von Ultralytics YOLO11 erweitert Ultralytics die YOLO Serie, indem es sowohl Open-Source- als auch Enterprise-Modelle anbietet, um der wachsenden Nachfrage in allen Branchen gerecht zu werden.

Abb. 2. Mit dieser Einführung bietet Ultralytics 30 neue Modelle an.

YOLO11 bietet fünf verschiedene Modellgrößen - Nano, Small, Medium, Large und X. Die Nutzer können das beste Modell je nach den spezifischen Anforderungen ihrer Computer Vision Anwendung wählen. Die fünf Größen bieten Flexibilität bei Aufgaben wie Bildklassifizierung, Objekterkennung, Instanzsegmentierung, Verfolgung, Posenschätzung und OBB-Objekterkennung (Oriented Bounding Boxes). Für jede Größe gibt es ein Modell für jede Aufgabe, so dass insgesamt 25 Open-Source-Modelle den Kern des Angebots von Ultralytics bilden. Diese Modelle sind ideal für eine Vielzahl von Anwendungen, von leichten Aufgaben auf Edge Devices, bei denen das YOLO11n-Modell eine beeindruckende Effizienz bietet, bis hin zu größeren Anwendungen, die die Modelle YOLO11l und YOLO11x erfordern.

Zum ersten Mal führt Ultralytics Unternehmensmodelle ein und setzt damit einen wichtigen Meilenstein in unserem Produktangebot. Wir freuen uns, diese neuen Innovationen mit unseren Nutzern zu teilen. YOLO11 führt fünf proprietäre Modelle ein, die speziell für kommerzielle Anwendungsfälle entwickelt wurden. Diese Unternehmensmodelle, die ab nächstem Monat erhältlich sein werden, werden auf dem neuen, proprietären Datensatz von Ultralyticstrainiert, der aus über 1 Million Bildern besteht und robustere, vortrainierte Modelle bietet. Sie wurden für anspruchsvolle, reale Anwendungen entwickelt, wie z. B. die Analyse medizinischer Bilder und die Verarbeitung von Satellitenbildern, bei denen eine präzise Objekterkennung entscheidend ist.

Erkundung der YOLO11-Funktionen der nächsten Generation

Nachdem wir nun besprochen haben, was YOLO11 bietet, lass uns einen Blick darauf werfen, was YOLO11 so besonders macht.

Eine der größten Herausforderungen bei der Entwicklung von YOLO11 war es, die richtige Balance zwischen konkurrierenden Prioritäten zu finden: die Modelle kleiner, schneller und genauer zu machen. Glenn Jocher, Gründer und Geschäftsführer von Ultralytics, erklärt: "DieArbeit an YOLO ist eine echte Herausforderung, weil man in drei verschiedene Richtungen gehen will: Man will die Modelle kleiner machen, sie genauer machen, aber auch schneller auf verschiedenen Plattformen wie CPU und GPU. All das sind konkurrierende Interessen, also musst du Kompromisse eingehen und entscheiden, wo du Änderungen vornehmen willst." Trotz dieser Herausforderungen erreicht YOLO11 eine beeindruckende Balance, indem es sowohl die Geschwindigkeit als auch die Genauigkeit gegenüber früheren Versionen wie YOLOv8 verbessert.

Abb. 3. Ein Beispiel für die Verwendung von YOLO11 zur Objekterkennung.

YOLO11 bringt wesentliche Verbesserungen mit sich, z. B. eine verbesserte Merkmalsextraktion mit einer neu gestalteten Backbone- und Neck-Architektur, die zu einer präziseren Objekterkennung führt. Das Modell ist außerdem auf Geschwindigkeit und Effizienz optimiert und bietet schnellere Verarbeitungszeiten bei gleichbleibend hoher Genauigkeit. Zusätzlich zu diesen Vorteilen ist YOLO11 äußerst anpassungsfähig in verschiedenen Umgebungen und funktioniert nahtlos auf Edge-Geräten, Cloud-Plattformen und Systemen mit NVIDIA GPUs. Diese Anpassungsfähigkeit macht es zur idealen Wahl für Nutzer/innen, die flexible Einsatzoptionen für verschiedene Hardwarekonfigurationen benötigen, von mobilen Geräten bis hin zu großen Servern.

YOLO11-Echtzeitanwendungen

Die Vielseitigkeit von YOLO11 macht es zu einem zuverlässigen Werkzeug in vielen Branchen, insbesondere bei komplexen Anwendungsfällen. Es funktioniert zum Beispiel nahtlos auf Edge-Geräten und kann für Anwendungen eingesetzt werden, die Echtzeitanalysen in Umgebungen mit begrenzter Rechenleistung erfordern. Ein hervorragendes Beispiel dafür ist das autonome Fahren, bei dem die Fahrzeuge in Sekundenbruchteilen Entscheidungen treffen müssen, um die Sicherheit aller zu gewährleisten. YOLO11 hilft dabei, indem es Objekte auf der Straße, wie Fußgänger oder andere Autos, selbst unter schwierigen Bedingungen wie schlechten Lichtverhältnissen oder wenn Dinge teilweise verdeckt sind, erkennt und analysiert. Die schnelle und präzise Erkennung hilft, Unfälle zu vermeiden und sorgt dafür, dass selbstfahrende Fahrzeuge sicher navigieren können.

Abb. 4. Glenn Jocher auf der Bühne bei YV24, wo er über YOLO11-Anwendungen spricht.

Ein weiteres interessantes Beispiel für die Reichweite von YOLO11 ist seine Fähigkeit, orientierte Bounding Boxes (OBB) zu verarbeiten. Sie ist wichtig, um Objekte zu erkennen, die nicht perfekt ausgerichtet sind. Die Erkennung von OBB-Objekten ist besonders in Branchen wie der Landwirtschaft, der Kartierung und der Überwachung nützlich, wo Bilder oft gedrehte Objekte wie Pflanzen oder Gebäude in Luft- oder Satellitenbildern enthalten. Im Gegensatz zu herkömmlichen Modellen kann YOLO11 Objekte in jedem Winkel erkennen und liefert viel genauere Ergebnisse für Aufgaben, die Präzision erfordern.

YOLO11 für KI-Entwickler: Probiere es selbst aus

Der Einstieg in YOLO11 ist einfach und zugänglich, egal ob du lieber mit oder ohne Code arbeitest. Wenn du mit YOLO11 über Code arbeiten möchtest, kannst du das PaketUltralytics Python verwenden, um Modelle einfach zu trainieren und einzusetzen. Wenn du lieber ohne Code arbeitest, kannst du mit Ultralytics HUB YOLO11 mit ein paar Klicks ausprobieren.

YOLO11 Code Walk-Through

Um YOLO11 mit Python zu verwenden, musst du zunächst das Paket Ultralytics installieren. Je nach deinen Vorlieben kannst du dies mit pip, conda oder Docker tun. Ausführliche Anweisungen und Best Practices für den Installationsprozess findest du in unserem Ultralytics Installationshandbuch. Wenn du bei der Installation der benötigten Pakete für YOLO11 auf Schwierigkeiten stößt, findest du in unserem Leitfaden für häufige Probleme Lösungen und Tipps.

Sobald du das Paket Ultralytics installiert hast, ist die Verwendung von YOLO11 ganz einfach. Der folgende Codeschnipsel führt dich durch den Prozess des Ladens eines Modells, des Trainings, des Testens der Leistung und des Exports ins ONNX Format. Ausführlichere Beispiele und fortgeschrittene Anwendungen findest du in der offiziellen Dokumentation Ultralytics . Dort findest du detaillierte Anleitungen und Best Practices, um das Beste aus YOLO11 herauszuholen.

Abb. 5. Verwendung von YOLO11 über das Ultralytics Paket. 

Für Nutzer, die einen codefreien Ansatz bevorzugen, bietet Ultralytics HUB eine einfache Möglichkeit, YOLO11-Modelle mit nur wenigen Klicks zu trainieren und einzusetzen. Um mit HUB loszulegen, musst du nur ein Konto auf der Ultralytics HUB-Plattform erstellen und schon kannst du mit dem Training und der Verwaltung deiner Modelle über eine intuitive Oberfläche beginnen.

YOLO11: Die Zukunft von Vision AI gestalten

Die KI-Gemeinschaft treibt die Entwicklung von Computer Vision ständig voran, um schnellere und genauere Modelle für reale Anwendungen zu entwickeln. Ultralytics YOLO11 ist ein wichtiger Meilenstein in diesem Bestreben, da es die Geschwindigkeit, Genauigkeit und Flexibilität verbessert. Es wurde für Echtzeit- und Edge-Anwendungen entwickelt und ist damit ideal für Branchen wie das Gesundheitswesen und autonomes Fahren. Egal, ob du das Ultralytics Python Paket oder den Ultralytics Hub ohne Code verwendest, YOLO11 vereinfacht komplexe Vision AI Aufgaben. Es bietet leistungsstarke Computer Vision-Funktionen und ist damit eine gute Wahl für Entwickler und Unternehmen.

Schau dir unser GitHub-Repository an und werde Teil unserer aktiven Community, um mehr über KI zu erfahren. Erfahre, wie Vision AI Innovationen in Bereichen wie dem Gesundheitswesen und der Landwirtschaft vorantreibt.

Facebook-LogoTwitter-LogoLinkedIn-LogoKopier-Link-Symbol

Lies mehr in dieser Kategorie

Lass uns gemeinsam die Zukunft
der KI gestalten!

Beginne deine Reise in die Zukunft des maschinellen Lernens