Erfahre alles über das neue Modell Ultralytics YOLO11 , seine Funktionen und Echtzeitanwendungen in verschiedenen Branchen. Wir führen dich durch alles, was du wissen musst.
Am Montag, den 30. September, stellte Ultralytics offiziell Ultralytics YOLO11die neueste Entwicklung auf dem Gebiet der Computer Vision, nachdem sie auf YOLO Vision 2024 (YV24), dem jährlichen Hybrid-Event von Ultralytics, vorgestellt wurde. Die KI-Gemeinde ist begeistert und erkundet eifrig die Möglichkeiten des Modells. Mit schnellerer Verarbeitung, höherer Genauigkeit und Modellen, die sowohl für Edge-Geräte als auch für den Einsatz in der Cloud optimiert sind, definiertYOLO11 die Möglichkeiten von Echtzeit-Computer-Vision-Anwendungen neu.
In einem Interview sagte der Gründer und CEO von Ultralytics , Glenn Jocher: "Die Welt entwickelt sich in Richtung saubere Energie, aber nicht schnell genug. Wir wollen, dass unsere Modelle in weniger Epochen, mit weniger Erweiterungen und weniger Daten trainiert werden können, also arbeiten wir hart daran. Das kleinste Objekterkennungsmodell, YOLO11n, hat nur 2,6 Millionen Parameter - etwa so groß wie ein JPEG, was wirklich verrückt ist. Das größte Objekterkennungsmodell, YOLO11x, hat etwa 56 Millionen Parameter, und selbst das ist unglaublich klein im Vergleich zu anderen Modellen. Du kannst sie auf einem billigen GPU trainieren, z. B. auf einem fünf Jahre alten Nvidia GPU , mit nur etwas Aufregung und ein bisschen Kaffee."
In diesem Artikel werfen wir einen genaueren Blick auf YOLO11 und untersuchen seine Funktionen, Verbesserungen, Leistungsvergleiche und realen Anwendungen, damit du verstehst, was dieses Modell leisten kann. Los geht's!
YOLO11 ist die neueste Weiterentwicklung der YOLO (You Only Look Once) Reihe von Computer Vision Modellen und bietet erhebliche Verbesserungen gegenüber früheren Versionen wie YOLOv5 und YOLOv8. Das Team von Ultralytics hat das Feedback der Community und die neuesten Forschungsergebnisse berücksichtigt, um YOLO11 schneller, genauer und effizienter zu machen. YOLO11 unterstützt die gleichen Computer Vision Aufgaben wie YOLOv8, einschließlich Objekterkennung, Instanzsegmentierung und Bildklassifizierung. Die Nutzer können ganz einfach zu YOLO11 wechseln, ohne ihre bestehenden Arbeitsabläufe ändern zu müssen.
Eines der wichtigsten Highlights von YOLO11 ist seine überlegene Leistung in Bezug auf Genauigkeit und Geschwindigkeit im Vergleich zu seinen Vorgängern. Mit 22% weniger Parametern als YOLOv8m erreicht YOLO11m eine höhere durchschnittliche Genauigkeit (mAP) auf dem COCO-Datensatz, was bedeutet, dass es Objekte präziser und effizienter erkennen kann. In Bezug auf die Verarbeitungsgeschwindigkeit übertrifft YOLO11 die Vorgängermodelle und ist damit ideal für Echtzeitanwendungen, bei denen eine schnelle Erkennung und Reaktion entscheidend sind und jede Millisekunde zählt.
Die folgende Benchmarking-Grafik zeigt, wie sich YOLO11 von früheren Modellen abhebt. Auf der horizontalen Achse wird die durchschnittliche Präzision (AP) der COCO Box angezeigt, die die Genauigkeit der Objekterkennung misst. Die vertikale Achse zeigt die Latenzzeit mit TensorRT10 FP16 auf einem NVIDIA T4 GPU, die angibt, wie schnell das Modell Daten verarbeitet.
Mit der Einführung von Ultralytics YOLO11 erweitert Ultralytics die YOLO Serie, indem es sowohl Open-Source- als auch Enterprise-Modelle anbietet, um der wachsenden Nachfrage in allen Branchen gerecht zu werden.
YOLO11 bietet fünf verschiedene Modellgrößen - Nano, Small, Medium, Large und X. Die Nutzer können das beste Modell je nach den spezifischen Anforderungen ihrer Computer-Vision-Anwendung auswählen. Die fünf Größen bieten Flexibilität bei Aufgaben wie Bildklassifizierung, Objekterkennung, Instanzsegmentierung, Verfolgung, Posenschätzung und OBB-Objekterkennung (Oriented Bounding Boxes). Für jede Größe gibt es ein Modell für jede Aufgabe, so dass insgesamt 25 Open-Source-Modelle den Kern des Angebots von Ultralytics bilden. Diese Modelle sind ideal für eine breite Palette von Anwendungen, von leichten Aufgaben auf Edge Devices, bei denen das YOLO11n-Modell eine beeindruckende Effizienz bietet, bis hin zu größeren Anwendungen, die die YOLO11l- und YOLO11x-Modelle erfordern.
Zum ersten Mal führt Ultralytics Unternehmensmodelle ein und setzt damit einen wichtigen Meilenstein in unserem Produktangebot. Wir freuen uns, diese neuen Innovationen mit unseren Nutzern zu teilen. YOLO11 stellt fünf eigene Modelle vor, die speziell für kommerzielle Anwendungsfälle entwickelt wurden. Diese Unternehmensmodelle, die ab nächstem Monat verfügbar sein werden, werden auf dem neuen, proprietären Datensatz von Ultralyticstrainiert, der aus über 1 Million Bildern besteht und robustere, vortrainierte Modelle bietet. Sie wurden für anspruchsvolle, reale Anwendungen entwickelt, wie z. B. die Analyse medizinischer Bilder und die Verarbeitung von Satellitenbildern, bei denen eine präzise Objekterkennung entscheidend ist.
Nachdem wir nun besprochen haben, was YOLO11 bietet, lass uns einen Blick darauf werfen, was YOLO11 so besonders macht.
Eine der größten Herausforderungen bei der Entwicklung von YOLO11 war es, die richtige Balance zwischen konkurrierenden Prioritäten zu finden: die Modelle kleiner, schneller und genauer zu machen. Glenn Jocher, Gründer und Geschäftsführer von Ultralytics, erklärt: "DieArbeit an der YOLO Forschung und Entwicklung ist eine echte Herausforderung, weil man in drei verschiedene Richtungen gehen will: Man will die Modelle kleiner machen, man will sie genauer machen, aber man will auch, dass sie auf verschiedenen Plattformen wie CPU und GPU schneller sind. All das sind konkurrierende Interessen, also muss man Kompromisse eingehen und entscheiden, wo man Änderungen vornimmt." Trotz dieser Herausforderungen erreicht YOLO11 eine beeindruckende Ausgewogenheit und bietet sowohl Geschwindigkeits- als auch Genauigkeitsverbesserungen gegenüber früheren Versionen wie YOLOv8.
YOLO11 bringt wesentliche Verbesserungen mit sich, z. B. eine verbesserte Merkmalsextraktion mit einer neu gestalteten Backbone- und Neck-Architektur, die zu einer präziseren Objekterkennung führt. Das Modell ist außerdem auf Geschwindigkeit und Effizienz optimiert und bietet schnellere Verarbeitungszeiten bei gleichbleibend hoher Genauigkeit. Zusätzlich zu diesen Vorteilen istYOLO11 äußerst anpassungsfähig in verschiedenen Umgebungen und funktioniert nahtlos auf Edge-Geräten, Cloud-Plattformen und Systemen mit NVIDIA GPUs. Diese Anpassungsfähigkeit macht sie zur idealen Wahl für Nutzer/innen, die flexible Einsatzoptionen für verschiedene Hardwarekonfigurationen benötigen, von mobilen Geräten bis hin zu großen Servern.
YOLO11Die Vielseitigkeit der Software macht sie in vielen Branchen zu einem zuverlässigen Werkzeug, vor allem wenn es um komplexe Anwendungsfälle geht. Es funktioniert zum Beispiel nahtlos auf Edge-Geräten und kann für Anwendungen eingesetzt werden, die Echtzeitanalysen in Umgebungen mit begrenzter Rechenleistung erfordern. Ein hervorragendes Beispiel dafür ist das autonome Fahren, bei dem Fahrzeuge in Sekundenbruchteilen Entscheidungen treffen müssen, um die Sicherheit aller Beteiligten zu gewährleisten. YOLO11 hilft dabei, indem es Objekte auf der Straße, wie Fußgänger oder andere Autos, selbst unter schwierigen Bedingungen wie schlechten Lichtverhältnissen oder wenn Dinge teilweise verdeckt sind, erkennt und analysiert. Eine schnelle und genaue Erkennung hilft, Unfälle zu vermeiden und sorgt dafür, dass selbstfahrende Fahrzeuge sicher navigieren können.
Ein weiteres interessantes Beispiel für die Reichweite von YOLO11ist die Fähigkeit, orientierte Bounding Boxes (OBB) zu verarbeiten. Sie ist wichtig, um Objekte zu erkennen, die nicht perfekt ausgerichtet sind. Die Erkennung von OBB-Objekten ist besonders in Branchen wie der Landwirtschaft, der Kartierung und der Überwachung nützlich, wo Bilder oft gedrehte Objekte wie Pflanzen oder Gebäude in Luft- oder Satellitenbildern enthalten. Anders als herkömmliche Modelle kann YOLO11 Objekte in jedem Winkel erkennen und liefert viel genauere Ergebnisse für Aufgaben, die Präzision erfordern.
Der Einstieg in YOLO11 ist einfach und zugänglich, egal ob du lieber mit oder ohne Code arbeitest. Wenn du mit YOLO11 über Code arbeiten möchtest, kannst du das Ultralytics Python Paket verwenden, um Modelle einfach zu trainieren und einzusetzen. Wenn du lieber ohne Code arbeitest, kannst du mit Ultralytics HUB YOLO11 mit nur wenigen Klicks ausprobieren.
Um YOLO11 mit Python zu verwenden, musst du zuerst das Paket Ultralytics installieren. Je nach deinen Vorlieben kannst du dies mit pip, conda oder Docker tun. Ausführliche Anweisungen und Best Practices für den Installationsprozess findest du in unserem Ultralytics Installationshandbuch. Wenn du bei der Installation der erforderlichen Pakete für YOLO11 auf Schwierigkeiten stößt, findest du in unserem Leitfaden für häufige Probleme Lösungen und Tipps.
Wenn du das Paket Ultralytics installiert hast, ist die Verwendung von YOLO11 ganz einfach. Das folgende Codeschnipsel führt dich durch den Prozess des Ladens eines Modells, des Trainings, der Leistungsprüfung und des Exports in das FormatONNX . Ausführlichere Beispiele und fortgeschrittene Anwendungen findest du in der offiziellen Dokumentation Ultralytics , wo du detaillierte Anleitungen und Best Practices findest, um das Beste aus YOLO11 herauszuholen.
Für Nutzer, die einen no-code Ansatz bevorzugen, bietet Ultralytics HUB eine einfache Möglichkeit, YOLO11 Modelle mit nur wenigen Klicks zu trainieren und einzusetzen. Um mit HUB loszulegen, musst du nur ein Konto auf der Ultralytics HUB-Plattform erstellen und schon kannst du deine Modelle über eine intuitive Oberfläche trainieren und verwalten.
Die KI-Gemeinschaft treibt die Entwicklung schnellerer und präziserer Modelle für reale Anwendungen voran. Ultralytics YOLO11 ist ein wichtiger Meilenstein in diesem Bestreben, der Geschwindigkeit, Genauigkeit und Flexibilität verbessert. Er wurde für Echtzeit- und Randanwendungen entwickelt und ist damit ideal für Branchen wie das Gesundheitswesen und autonomes Fahren. Ob du das Ultralytics Python Paket oder den Ultralytics Hub ohne Code verwendest, YOLO11 vereinfacht komplexe Vision AI Aufgaben. Sie bietet leistungsstarke Computer Vision-Funktionen und ist damit eine gute Wahl für Entwickler und Unternehmen.
Schau dir unser GitHub-Repository an und werde Teil unserer aktiven Community, um mehr über KI zu erfahren. Erfahre, wie Vision AI Innovationen in Bereichen wie dem Gesundheitswesen und der Landwirtschaft vorantreibt.
Beginne deine Reise in die Zukunft des maschinellen Lernens