Verstehe, wie das neue Modell Ultralytics YOLO11 für die Segmentierung von Beispielen verwendet werden kann, um eine höhere Präzision in Anwendungen wie Abfallwirtschaft und Fackelüberwachung zu erreichen.
Computer Vision, ein Bereich der künstlichen Intelligenz (KI), der Maschinen hilft, visuelle Informationen zu interpretieren und zu verstehen, ermöglicht Aufgaben wie die Segmentierung von Objekten. Mit der Instanzensegmentierung kann ein Bild oder ein Videobild analysiert werden, um die genauen Grenzen jedes einzelnen Objekts im Bild zu markieren, selbst wenn mehrere Objekte desselben Typs vorhanden sind. Dank ihrer hohen Präzision bietet die Instanzensegmentierung eine Vielzahl von Anwendungsmöglichkeiten, von der Unterstützung selbstfahrender Autos bei der Erkennung von Hindernissen auf der Straße bis hin zur Identifizierung von Tumoren in medizinischen Scans.
Im Laufe der Jahre hat sich die Segmentierung der Instanzen erheblich weiterentwickelt. Eine neue Entwicklung wurde auf der jährlichen Hybrid-Veranstaltung von Ultralytics, YOLO Vision 2024 (YV24), in Form des Modells Ultralytics YOLO11 vorgestellt. Das neue Modell unterstützt dieselben Computer-Vision-Aufgaben (einschließlich der Instanzsegmentierung) wie das Ultralytics YOLOv8 Das neue Modell unterstützt dieselben Computer Vision Aufgaben, wie das Modell YOLO11, so dass Benutzer, die mit den vorherigen Versionen vertraut sind, das neue Modell nahtlos übernehmen können.
In diesem Artikel werden wir uns mit der Instanzensegmentierung befassen und herausfinden, wie sie sich von anderen Bildverarbeitungsaufgaben wie der semantischen Segmentierung unterscheidet, sowie einige ihrer Anwendungen besprechen. Außerdem zeigen wir dir, wie du das YOLO11 Instanzsegmentierungsmodell mit dem Ultralytics Python Paket und der Ultralytics HUB Plattform nutzen kannst. Los geht's!
Die Instanzsegmentierung kann dazu verwendet werden, Objekte in einem Bild zu identifizieren und sie auf Pixelebene zu umreißen. In der Regel werden dabei zunächst Objekte erkannt und Bounding Boxes um sie herum gezeichnet. Dann klassifiziert ein Segmentierungsalgorithmus jedes Pixel innerhalb der Bounding Box, um eine präzise Maske für jedes Objekt zu erstellen.
Die Instanzsegmentierung unterscheidet sich auch von Aufgaben wie der semantischen Segmentierung und der panoptischen Segmentierung. Bei der semantischen Segmentierung wird jedes Pixel anhand der allgemeinen Kategorie eines Objekts gekennzeichnet, ohne dass einzelne Instanzen unterschieden werden. Die panoptische Segmentierung hingegen kombiniert sowohl die Instanz- als auch die semantische Segmentierung, indem sie jedes Pixel sowohl mit einer Klassen- als auch mit einer Instanz-ID kennzeichnet und so die einzelnen Objekte innerhalb jeder Kategorie identifiziert.
Die Möglichkeiten der Instanzensegmentierung können in verschiedenen Szenarien eingesetzt werden, die unterschiedliche Modelle erfordern können. Ein leichtgewichtiges Modell könnte zum Beispiel ideal für die Echtzeitverarbeitung in mobilen Anwendungen sein, während ein komplexeres Modell für hochpräzise Aufgaben wie die Qualitätskontrolle in der Fertigung verwendet werden könnte.
Wie bei den Vorgängermodellen gibt es auch bei der YOLO11-Instanzentrennung mehrere Varianten, die auf deine Bedürfnisse abgestimmt sind. Zu diesen Varianten gehören YOLO11n-seg (Nano), YOLO11s-seg (Small), YOLO11m-seg (Medium), YOLO11l-seg (Large) und YOLO11x-seg (Extra Large). Diese Modelle unterscheiden sich in Bezug auf ihre Größe, Verarbeitungsgeschwindigkeit, Genauigkeit und die benötigte Rechenleistung. Je nach deinen spezifischen Anforderungen kannst du das Modell wählen, das am besten zu deiner Anwendung passt.
Die fortschrittlichen Instanzsegmentierungsfunktionen von YOLO11 eröffnen eine Reihe von Anwendungen in verschiedenen Branchen. Werfen wir einen genaueren Blick auf einige dieser Anwendungen.
Bei der Öl- und Gasförderung müssen extrem hohe Druckschwankungen bewältigt werden. Techniken wie das Abfackeln von Gas helfen dabei, das bei der Ölförderung entstehende Erdgas abzubrennen. Dies ist aus Sicherheitsgründen notwendig. Bei der Erdölförderung zum Beispiel könnte ein plötzlicher oder starker Druckanstieg zu einer Explosion führen. Obwohl sie selten vorkommen, können Industrieunfälle in der Öl- und Gasförderung zu schweren Bränden führen, die schwer einzudämmen und zu kontrollieren sind. Das Abfackeln von Gas hilft den Betreibern, den Druck in den Anlagen sicher abzubauen und unvorhersehbare, große Druckschwankungen zu bewältigen, indem sie das überschüssige Gas abbrennen.
KI-Systeme können diesen Überwachungsprozess verbessern, und das Risiko von Unfällen kann durch den Einsatz eines auf Instanzsegmentierung basierenden Fackelüberwachungssystems verringert werden. Die Überwachung des Abfackelns von Gas ist auch aus Gründen des Umweltschutzes wichtig, denn zu viel Abfackeln kann sich negativ auf die Umwelt auswirken.
Ultralytics Die YOLO11-Instanzsegmentierungsmodelle können verwendet werden, um die durch das Abfackeln verursachte Feuer- und Rauchmenge zu überwachen. Die Pixelfläche des erkannten und segmentierten Abfackelns und Rauchs kann berechnet werden. Anhand dieser Informationen können die Betreiber in Echtzeit Einblicke in die durch das Abfackeln verursachten Fackeln und den Rauch gewinnen und so Unfälle und negative Auswirkungen auf die Umwelt verhindern.
Arbeiter in der Abfallwirtschaft und in Recyclinganlagen können mit YOLO11 segmentierungsbasierte Systeme nutzen, um Kunststoffabfälle zu identifizieren. YOLO11 kann in Robotersortiersysteme integriert werden, um verschiedene Abfallmaterialien wie Pappe und Plastik (die getrennt verarbeitet werden müssen) genau zu identifizieren. Das ist besonders wichtig, wenn man bedenkt, dass von den 7 Milliarden Tonnen Kunststoffabfall, die weltweit anfallen, nur etwa 10% recycelt werden.
Durch die Automatisierung der Identifizierung und Sortierung von Kunststoffabfällen wird der Zeitaufwand im Vergleich zu herkömmlichen Methoden, bei denen die Arbeiter/innen die Gegenstände von Hand sortieren, erheblich reduziert. Computer-Vision-Modelle können sogar weiche Kunststoffe wie Verpackungen und Tüten sortieren, die besonders schwierig sind, weil sie sich oft verheddern. Die YOLO11-Modelle können auch individuell trainiert werden, um verschiedene Arten von Kunststoffen zu unterscheiden. In den folgenden Abschnitten erfährst du mehr darüber, wie du ein YOLO11-Modell individuell trainieren kannst.
Ein weiterer interessanter Anwendungsfall für die Instanzsegmentierung sind autonome Autos. Mit YOLO11 können selbstfahrende Autos die Sicherheit der Insassen und anderer Verkehrsteilnehmer verbessern, indem sie Objekte auf Pixelebene genau erkennen. Das bordeigene Kamerasystem des Autos kann Bilder der Umgebung aufnehmen und sie mit YOLO11 und Instanzsegmentierung analysieren. Jedes Objekt (Fußgänger, Ampeln, andere Fahrzeuge usw.) im Bild wird segmentiert und mit einem Label versehen. Dank dieser Präzision können autonome Autos jedes einzelne Objekt in ihrer Umgebung identifizieren.
Nachdem wir nun die Instanzsegmentierung erkundet und einige ihrer Anwendungen besprochen haben, wollen wir sehen, wie du sie mit dem Modell Ultralytics YOLO11 ausprobieren kannst.
Es gibt zwei Möglichkeiten, dies zu tun: Du kannst entweder das Ultralytics Python Paket oder den Ultralytics HUB verwenden. Wir werden beides ausprobieren und mit dem Python Paket beginnen.
Beim Ausführen einer Inferenz wird das Modell verwendet, um neue, bisher ungesehene Daten zu analysieren. Um eine Inferenz mit dem YOLO11-Instanzsegmentierungsmodell durch Code auszuführen, müssen wir das PaketUltralytics Python mit pip, conda oder docker installieren. Solltest du bei der Installation Probleme haben, kannst du in unserem Leitfaden für häufige Probleme nachlesen, wie du sie beheben kannst. Sobald das Paket installiert ist, kannst du den unten gezeigten Code ausführen, um das YOLO11-Instanzsegmentierungsmodell zu laden und Vorhersagen für ein Bild zu treffen.
Mit demselben Code-Setup kannst du auch ein benutzerdefiniertes YOLO11-Modell trainieren. Durch die Feinabstimmung eines YOLO11-Modells kannst du eine benutzerdefinierte Version des Modells erstellen, die deine spezifischen Projektanforderungen besser erfüllt. Einzelhändler können zum Beispiel ein benutzerdefiniertes Modell verwenden, um die körperlichen Merkmale eines Kunden genau zu segmentieren und ihm Kleidung zu empfehlen, die richtig passt. Das folgende Codeschnipsel zeigt, wie du ein YOLO11-Modell für die Instanzsegmentierung laden und trainieren kannst. Du kannst von einer YAML-Konfiguration oder einem bereits trainierten Modell ausgehen, Gewichte übertragen und auf einem Datensatz wie COCO trainieren, um eine effektive Segmentierung zu erreichen.
Nach der Fertigstellung kannst du mit dem benutzerdefinierten Modell Rückschlüsse für deine spezifischen Anwendungen ziehen. Mit der Exportoption kannst du dein benutzerdefiniertes Modell auch in ein anderes Format exportieren.
Nachdem wir uns nun mit der Durchführung von Inferenzen und dem Training eines YOLO11-Instanzsegmentierungsmodells durch Code beschäftigt haben, wollen wir uns nun eine Alternative ohne Code ansehen: Ultralytics HUB. Ultralytics HUB ist eine intuitive Vision AI-Plattform, die das Training und den Einsatz von YOLO Modellen, einschließlich der YOLO11 Instanzsegmentierungsmodelle, vereinfacht.
Um Bilder zu analysieren, musst du nur ein Konto erstellen, zum Bereich "Modelle" gehen und die YOLO11-Instanzsegmentierungsmodellvariante deiner Wahl auswählen. Du kannst ein Bild hochladen und dir die Vorhersageergebnisse im Vorschaubereich ansehen, wie unten gezeigt.
YOLO11 bietet zuverlässige Instanzsegmentierungsfähigkeiten, die eine Welt der Möglichkeiten in verschiedenen Branchen eröffnen. Ob es darum geht, die Sicherheit in autonomen Fahrzeugen zu erhöhen, das Abfackeln von Gas im Öl- und Gassektor zu überwachen oder die Müllsortierung in Recyclinganlagen zu automatisieren - die pixelgenaue Präzision von YOLO11 ist ideal für komplexe Segmentierungsaufgaben.
Mit den Optionen für benutzerdefinierte Schulungen über das Ultralytics Python Paket und einer No-Code-Einrichtung über Ultralytics HUB können Nutzer YOLO11 nahtlos in ihre Arbeitsabläufe integrieren. Ob in der Industrie, im Gesundheitswesen, im Einzelhandel oder bei der Umweltüberwachung, YOLO11 bietet Flexibilität und Genauigkeit für die unterschiedlichsten Segmentierungsanforderungen.
Um mehr zu erfahren, besuche unser GitHub-Repository und beteilige dich an unserer Community. Erforsche KI-Anwendungen in selbstfahrenden Autos und in der Landwirtschaft auf unseren Lösungsseiten. 🚀
Beginne deine Reise in die Zukunft des maschinellen Lernens