Grüner Scheck
Link in die Zwischenablage kopiert

Wie man Ultralytics YOLO11 für die Bildklassifizierung verwendet

Erfahre, wie das neue Modell Ultralytics YOLO11 die Bildklassifizierung verbessert und eine höhere Genauigkeit für Aufgaben in der Landwirtschaft, im Einzelhandel und bei der Überwachung von Wildtieren bietet.

Nehmen wir an, ein Roboter sieht zwei Katzen, eine schwarze und eine weiße, und er muss herausfinden, welche die richtige ist. Dazu kann er die Bildklassifizierung nutzen, eine Aufgabe der Computer Vision, die hilft, Objekte oder Szenen in einem Bild zu identifizieren und zu kategorisieren. Dank der jüngsten Fortschritte in der künstlichen Intelligenz (KI) kann die Bildklassifizierung in einer Vielzahl von Anwendungen eingesetzt werden, von der Tierüberwachung über die Produktion bis hin zur Erkennung von Pflanzenkrankheiten in der Landwirtschaft.

Eine der neuesten Entwicklungen in der Bildklassifizierung ist das Ultralytics YOLO11 Modell. Es wurde auf der jährlichen Hybrid-VeranstaltungUltralytics YOLO Vision 2024 (YV24) vorgestellt, YOLO11 wurde entwickelt, um eine Vielzahl von KI-Aufgaben, einschließlich der Bildklassifizierung, mit Leichtigkeit und Präzision zu bewältigen.

In diesem Artikel gehen wir auf die Grundlagen der Bildklassifizierung ein, diskutieren reale Anwendungen und zeigen dir, wie du YOLO11 für die Bildklassifizierung über das PaketUltralytics Python nutzen kannst. Außerdem schauen wir uns an, wie du die Möglichkeiten vonYOLO11 auf dem Ultralytics HUB in ein paar einfachen Schritten ausprobieren kannst. Los geht's!

Abb. 1. Ein Beispiel für die Verwendung von Ultralytics YOLO11 zur Klassifizierung einer Perserkatze.

Was ist Bildklassifizierung?

Bei der Bildklassifizierung wird einem Bild ein Etikett oder eine Markierung zugewiesen, die auf Mustern basiert, die aus zuvor markierten Bildern gelernt wurden. Durch eine sorgfältige Analyse der Pixel eines Bildes kann ein Computer-Vision-Modell die beste Übereinstimmung für das Bild finden. Zuverlässige Modelle wie YOLO11 können diesen Prozess nahtlos durchführen. YOLO11Die Modellarchitektur von Computer Vision ermöglicht es, Bilder oder Videoframes fast augenblicklich zu verarbeiten, was sie ideal für Anwendungen macht, die eine schnelle und genaue Bildklassifizierung benötigen.

Um den Umfang der Bildklassifizierung wirklich zu verstehen, ist es hilfreich, sie von anderen Aufgaben wie der Objekterkennung zu unterscheiden. Während die Bildklassifizierung ein ganzes Bild kennzeichnet, identifiziert und lokalisiert die Objekterkennung jedes Objekt im Bild. 

Abb. 2. Ein Vergleich von Bildklassifizierung, Objekterkennung und Bildsegmentierung.

Betrachten wir ein Bild einer Giraffe. Bei der Bildklassifizierung könnte das Modell das gesamte Bild aufgrund seines Inhalts einfach als Giraffe bezeichnen. Bei der Objekterkennung beschränkt sich das Modell jedoch nicht nur auf die Identifizierung der Giraffe, sondern legt auch eine Bounding Box um die Giraffe, um ihre genaue Position im Bild zu bestimmen.

Nun stell dir vor, die Giraffe steht in der Nähe eines Baumes in einer Savanne mit anderen Tieren. Ein Bildklassifizierungsmodell könnte die gesamte Szene als Savanne oder nur als Wildtiere bezeichnen. Bei der Objekterkennung würde das Modell jedoch jedes Element einzeln identifizieren und die Giraffe, den Baum und die anderen Tiere erkennen, jeweils mit ihren eigenen Bounding Boxes.

YOLO11 Anwendungen zur Bildklassifizierung

Die Genauigkeit und Leistung des Ultralytics YOLO11 Modells für die Bildklassifizierung macht es für eine Vielzahl von Branchen nützlich. Im Folgenden werden einige der wichtigsten Anwendungen von YOLO11 für die Bildklassifizierung vorgestellt.

YOLO11 Bildklassifizierung in der Landwirtschaft

Die Bildklassifizierung kann dazu beitragen, viele Funktionen in der Landwirtschaft und im Ackerbau zu optimieren. Mithilfe von Bildklassifizierungsmodellen wie YOLO11 können Landwirte den Gesundheitszustand ihrer Ernten ständig überwachen, schwere Krankheiten erkennen und Schädlingsbefall mit hoher Genauigkeit identifizieren. 

Hier ist ein Blick darauf, wie das funktioniert:

  • Bilderfassung: Internet of Things (IoT)-Geräte wie Kameras und Drohnen können eingesetzt werden, um in Echtzeit Bilder von den Feldern aus verschiedenen Blickwinkeln und an verschiedenen Orten aufzunehmen.
  • Verarbeitung: Je nach verfügbaren Ressourcen und Konnektivität können die Bilder vor Ort durch Edge Computing verarbeitet oder für eine intensivere Analyse in die Cloud hochgeladen werden.
  • Bildklassifizierung mit YOLO11: Das Modell YOLO11 kann diese Bilder analysieren, um verschiedene Erntebedingungen zu klassifizieren. Übliche Klassen sind z. B. gesund, krank, von Schädlingen befallen oder mit Nährstoffmangel behaftet, um bestimmte Probleme in verschiedenen Bereichen des Feldes zu erkennen.
  • Einblicke generieren: Anhand der Klassifizierungen liefert YOLO11 Einblicke in die Indikatoren für den Gesundheitszustand der Pflanzen und hilft den Landwirten, frühe Anzeichen von Krankheiten zu erkennen, Schädlingsherde zu identifizieren oder Nährstoffmängel festzustellen.
  • Informierte Entscheidungsfindung: Mit diesen Erkenntnissen können die Landwirte gezielte Entscheidungen über Bewässerung, Düngung und Schädlingsbekämpfung treffen und die Ressourcen nur dort einsetzen, wo sie am meisten gebraucht werden.
Abb. 3. Ein Beispiel für verschiedene Klassen von Blättern, von gesund bis infiziert.

YOLO11 Bildklassifizierung im Einzelhandel

Die Bildklassifizierung kann das Einkaufserlebnis im Einzelhandel erheblich verbessern, indem sie es personalisierter und benutzerfreundlicher macht. Einzelhändler können speziell trainierte Computer-Vision-Modelle verwenden, um Produkte in ihrem Bestand zu erkennen und diese Fähigkeit in ihre mobilen Apps oder Websites zu integrieren. Die Kunden können dann einfach durch Hochladen eines Fotos nach Produkten suchen und so schneller und bequemer einkaufen.

Sobald ein Kunde ein Bild in ein visuelles Suchsystem hochlädt, passieren hinter den Kulissen mehrere Dinge, bevor die Suchergebnisse angezeigt werden. 

Zunächst kann die Objekterkennung dazu verwendet werden, die wichtigsten Gegenstände im Bild zu erkennen, z. B. ein Kleidungsstück oder ein Möbelstück, und es vom Hintergrund zu trennen. Mit der Bildklassifizierung kann jedes Objekt weiter kategorisiert werden, indem erkannt wird, ob es sich um eine Jacke, ein Hemd, ein Sofa oder einen Tisch handelt. 

Mit diesen Informationen kann das System ähnliche Produkte finden, die zum Kauf angeboten werden. Das ist besonders hilfreich, um einzigartige oder trendige Artikel zu finden, die mit Worten allein schwer zu beschreiben sind. Dieselbe Technologie kann auch dazu beitragen, andere Aufgaben im Einzelhandel, wie z. B. die Bestandsverwaltung, zu rationalisieren, indem Artikel automatisch erkannt und kategorisiert werden.

Abb. 4. Eine auf Bildklassifizierung basierende visuelle Suchplattform in Aktion.

Wildtierüberwachung mit YOLO11 Bildklassifizierung

Traditionell ist die Überwachung von Tieren in freier Wildbahn eine mühsame Aufgabe, bei der viele Menschen Tausende von Fotos manuell sortieren und analysieren müssen. Mit Computer-Vision-Verfahren wie YOLO11 können Forscher/innen Tiere automatisch und schneller überwachen. Kameras können in natürlichen Lebensräumen platziert werden, um Fotos zu machen. Das KI-Modell kann dann verwendet werden, um diese Fotos zu analysieren und die Tiere darauf zu klassifizieren (falls vorhanden). Ein solches System kann Forschern helfen, Tierpopulationen, ihre Wanderungsmuster usw. zu untersuchen und zu verfolgen.

Eine weitere Möglichkeit, wie KI- und Computer-Vision-Modelle wie YOLO11 in diesem Bereich helfen können, ist die Vereinfachung der Klassifizierung von gefährdeten Arten. Indem sie potenzielle Arten oder Rassenkategorien identifizieren, zu denen ein Tier gehören könnte, können diese Modelle wichtige Daten für Forscher/innen liefern. Die Universität von Tasmanien (UTAS) hat zum Beispiel ein bildbasiertes Klassifizierungssystem entwickelt, um verschiedene tasmanische Wildtiere zu überwachen. Die Vorhersagen aus den Modellen können Wissenschaftlern und Forschern dabei helfen, die Aktivitäten und das Verhalten der Tiere im Auge zu behalten, die auf Bedrohungen wie Wilderei oder Lebensraumverlust hinweisen können. 

Abb. 5. YOLO11 die Vorhersage der möglichen Rassen, zu denen ein Hund gehören könnte.

Ausprobieren der Bildklassifizierung mit dem YOLO11 Modell

Nachdem wir nun besprochen haben, was Bildklassifizierung ist und einige ihrer Anwendungen kennengelernt haben. Sehen wir uns nun an, wie du die Bildklassifizierung mit dem neuen Modell YOLO11 ausprobieren kannst. Es gibt zwei einfache Möglichkeiten, damit zu beginnen: mit dem PaketUltralytics Python oder mit Ultralytics HUB. Wir werden beide Möglichkeiten durchgehen.

Rückschlüsse ziehen mit YOLO11

Um mit dem Paket Ultralytics Python zu beginnen, installiere es einfach mit pip, conda oder Docker. Solltest du auf Probleme stoßen, findest du in unserem Leitfaden für häufige Probleme hilfreiche Tipps zur Fehlerbehebung.

Sobald das Paket installiert ist, kannst du den folgenden Code verwenden, um eine Variante des YOLO11 Bildklassifizierungsmodells zu laden und eine Schlussfolgerung für ein Bild durchzuführen. Eine Inferenz bedeutet, dass ein trainiertes Modell verwendet wird, um Vorhersagen für neue, ungesehene Daten zu treffen. Du kannst es mit einem Bild deiner Wahl ausprobieren!

Abb. 6. Durchführung von Schlussfolgerungen mit dem YOLO11 Modell.

Training eines benutzerdefinierten YOLO11 Klassifizierungsmodells

Du kannst dasselbe Python Paket auch verwenden, um ein benutzerdefiniertes YOLO11 Klassifizierungsmodell zu trainieren. Das benutzerdefinierte Training ermöglicht es dir, ein YOLO11 Modell auf deine speziellen Bedürfnisse abzustimmen. Wenn du zum Beispiel eine App entwickelst, um verschiedene Katzenrassen zu klassifizieren, kannst du ein YOLO11 Modell speziell für diesen Zweck trainieren.

Der folgende Code zeigt, wie man ein YOLO11 Bildklassifizierungsmodell lädt und trainiert. Er ermöglicht es dir, bereits trainierte Gewichte zu übertragen und das Wissen aus einem bestehenden Modell zu nutzen, um die Leistung deines eigenen Modells zu verbessern. Du kannst einen Datensatz angeben, z. B. den "fashion-mnist"-Datensatz, der eine bekannte Sammlung von Graustufenbildern von Kleidungsstücken (Hemden, Hosen, Schuhe usw.) enthält. Wenn du das Modell mit diesem Datensatz trainierst, lernt es, verschiedene Kleidungskategorien zu erkennen. Du kannst "fashion-mnist" gegen einen beliebigen Datensatz austauschen, der zu deinem Projekt passt, z. B. Katzenrassen oder Pflanzenarten.

Abb. 7. Individuelles Training eines YOLO11 Modells zur Bildklassifizierung.

Probiere YOLO11 auf Ultralytics HUB aus

Die Verwendung des Pakets Ultralytics ist zwar einfach, erfordert aber einige Kenntnisse über Python. Wenn du nach einer einsteigerfreundlicheren Option suchst, kannst du den Ultralytics HUB nutzen, eine Plattform, die die Schulung und den Einsatz verschiedener YOLO Modelle einfach und zugänglich macht. Um loszulegen, musst du ein Konto erstellen.

Sobald du eingeloggt bist, navigierst du zum Bereich "Modelle" und wählst das Modell YOLO11 für die Bildklassifizierung aus. Es stehen verschiedene Modellgrößen zur Verfügung: nano, klein, mittel, groß und extragroß. Nachdem du dich für ein Modell entschieden hast, kannst du ein Bild im Bereich "Vorschau" hochladen, wo die Vorhersagen auf der linken Seite erscheinen, sobald das Bild verarbeitet wurde.

Abb. 8. Verwendung von Ultralytics HUB, um eine Inferenz durchzuführen.

Die wichtigsten Erkenntnisse

YOLO11 bietet leistungsstarke Bildklassifizierungsfunktionen, die in verschiedenen Branchen neue Möglichkeiten eröffnen. Von der Verbesserung der Ernteüberwachung in der Landwirtschaft über die Verbesserung der Produktsuche im Einzelhandel bis hin zur Unterstützung des Artenschutzes - die Geschwindigkeit und Genauigkeit von YOLO11macht es ideal für verschiedene Anwendungen. Mit den Optionen für benutzerdefinierte Schulungen über das Ultralytics Python Paket oder einer benutzerfreundlichen, codefreien Einrichtung auf Ultralytics HUB können Nutzer/innen YOLO11 leicht in ihre Arbeitsabläufe einbinden. Da immer mehr Branchen KI-Lösungen einsetzen, bietet YOLO11 ein flexibles, leistungsstarkes Werkzeug, das Innovationen und praktische Fortschritte unterstützt.

Um mehr zu erfahren, besuche unser GitHub-Repository und beteilige dich an unserer Community. Entdecke KI-Anwendungen in selbstfahrenden Autos und im Gesundheitswesen auf unseren Lösungsseiten. 🚀

Facebook-LogoTwitter-LogoLinkedIn-LogoKopier-Link-Symbol

Lies mehr in dieser Kategorie

Lass uns gemeinsam die Zukunft
der KI gestalten!

Beginne deine Reise in die Zukunft des maschinellen Lernens