So verwenden Sie Ultralytics YOLO11 für die Bildklassifizierung

Abirami Vina

4 Minuten lesen

11. November 2024

Erfahren Sie, wie das neue Ultralytics YOLO11-Modell die Bildklassifizierung verbessert und eine höhere Genauigkeit für Aufgaben in der Landwirtschaft, im Einzelhandel und bei der Überwachung von Wildtieren bietet.

Nehmen wir an, ein Roboter sieht zwei Katzen, eine schwarze und eine weiße, und muss herausfinden, welche die richtige ist. Dazu kann er die Bildklassifizierung verwenden, eine Aufgabe der Computer Vision, die hilft, Objekte oder Szenen in einem Bild zu identifizieren und zu kategorisieren. Dank der jüngsten Fortschritte im Bereich der künstlichen Intelligenz (KI) kann die Bildklassifizierung in einer Vielzahl von Anwendungen eingesetzt werden, die von der Tierüberwachung über die Fertigung bis hin zur Landwirtschaft mit der Erkennung von Pflanzenkrankheiten reichen.

Eine der neuesten Entwicklungen auf dem Gebiet der Bildklassifizierung ist das Modell YOLO11 von Ultralytics. YOLO11 wurde auf der jährlichen Hybrid-Veranstaltung von Ultralytics, der YOLO Vision 2024 (YV24), vorgestellt und ist darauf ausgelegt, eine Vielzahl von KI-Aufgaben, einschließlich der Bildklassifizierung, mit Leichtigkeit und Präzision zu bewältigen.

In diesem Artikel gehen wir auf die Grundlagen der Bildklassifizierung ein, erörtern reale Anwendungen und zeigen Ihnen, wie Sie YOLO11 über das Ultralytics Python-Paket für die Bildklassifizierung nutzen können. Wir werden auch einen Blick darauf werfen, wie Sie die Fähigkeiten von YOLO11 auf dem Ultralytics HUB in ein paar einfachen Schritten ausprobieren können. Los geht's!

__wf_reserved_inherit
Abb. 1. Ein Beispiel für die Verwendung von Ultralytics YOLO11 zur Klassifizierung einer Perserkatze.

Was ist Bildklassifizierung?

Bei der Bildklassifizierung wird einem Bild auf der Grundlage von Mustern, die aus zuvor gekennzeichneten Bildern gelernt wurden, ein Etikett oder eine Kennzeichnung zugewiesen. Durch sorgfältige Analyse der Pixel eines Bildes kann ein Computer-Vision-Modell die beste Übereinstimmung für das Bild finden. Zuverlässige Modelle wie YOLO11 können diesen Prozess nahtlos verarbeiten. Die Modellarchitektur von YOLO11 ermöglicht die nahezu sofortige Verarbeitung von Bildern oder Videoframes und ist damit ideal für Anwendungen, die eine schnelle und genaue Bildklassifizierung erfordern.

Um den Umfang der Bildklassifizierung wirklich zu verstehen, ist es hilfreich, sie von anderen Aufgaben wie der Objekterkennung zu unterscheiden. Während die Bildklassifizierung ein ganzes Bild kennzeichnet, identifiziert und lokalisiert die Objekterkennung jedes einzelne Objekt im Bild. 

__wf_reserved_inherit
Abbildung 2. Ein Vergleich von Bildklassifizierung, Objekterkennung und Bildsegmentierung.

Betrachten wir ein Bild einer Giraffe. Bei der Bildklassifizierung könnte das Modell das gesamte Bild auf der Grundlage des Gesamtinhalts einfach als Giraffe bezeichnen. Bei der Objekterkennung beschränkt sich das Modell jedoch nicht auf die Identifizierung der Giraffe, sondern legt auch einen Begrenzungsrahmen um die Giraffe, um ihre genaue Position im Bild zu bestimmen.

Stellen Sie sich nun vor, dass die Giraffe in der Nähe eines Baumes in einer Savanne mit anderen Tieren steht. Ein Bildklassifizierungsmodell könnte die gesamte Szene als Savanne oder nur als Wildtiere bezeichnen. Bei der Objekterkennung würde das Modell jedoch jedes Element einzeln identifizieren und die Giraffe, den Baum und die anderen Tiere jeweils mit ihren eigenen Bounding Boxes erkennen.

YOLO11-Anwendungen zur Bildklassifizierung

Die Genauigkeit und Leistung des YOLO11-Modells von Ultralytics für die Bildklassifizierung macht es in einer Vielzahl von Branchen nützlich. Lassen Sie uns einige der wichtigsten Anwendungen von YOLO11 in der Bildklassifizierung untersuchen.

YOLO11 Bildklassifizierung in der Landwirtschaft

Die Bildklassifizierung kann zur Rationalisierung zahlreicher Funktionen in der Landwirtschaft und der Agrarindustrie beitragen. Mithilfe von Bildklassifizierungsmodellen wie YOLO11 können Landwirte den Gesundheitszustand ihrer Ernten ständig überwachen, schwere Krankheiten erkennen und Schädlingsbefall mit hoher Genauigkeit identifizieren. 

Hier sehen Sie, wie das funktioniert:

  • Bilderfassung: Internet of Things (IoT)-Geräte wie Kameras und Drohnen können eingesetzt werden, um in Echtzeit Bilder von Pflanzen aus verschiedenen Blickwinkeln und von verschiedenen Standorten auf den Feldern aufzunehmen.
  • Verarbeitung: Je nach verfügbaren Ressourcen und Konnektivität können die Bilder vor Ort durch Edge Computing verarbeitet oder für eine intensivere Analyse in die Cloud hochgeladen werden.
  • Bildklassifizierung mit YOLO11: Das YOLO11-Modell kann diese Bilder analysieren, um verschiedene Erntebedingungen zu klassifizieren. Gängige Klassen sind z. B. gesund, krank, von Schädlingen befallen oder mit Nährstoffmangel behaftet, was dabei hilft, spezifische Probleme in verschiedenen Bereichen des Feldes zu erkennen.
  • Gewinnung von Erkenntnissen: Auf der Grundlage der Klassifizierungen liefert YOLO11 Einblicke in Indikatoren für den Gesundheitszustand von Pflanzen und hilft den Landwirten, frühe Anzeichen von Krankheiten zu erkennen, Schädlingsherde zu identifizieren oder Nährstoffmängel festzustellen.
  • Informierte Entscheidungsfindung: Mit diesen Erkenntnissen können Landwirte gezielte Entscheidungen über Bewässerung, Düngung und Schädlingsbekämpfung treffen und Ressourcen nur dort einsetzen, wo sie am dringendsten benötigt werden.
__wf_reserved_inherit
Abb. 3. Ein Beispiel für verschiedene Klassen von Blättern, von gesund bis infiziert.

YOLO11 Bildklassifizierung im Einzelhandel

Die Bildklassifizierung kann das Einkaufserlebnis im Einzelhandel erheblich verbessern, indem sie es personalisierter und benutzerfreundlicher macht. Einzelhändler können speziell geschulte Computer-Vision-Modelle verwenden, um Produkte in ihrem Bestand zu erkennen, und diese Funktion in ihre mobilen Apps oder Websites integrieren. Die Kunden können dann nach Produkten suchen, indem sie einfach ein Foto hochladen, was den Einkauf schneller und bequemer macht.

Sobald ein Kunde ein Bild in ein visuelles Suchsystem hochlädt, passieren hinter den Kulissen mehrere Dinge, bevor die Suchergebnisse angezeigt werden. 

Zunächst kann die Objekterkennung verwendet werden, um die wichtigsten Objekte im Bild zu erkennen, z. B. ein Kleidungsstück oder ein Möbelstück, und es vom Hintergrund zu trennen. Anschließend kann die Bildklassifizierung verwendet werden, um jedes Objekt weiter zu kategorisieren und zu erkennen, ob es sich um eine Jacke, ein Hemd, ein Sofa oder einen Tisch handelt. 

Mit diesen Informationen kann das System ähnliche Produkte finden, die zum Kauf angeboten werden, was besonders hilfreich ist, um einzigartige oder trendige Artikel zu finden, die mit Worten allein schwer zu beschreiben sind. Dieselbe Technologie kann auch dazu beitragen, andere Aufgaben im Einzelhandel, wie die Bestandsverwaltung, zu rationalisieren, indem Artikel automatisch erkannt und kategorisiert werden.

__wf_reserved_inherit
Abbildung 4. Eine auf Bildklassifizierung basierende visuelle Suchplattform in Aktion.

Wildtierüberwachung mit YOLO11-Bildklassifizierung

Traditionell ist die Überwachung von Tieren in freier Wildbahn eine mühsame Aufgabe, bei der viele Menschen Tausende von Fotos manuell sortieren und analysieren müssen. Mit Computer-Vision-Modi wie YOLO11 können Forscher Tiere automatisch und schneller überwachen. Kameras können in natürlichen Lebensräumen platziert werden, um Fotos zu machen. Das KI-Modell kann dann verwendet werden, um diese Fotos zu analysieren und die Tiere darauf zu klassifizieren (falls vorhanden). Ein solches System kann Forschern helfen, Tierpopulationen, ihre Wanderungsmuster usw. zu untersuchen und zu verfolgen.

Eine weitere Möglichkeit, wie KI- und Computer-Vision-Modelle wie YOLO11 in diesem Bereich helfen können, besteht darin, den Prozess der Klassifizierung gefährdeter Arten zu rationalisieren. Durch die Identifizierung potenzieller Arten oder Rassenkategorien, zu denen ein Tier gehören könnte, können diese Modelle wichtige Daten für Forscher liefern. Die Universität von Tasmanien (UTAS) hat zum Beispiel ein auf Bildklassifizierung basierendes System zur Überwachung verschiedener tasmanischer Wildtiere entwickelt. Die Vorhersagen aus den Modellen können Wissenschaftlern und Forschern dabei helfen, die Aktivität und das Verhalten der Tiere im Auge zu behalten, die auf Bedrohungen wie Wilderei oder Lebensraumverlust hinweisen können. 

__wf_reserved_inherit
Abb. 5. YOLO11 bei der Vorhersage der möglichen Rassen, denen ein Hund angehören könnte.

Erprobung der Bildklassifizierung mit dem Modell YOLO11

Nachdem wir nun besprochen haben, was Bildklassifizierung ist und einige ihrer Anwendungen erforscht haben. Schauen wir uns nun an, wie Sie die Bildklassifizierung mit dem neuen YOLO11-Modell ausprobieren können. Es gibt zwei einfache Möglichkeiten, damit zu beginnen: mit dem Ultralytics Python-Paket oder über Ultralytics HUB. Wir werden beide Möglichkeiten durchgehen.

Inferenzen mit YOLO11 durchführen

Um mit dem Ultralytics Python-Paket zu beginnen, installieren Sie es einfach mit pip, conda oder Docker. Wenn Sie auf Probleme stoßen, finden Sie in unserem Leitfaden für häufige Probleme hilfreiche Tipps zur Fehlerbehebung.

Sobald das Paket installiert ist, können Sie den folgenden Code verwenden, um eine Variante des YOLO11-Bildklassifikationsmodells zu laden und eine Inferenz für ein Bild durchzuführen. Eine Inferenz durchzuführen bedeutet, ein trainiertes Modell zu verwenden, um Vorhersagen für neue, ungesehene Daten zu treffen. Sie können dies mit einem Bild Ihrer Wahl ausprobieren!

__wf_reserved_inherit
Abb. 6. Durchführung von Schlussfolgerungen mit dem YOLO11-Modell.

Training eines benutzerdefinierten YOLO11-Klassifizierungsmodells

Sie können dasselbe Python-Paket auch verwenden, um ein benutzerdefiniertes YOLO11-Klassifizierungsmodell zu trainieren. Das benutzerdefinierte Training ermöglicht es Ihnen, ein YOLO11-Modell auf Ihre speziellen Bedürfnisse abzustimmen. Wenn Sie zum Beispiel eine App zur Klassifizierung verschiedener Katzenrassen entwickeln, können Sie ein YOLO11-Modell speziell für diesen Zweck trainieren.

Der folgende Code zeigt, wie man ein YOLO11-Bildklassifizierungsmodell lädt und trainiert. Es ermöglicht Ihnen, bereits trainierte Gewichte zu übertragen und das Wissen aus einem bestehenden Modell zu nutzen, um die Leistung Ihres eigenen Modells zu steigern. Sie können einen Datensatz angeben, z. B. den "fashion-mnist"-Datensatz, einen bekannten Satz von Graustufenbildern von Kleidungsstücken (Hemden, Hosen, Schuhe usw.). Wenn Sie das Modell mit diesem Datensatz trainieren, lernt es, verschiedene Kleidungskategorien zu erkennen. Sie können "fashion-mnist" gegen einen beliebigen Datensatz austauschen, der zu Ihrem Projekt passt, z. B. Katzenrassen oder Pflanzentypen.

__wf_reserved_inherit
Abb. 7. Benutzerdefiniertes Training eines YOLO11-Modells zur Bildklassifizierung.

Probieren Sie YOLO11 auf Ultralytics HUB aus

Die Verwendung des Ultralytics-Pakets ist zwar einfach, erfordert aber einige Python-Kenntnisse. Wenn Sie nach einer einsteigerfreundlicheren Option suchen, können Sie den Ultralytics HUB verwenden, eine Plattform, die das Training und die Bereitstellung verschiedener YOLO-Modelle einfach und zugänglich macht. Um loszulegen, müssen Sie ein Konto erstellen.

Sobald Sie angemeldet sind, navigieren Sie zum Abschnitt "Modelle" und wählen Sie das Modell YOLO11 für die Bildklassifizierung aus. Es stehen verschiedene Modellgrößen zur Verfügung: nano, klein, mittel, groß und extragroß. Nachdem Sie ein Modell ausgewählt haben, können Sie ein Bild in den Bereich "Vorschau" hochladen, wo die Vorhersagen auf der linken Seite der Seite erscheinen, sobald das Bild verarbeitet ist.

__wf_reserved_inherit
Abbildung 8. Verwendung von Ultralytics HUB zur Durchführung einer Inferenz.

Die wichtigsten Erkenntnisse

YOLO11 bietet leistungsstarke Bildklassifizierungsfunktionen, die in verschiedenen Branchen neue Möglichkeiten eröffnen. Von der Verbesserung der Ernteüberwachung in der Landwirtschaft über die Verbesserung der Produktsuche im Einzelhandel bis hin zur Unterstützung des Artenschutzes - die Geschwindigkeit und Genauigkeit von YOLO11 machen es ideal für verschiedene Anwendungen. Mit Optionen für benutzerdefinierte Schulungen über das Ultralytics Python-Paket oder eine benutzerfreundliche, codefreie Einrichtung auf Ultralytics HUB können Benutzer YOLO11 leicht in ihre Arbeitsabläufe einbinden. Da immer mehr Branchen KI-Lösungen einsetzen, bietet YOLO11 ein flexibles, leistungsstarkes Tool, das Innovationen und praktische Fortschritte unterstützt.

Um mehr zu erfahren, besuchen Sie unser GitHub-Repository und beteiligen Sie sich an unserer Community. Entdecken Sie KI-Anwendungen für selbstfahrende Autos und das Gesundheitswesen auf unseren Lösungsseiten. 🚀

Lassen Sie uns gemeinsam die Zukunft
der KI gestalten!

Beginnen Sie Ihre Reise in die Zukunft des maschinellen Lernens

Kostenloser Start
Link in die Zwischenablage kopiert