Glossar

Bildklassifizierung

Entdecke die Bildklassifizierung mit Ultralytics YOLO : Trainiere mit modernsten Tools individuelle Modelle für das Gesundheitswesen, die Landwirtschaft, den Einzelhandel und mehr.

Die Bildklassifizierung ist eine grundlegende Aufgabe der Computer Vision (CV), bei der es darum geht, einem ganzen Bild auf der Grundlage seines visuellen Inhalts ein einziges Etikett oder eine Kategorie zuzuweisen. Sie ist eine Kernfunktion der Künstlichen Intelligenz (KI) und ermöglicht es Maschinen, Bilder zu verstehen und zu kategorisieren, ähnlich wie Menschen Szenen oder Objekte erkennen. Mit Hilfe von maschinellem Lernen (ML) und insbesondere Deep Learning (DL) zielt die Bildklassifizierung darauf ab, die Frage zu beantworten: "Was ist das Hauptmotiv auf diesem Bild?". Diese Aufgabe dient als Baustein für viele komplexere visuelle Verständnisprobleme.

Wie die Bildklassifizierung funktioniert

In der Regel wird dabei ein Modell, oft ein spezielles neuronales Netzwerk, ein sogenanntes Convolutional Neural Network (CNN), anhand eines großen Datensatzes mit markierten Bildern trainiert. Berühmte Datensätze wie ImageNet, die Millionen von Bildern in Tausenden von Kategorien enthalten, werden häufig für das Training robuster Modelle verwendet. Während des Trainings lernt das Modell, bestimmte Muster und Merkmale wie Texturen, Formen, Kanten und Farbverteilungen zu erkennen, die verschiedene Kategorien charakterisieren. Frameworks wie PyTorch und TensorFlow bieten die notwendigen Werkzeuge und Bibliotheken, um diese Deep Learning-Modelle zu erstellen und zu trainieren. Du kannst verschiedene Ultralytics wie CIFAR-100 oder MNIST untersuchen, um deine eigenen Projekte zu starten. Das ultimative Ziel ist es, dass das trainierte Modell die Klassenbezeichnung für neue, bisher ungesehene Bilder genau vorhersagt. Für ein tieferes technisches Verständnis der zugrunde liegenden Mechanismen bieten Ressourcen wie der Stanford CS231n Kurs über Convolutional Neural Networks for Visual Recognition umfassendes Material.

Hauptunterschiede zu anderen Sehaufgaben

Bei der Bildklassifizierung geht es darum, dem gesamten Bild eine einzige, übergreifende Bezeichnung zuzuweisen. Dadurch unterscheidet sie sich von anderen gängigen Computer-Vision-Aufgaben:

Objekt-Erkennung: Diese Aufgabe geht noch einen Schritt weiter, indem sie nicht nur Objekte in einem Bild klassifiziert, sondern sie auch lokalisiert, indem sie in der Regel Begrenzungsrahmen um jedes erkannte Objekt zeichnet. Sie beantwortet die Frage "Welche Objekte befinden sich in diesem Bild und wo sind sie zu finden?
Bildsegmentierung: Dabei wird jedes Pixel des Bildes klassifiziert.
- Semantische Segmentierung weist jedem Pixel ein Klassenlabel (z. B. "Auto", "Straße", "Himmel") zu, ohne zwischen verschiedenen Instanzen derselben Klasse zu unterscheiden.
- Instanz-Segmentierung unterscheidet zwischen einzelnen Instanzen von Objekten und weist den Pixeln, die zu jedem einzelnen Objekt gehören, einen eindeutigen Bezeichner zu (z. B. "Auto 1", "Auto 2").

Das Verständnis dieser Unterschiede ist entscheidend für die Auswahl der geeigneten Technik für ein bestimmtes Problem, da jede Aufgabe einen anderen Detailgrad des Bildinhalts liefert.

Anwendungen in der realen Welt

Die Bildklassifizierung wird aufgrund ihrer Effektivität bei der Kategorisierung von visuellen Informationen in vielen verschiedenen Bereichen eingesetzt:

Medizinische Bildanalyse: Klassifizierung medizinischer Scans (wie Röntgenbilder, CT-Scans oder MRTs) zur Unterstützung bei der Diagnose. Ein Modell kann zum Beispiel so trainiert werden, dass es Scans als Anzeichen für eine bestimmte Erkrankung klassifiziert, wie z. B. YOLO zur Tumorerkennung, und so Radiologen unterstützen. Erkunde weitere KI-Lösungen im Gesundheitswesen.
Landwirtschaftliche Technologie: Bilder von Nutzpflanzen klassifizieren, um Krankheiten zu erkennen, die Pflanzengesundheit zu bewerten oder den Reifegrad zu bestimmen. Eine Anwendung könnte zum Beispiel Fotos, die von einer Drohne oder einem Landwirt aufgenommen wurden, als "gesunder Weizen" oder "Weizenrost entdeckt" klassifizieren und so ein rechtzeitiges Eingreifen ermöglichen. Erfahre mehr über Computer Vision in der Landwirtschaft.
Einzelhandel und E-Commerce: Automatische Kategorisierung von Produktbildern für Online-Kataloge, Verbesserung der Suchbarkeit und Bestandsverwaltung.
Inhalt Moderation: Das Filtern von Bildern in sozialen Medien oder auf Websites, indem sie als sicher oder unangemessen eingestuft werden.
Wildtierschutz: Klassifizierung von Bildern aus Kamerafallen, um Tierpopulationen zu überwachen und Arten(wie Zebras) zu identifizieren.