Glossar

Aktives Lernen

Entdecke das aktive Lernen, eine kosteneffiziente Methode des maschinellen Lernens, die die Genauigkeit mit weniger Etiketten erhöht. Erfahre, wie es das KI-Training verändert!

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Aktives Lernen ist ein spezieller Ansatz innerhalb des maschinellen Lernens, bei dem der Algorithmus eine aktive Rolle bei der Auswahl der Daten spielt, aus denen er lernt. Im Gegensatz zum traditionellen überwachten Lernen, das sich auf vollständig beschriftete Datensätze stützt, fragt das aktive Lernen intelligent nach bestimmten Datenpunkten, die es für besonders informativ hält. Dieser gezielte Ansatz ermöglicht es dem Modell, mit deutlich weniger gekennzeichneten Beispielen eine hohe Genauigkeit zu erreichen, was es zu einer kostengünstigen und effizienten Strategie für das Training von maschinellen Lernmodellen macht, insbesondere wenn es um große, nicht gekennzeichnete Datensätze geht.

Wie aktives Lernen funktioniert

Beim aktiven Lernen interagiert das Modell iterativ mit einem Orakel (in der Regel ein menschlicher Kommentator), um Labels für die wertvollsten Datenpunkte zu erhalten. Der Prozess läuft in der Regel in folgenden Schritten ab:

  1. Erstes Training: Das Modell wird zunächst mit einer kleinen Menge an gelabelten Daten trainiert.
  2. Uncertainty Sampling: Das Modell identifiziert die Datenpunkte, bei denen es am unsichersten ist, was die richtige Bezeichnung angeht. Es gibt verschiedene Strategien, um die Unsicherheit zu quantifizieren, z. B. die Abfrage der Instanzen mit der geringsten Vorhersagezuverlässigkeit oder die Abfrage der Stellen, an denen die verschiedenen Modelle in einem Ensemble am stärksten voneinander abweichen.
  3. Abfragen: Das Modell fragt das Orakel nach den Bezeichnungen der ausgewählten Datenpunkte ab.
  4. Modellaktualisierung: Die neu beschrifteten Daten werden dem Trainingssatz hinzugefügt und das Modell wird neu trainiert.
  5. Iteration: Die Schritte 2-4 werden so lange wiederholt, bis die gewünschte Genauigkeit erreicht oder das Budget für die Kennzeichnung ausgeschöpft ist.

Aktives Lernen ist besonders nützlich, wenn die Kennzeichnung von Daten teuer und zeitaufwändig ist oder spezielles Fachwissen erfordert. Durch die strategische Auswahl der zu beschriftenden Datenpunkte minimiert aktives Lernen den Beschriftungsaufwand und maximiert gleichzeitig die Leistung des Modells.

Die wichtigsten Vorteile des aktiven Lernens

Aktives Lernen bietet mehrere Vorteile gegenüber dem traditionellen überwachten Lernen:

  • Geringere Kosten für die Kennzeichnung: Durch die Fokussierung auf die informativsten Datenpunkte reduziert aktives Lernen die Menge an beschrifteten Daten, die zum Trainieren eines leistungsstarken Modells erforderlich sind, erheblich.
  • Schnelleres Training: Da weniger beschriftete Beispiele benötigt werden, kann die Trainingszeit erheblich verkürzt werden, insbesondere bei komplexen Modellen.
  • Verbesserte Modellgenauigkeit: Aktives Lernen führt oft zu einer besseren Modellleistung im Vergleich zu Modellen, die auf zufällig ausgewählten gelabelten Daten trainiert wurden, da es die schwierigsten und informativsten Instanzen priorisiert.
  • Effiziente Nutzung von Ressourcen: Aktives Lernen optimiert die Ressourcennutzung, indem es den Aufwand für die Kennzeichnung weniger informativer Datenpunkte minimiert.

Reale Anwendungen des aktiven Lernens

Aktives Lernen findet in verschiedenen Bereichen Anwendung, in denen beschriftete Daten rar oder teuer zu beschaffen sind. Hier sind zwei konkrete Beispiele:

Medizinische Bildanalyse

Bei der medizinischen Bildanalyse kann die Beschriftung durch medizinische Experten kostspielig und zeitaufwändig sein. Aktives Lernen kann eingesetzt werden, um die kritischsten medizinischen Bilder zu identifizieren, die von Experten beschriftet werden müssen, z. B. Bilder mit mehrdeutigen Merkmalen oder seltenen Erkrankungen. Dieser gezielte Ansatz ermöglicht die Entwicklung präziser Diagnosemodelle mit weniger beschrifteten Bildern und beschleunigt die Entwicklung von KI-gestützten medizinischen Hilfsmitteln.

Objekterkennung in autonomen Fahrzeugen

Das Trainieren von Objekterkennungsmodellen für autonome Fahrzeuge erfordert große Mengen an beschrifteten Daten, die verschiedene Fahrszenarien repräsentieren. Aktives Lernen kann dabei helfen, die Kennzeichnung von Datenpunkten zu priorisieren, die für das Modell am schwierigsten sind, z. B. ungewöhnliche Lichtverhältnisse, verdeckte Objekte oder seltene Verkehrssituationen. Auf diese Weise wird sichergestellt, dass das Modell mit den aussagekräftigsten Daten trainiert wird, was zu mehr Sicherheit und Zuverlässigkeit bei autonomen Fahrsystemen führt. Dies ist nur eine der vielen Anwendungen von Computer Vision in autonomen Fahrzeugen.

Aktives Lernen vs. andere Lernparadigmen

Es ist wichtig, aktives Lernen von anderen verwandten Lernparadigmen zu unterscheiden:

  • Überwachtes Lernen: Beim traditionellen überwachten Lernen wird das Modell auf einem festen Datensatz mit vollständigen Kennzeichnungen trainiert. Beim aktiven Lernen hingegen werden die Datenpunkte für die Beschriftung dynamisch während des Trainingsprozesses ausgewählt.
  • Semi-überwachtes Lernen: Semi-überwachtes Lernen nutzt sowohl gelabelte als auch nicht gelabelte Daten für das Training. Während sowohl aktives Lernen als auch halbüberwachtes Lernen darauf abzielen, unmarkierte Daten zu nutzen, fragt aktives Lernen aktiv nach Markierungen, während halbüberwachtes Lernen typischerweise die unmarkierten Daten nutzt, um das Verständnis des Modells für die zugrunde liegende Datenverteilung zu verbessern.
  • Verstärkungslernen: Beim Verstärkungslernen lernt ein Agent durch Versuch und Irrtum, indem er mit einer Umgebung interagiert. Im Gegensatz zum aktiven Lernen, bei dem ein Modell ein Orakel nach Kennzeichnungen befragt, konzentriert sich das Verstärkungslernen auf das Erlernen optimaler Handlungen auf der Grundlage von Belohnungen und Bestrafungen.

Aktives Lernen und Ultralytics

Ultralytics bietet hochmoderne Lösungen für die Objekterkennung, darunter die leistungsstarken Ultralytics YOLO Modelle. Auch wenn Ultralytics derzeit keine direkte Unterstützung für aktive Lernprozesse bietet, können die Ergebnisse und Erkenntnisse der Modelle von YOLO genutzt werden, um aktive Lernstrategien zu implementieren. Zum Beispiel können die Konfidenzwerte des Modells für die Objekterkennung verwendet werden, um unsichere Instanzen für die Beschriftung zu identifizieren.

Darüber hinaus bietet Ultralytics eine Reihe von Tools und Ressourcen für das Training, die Validierung und den Einsatz von YOLO Modellen. Diese Werkzeuge können in benutzerdefinierte Active Learning Pipelines integriert werden, um die Entwicklung von Objekterkennungssystemen zu optimieren. Auf der DokumentationsseiteUltralytics kannst du diese Funktionen näher kennenlernen.

Aktives Lernen ist ein leistungsfähiges Paradigma zum effizienten Trainieren von Machine-Learning-Modellen, insbesondere wenn beschriftete Daten knapp oder teuer sind. Durch die intelligente Auswahl der informativsten Datenpunkte für die Beschriftung reduziert aktives Lernen die Kosten, beschleunigt das Training und verbessert die Modellgenauigkeit. Da die Nachfrage nach KI-Lösungen in verschiedenen Branchen steigt, wird aktives Lernen eine immer wichtigere Rolle bei der Entwicklung von robusten und effizienten maschinellen Lernsystemen spielen.

Alles lesen