Entdecke, wie Semi-Supervised Learning gelabelte und nicht gelabelte Daten kombiniert, um KI-Modelle zu verbessern, die Labeling-Kosten zu senken und die Genauigkeit zu erhöhen.
Semi-Supervised Learning (SSL) ist eine Technik des maschinellen Lernens (ML), die zwischen überwachtem und unüberwachtem Lernen liegt. Es nutzt eine Kombination aus einer kleinen Menge beschrifteter Daten und einer großen Menge unbeschrifteter Daten, um Modelle zu trainieren. Die Hauptmotivation hinter SSL sind die hohen Kosten und der Aufwand, die oft mit der Kennzeichnung von Daten verbunden sind, insbesondere in komplexen Bereichen. Durch die Nutzung leicht verfügbarer unmarkierter Daten zielt SSL darauf ab, die Modellleistung und Generalisierung über das hinaus zu verbessern, was mit den begrenzten markierten Daten erreicht werden könnte.
Das Kernprinzip des Semi-Supervised Learning ist, dass die unmarkierten Daten trotz fehlender expliziter Markierungen wertvolle Informationen über die zugrunde liegende Struktur und Verteilung der Daten enthalten. SSL-Algorithmen versuchen, diese Struktur auszunutzen, um den Lernprozess zu verbessern. Bei den gängigen Ansätzen werden oft Annahmen über die Daten getroffen, wie z. B. die "Cluster-Annahme" (Punkte im selben Cluster haben wahrscheinlich dasselbe Label) oder die "Mannigfaltigkeits-Annahme" (Datenpunkte liegen auf einer niederdimensionalen Mannigfaltigkeit).
Zu den Techniken, die in SSL verwendet werden, gehören Methoden wie das Pseudo-Labeling, bei dem ein Modell, das auf den ursprünglich gelabelten Daten trainiert wurde, verwendet wird, um die Label für die nicht gelabelten Daten vorherzusagen. Vorhersagen mit hoher Konfidenz werden dann als "Pseudo-Labels" behandelt und der Trainingsmenge hinzugefügt. Ein anderer Ansatz ist die Konsistenzregulierung, die das Modell dazu anregt, ähnliche Ergebnisse für gestörte Versionen desselben unmarkierten Inputs zu produzieren. Diese Methoden helfen dem Modell, robustere Merkmale zu erlernen, indem es den großen unbeschrifteten Datensatz nutzt. Eine gute SSL-Übersicht findest du auf Towards Data Science.
Semi-Supervised Learning ist besonders nützlich in Szenarien, in denen die Beschaffung von gelabelten Daten ein Engpass ist. Einige wichtige Anwendungsbereiche sind:
Es ist wichtig, Semi-Supervised Learning von verwandten ML-Paradigmen zu unterscheiden:
Semi-Supervised Learning ist ein praktischer und leistungsfähiger Ansatz für den Aufbau effektiver Systeme der Künstlichen Intelligenz (KI), insbesondere bei Computer-Vision-Aufgaben wie der Objekterkennung, bei denen es viele unmarkierte Bilder oder Videos gibt. Plattformen wie Ultralytics HUB erleichtern die Verwaltung von Datensätzen, die eine Mischung aus beschrifteten und unbeschrifteten Daten für Trainingsmodelle wie Ultralytics YOLO. Die Erkundung von SSL-Techniken kann für Projekte, bei denen die Verfügbarkeit von gekennzeichneten Daten eingeschränkt ist, von entscheidender Bedeutung sein, wie in Ressourcen wie den Google AI Blog-Beiträgen zu SSL hervorgehoben wird.