Entdecke, wie selbstüberwachtes Lernen unmarkierte Daten für ein effizientes Training nutzt und damit die KI in den Bereichen Computer Vision, NLP und mehr verändert.
Selbstüberwachtes Lernen (Self-Supervised Learning, SSL) ist ein Ansatz des maschinellen Lernens (ML), der es Modellen ermöglicht, aus riesigen Mengen an unmarkierten Daten zu lernen. Im Gegensatz zum überwachten Lernen, das in hohem Maße von sorgfältig beschrifteten Daten abhängt, erzeugt SSL auf geniale Weise seine eigenen Überwachungssignale direkt aus den Eingabedaten selbst. Das macht es besonders wertvoll in Bereichen wie Computer Vision (CV) und Natural Language Processing (NLP), in denen unmarkierte Daten im Überfluss vorhanden sind, aber die Kosten und der Aufwand für die manuelle Markierung(Datenannotation) unerschwinglich sein können.
Der Kernmechanismus hinter SSL besteht darin, eine "Vorwandaufgabe" zu entwerfen. Dabei handelt es sich um eine zusätzliche, selbst erstellte Aufgabe, bei der das Modell bestimmte Eigenschaften der Daten vorhersagen muss, die absichtlich verborgen oder verändert wurden. Durch das Lösen dieser Vorwandaufgabe ist das Modell gezwungen, sinnvolle Strukturen und Repräsentationen(Einbettungen) der Daten zu lernen, ohne dass der Mensch sie beschriftet. Diese erste Trainingsphase wird gemeinhin als Pre-Training bezeichnet.
In der Computer Vision könnte eine Vorwandaufgabe zum Beispiel lauten:
Im NLP ist eine bekannte Vorhersageaufgabe die maskierte Sprachmodellierung, die von Modellen wie BERT verwendet wird. Dabei lernt das Modell, Wörter vorherzusagen, die in Sätzen zufällig maskiert (versteckt) wurden.
Nach dem Vortraining auf großen, nicht beschrifteten Datensätzen erfasst das Modell umfangreiche Merkmalsrepräsentationen. Dieses vortrainierte Modell kann dann für bestimmte nachgelagerte Aufgaben - wie Objekterkennung, Bildklassifizierung oder Stimmungsanalyse - durcheinen Prozess namens Feinabstimmung angepasst werden. Für die Feinabstimmung ist in der Regel eine viel geringere Menge an gekennzeichneten Daten erforderlich, als wenn ein Modell von Grund auf trainiert wird.
Es ist wichtig, SSL von verwandten ML-Paradigmen zu unterscheiden:
SSL hat die Fähigkeiten der Künstlichen Intelligenz (KI) deutlich verbessert:
SSL reduziert die Abhängigkeit von teuren markierten Datensätzen erheblich und demokratisiert die Entwicklung leistungsstarker KI-Modelle. Tools wie PyTorch und TensorFlowsowie Plattformen wie Ultralytics HUB bieten Umgebungen, in denen SSL-Techniken für die Entwicklung und den Einsatz innovativer KI-Lösungen genutzt werden können.