Entdecke, wie selbstüberwachtes Lernen unmarkierte Daten für ein effizientes Training nutzt und damit die KI in den Bereichen Computer Vision, NLP und mehr verändert.
Selbstüberwachtes Lernen (Self-Supervised Learning, SSL) ist ein Ansatz des maschinellen Lernens (ML), bei dem Modelle anhand von Daten trainiert werden, die nicht explizit durch den Menschen gekennzeichnet wurden. Im Gegensatz zum überwachten Lernen, das sich stark auf beschriftete Daten stützt, erzeugt SSL seine eigenen Überwachungssignale direkt aus den Eingabedaten. Das macht es besonders leistungsfähig für Bereiche wie Computer Vision (CV) und Natural Language Processing (NLP), in denen große Mengen an unmarkierten Daten zur Verfügung stehen, deren Markierung aber oft teuer und zeitaufwändig ist.
Die Kernidee hinter SSL ist die Erstellung einer "Vorwandaufgabe". Dabei handelt es sich um eine vom Praktiker entworfene Hilfsaufgabe, bei der das Modell eine Eigenschaft der Daten vorhersagt, die absichtlich verborgen oder verändert wurde. Das Lösen der Vorwandaufgabe zwingt das Modell dazu, sinnvolle zugrundeliegende Muster und Darstellungen der Daten zu lernen.
In der Computer Vision beispielsweise besteht eine häufige Aufgabe darin, dem Modell Teile eines Bildes zu zeigen und es aufzufordern, die relative Position dieser Teile vorherzusagen, oder die Farbe eines Bildes nur anhand seiner Graustufenversion vorherzusagen. Im NLP ist eine beliebte Technik die maskierte Sprachmodellierung (verwendet von Modellen wie BERT), bei der das Modell Wörter vorhersagt, die in einem Satz ausgeblendet wurden.
Durch das Training mit diesen selbst erstellten Labels über große Datensätze entwickelt das Modell robuste Merkmalsrepräsentationen. Diese gelernten Merkmale(Embeddings) erfassen wesentliche Merkmale der Daten. Diese erste Trainingsphase wird oft als Pre-Training bezeichnet. Das trainierte Modell kann dann für bestimmte nachgelagerte Aufgaben (z. B. Objekterkennung, Bildklassifizierung oder Bildsegmentierung) durch einen Prozess namens Feintuning angepasst werden. Das macht SSL zu einem wichtigen Instrument des Transferlernens.
Selbstüberwachtes Lernen hat in der KI große Fortschritte gemacht:
Es ist hilfreich, SSL von verwandten ML-Paradigmen zu unterscheiden:
Selbstüberwachtes Lernen stellt eine wichtige Brücke dar, indem es die Fülle an unmarkierten Daten nutzt, um leistungsstarke Repräsentationen zu erstellen, die die Abhängigkeit von kostspieligen markierten Datensätzen deutlich verringern und den Fortschritt in verschiedenen KI-Anwendungen und Plattformen wie Ultralytics HUB beschleunigen.