Glossar

Unüberwachtes Lernen

Entdecke, wie unüberwachtes Lernen Clustering, Dimensionalitätsreduktion und Anomalieerkennung nutzt, um versteckte Muster in Daten aufzudecken.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Unüberwachtes Lernen ist eine Form des maschinellen Lernens (ML), bei der Algorithmen Muster aus unmarkierten Daten lernen. Im Gegensatz zum überwachten Lernen, das sich auf vordefinierte Kennzeichnungen oder "richtige Antworten" stützt, erforschen unüberwachte Methoden die inhärente Struktur der Daten, um versteckte Beziehungen, Gruppierungen oder Anomalien ohne vorherige Anleitung zu entdecken. Dieser Ansatz ist in der Künstlichen Intelligenz (KI) besonders nützlich für die erste Datenexploration und das Verständnis komplexer Datensätze, bei denen eine Kennzeichnung unpraktisch oder unmöglich ist. Sie ermöglicht es den Modellen, Muster und Erkenntnisse direkt aus den Daten zu gewinnen.

Wie unüberwachtes Lernen funktioniert

Das Hauptziel des unüberwachten Lernens ist es, die zugrunde liegende Struktur oder Verteilung in den Daten zu modellieren, um mehr über sie zu erfahren. Die Algorithmen müssen selbständig Ähnlichkeiten, Unterschiede und Strukturen entdecken. Zu den gängigen Techniken gehören:

  • Clustering: Dabei werden ähnliche Datenpunkte anhand bestimmter Merkmale automatisch in Gruppen zusammengefasst. Beliebte Algorithmen sind K-Means Clustering und DBSCAN.
  • Dimensionalitätsreduktion: Diese Technik vereinfacht die Daten, indem sie die Anzahl der Eingabevariablen oder Merkmale reduziert und gleichzeitig die wesentlichen Informationen beibehält. Die Hauptkomponentenanalyse (PCA) ist eine weit verbreitete Methode zur Dimensionalitätsreduktion.
  • Association Rule Learning: Mit dieser Methode werden interessante Beziehungen oder Assoziationsregeln zwischen Variablen in großen Datenbeständen entdeckt. Es wird häufig in der Warenkorbanalyse eingesetzt, um Artikel zu finden, die häufig zusammen gekauft werden.

Anwendungen des unüberwachten Lernens

Unüberwachte Lerntechniken werden in verschiedenen realen Szenarien eingesetzt, vor allem wenn es um große Mengen an unmarkierten Daten geht:

  • Kundensegmentierung: Unternehmen nutzen das Clustering, um Kunden mit ähnlichen Verhaltensweisen, Vorlieben oder demografischen Merkmalen zu gruppieren. So können sie ihre Marketingkampagnen effektiver ausrichten und ihren Kunden ein individuelles Erlebnis bieten. Erfahre mehr über Kundensegmentierung.
  • Erkennung von Anomalien: Unüberwachte Algorithmen zeichnen sich dadurch aus, dass sie ungewöhnliche Datenpunkte oder Ausreißer erkennen, die erheblich von der Norm abweichen. Dies ist entscheidend für Anwendungen wie die Erkennung von Betrug im Finanzwesen, das Aufspüren von Netzwerkeinbrüchen oder die Erkennung von Fehlern in der Produktion.

Relevanz in KI und ML

Unüberwachtes Lernen spielt eine entscheidende Rolle, wenn es darum geht, die riesigen Mengen an unbeschrifteten Rohdaten, die für Big Data charakteristisch sind, sinnvoll zu nutzen. Es ist oft ein wichtiger Schritt in der Datenvorverarbeitung und im Feature-Engineering und hilft dabei, verborgene Strukturen aufzudecken oder die Datenkomplexität zu reduzieren, bevor andere ML-Techniken angewendet werden. Während Modelle wie Ultralytics YOLO in erster Linie mit überwachten Methoden für Aufgaben wie die Objekterkennung trainiert werden, kann das Verstehen von Datenstrukturen durch unüberwachte Methoden die Vorbereitung und Analyse von Datensätzen erheblich erleichtern und die Leistung des Modells potenziell verbessern. Du kannst Anleitungen zur Datenerfassung und -beschriftung für die Vorbereitung von Datensätzen erkunden und deine Daten und Modelle mit Plattformen wie Ultralytics HUB verwalten.

Unüberwachtes Lernen im Vergleich zu anderen Lerntypen

Es ist wichtig, unüberwachtes Lernen von verwandten Paradigmen wie Deep Learning (DL) und ML zu unterscheiden:

  • Überwachtes Lernen: Erfordert einen vollständig beschrifteten Datensatz, d.h. jeder Datenpunkt hat eine bekannte Ausgabe oder Kategorie. Das Ziel ist es, ein Modell zu trainieren, das die Ausgabe für neue, unbekannte Datenpunkte auf der Grundlage der beschrifteten Beispiele genau vorhersagen kann.
  • Selbstüberwachtes Lernen: Es wird oft als eine Art des unüberwachten Lernens betrachtet und erzeugt automatisch Labels aus den Eingabedaten selbst, indem es Aufgaben im Vorfeld erstellt (z. B. die Vorhersage eines verborgenen Teils eines Bildes). Es wird häufig zum Vortraining großer Modelle verwendet, einschließlich der Modelle, die auf der Transformer-Architektur basieren.
  • Semi-überwachtes Lernen: Verwendet eine Kombination aus einer kleinen Menge von gekennzeichneten Daten und einer großen Menge von nicht gekennzeichneten Daten. Dieser Ansatz zielt darauf ab, die unmarkierten Daten zu nutzen, um die Lerngenauigkeit über das hinaus zu verbessern, was mit den begrenzten markierten Daten möglich wäre. Erforsche semi-supervised learning weiter.

Unüberwachtes Lernen ist nach wie vor ein grundlegender Bereich des ML, der die Entdeckung und das Verständnis komplexer Datensätze vorantreibt, für die nur wenige oder gar keine Bezeichnungen verfügbar sind.

Alles lesen