Glossar

Überwachtes Lernen

Entdecke, wie überwachtes Lernen KI mit gelabelten Daten antreibt und genaue Vorhersagen und Anwendungen wie Objekterkennung und Stimmungsanalyse ermöglicht.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Überwachtes Lernen ist eine grundlegende Kategorie des maschinellen Lernens (ML), bei der Algorithmen aus einem Datensatz lernen, der Eingabe-Ausgabe-Paare enthält, die als gelabelte Daten bezeichnet werden. Im Wesentlichen ist der Algorithmus "überwacht", weil er lernt, indem er seine Vorhersagen für die Eingabedaten mit den bekannten korrekten Ausgaben (Labels) vergleicht, die in den Trainingsdaten enthalten sind. Das Ziel ist, dass der Algorithmus eine Zuordnungsfunktion lernt, die die Ausgabe für neue, unbekannte Eingaben genau vorhersagen kann. Dieser Ansatz ist für viele moderne Anwendungen der Künstlichen Intelligenz (KI) von zentraler Bedeutung, da er es Systemen ermöglicht, Vorhersagen oder Entscheidungen auf der Grundlage historischer Beispiele zu treffen.

Wie das überwachte Lernen funktioniert

Der Prozess beginnt mit einem Datensatz, bei dem jeder Datenpunkt aus Eingangsmerkmalen und einem entsprechenden korrekten Ausgangslabel besteht. Bei einer Bildklassifizierungsaufgabe wären die Eingaben zum Beispiel Bilder und die Bezeichnungen die Kategorien, zu denen sie gehören (z. B. "Katze", "Hund"). Der Algorithmus macht iterativ Vorhersagen für die Trainingsdaten und passt seine internen Parameter mithilfe eines Optimierungsalgorithmus wie dem Gradientenabstieg an, um die Differenz zwischen seinen Vorhersagen und den tatsächlichen Kennzeichnungen, die durch eine Verlustfunktion gemessen wird, zu minimieren. Dieses Training wird so lange fortgesetzt, bis das Modell eine zufriedenstellende Genauigkeit bei den Validierungsdaten erreicht.

Relevanz und Anwendungen

Überwachtes Lernen ist unglaublich vielseitig und ermöglicht eine Vielzahl von Anwendungen, bei denen historische Daten zukünftige Ereignisse vorhersagen oder neue Informationen klassifizieren können. Durch seine Fähigkeit, direkt aus markierten Beispielen zu lernen, eignet es sich für Aufgaben, die eine hohe Präzision erfordern. Viele Bildverarbeitungsaufgaben beruhen auf überwachtem Lernen, z. B. bei Modellen wie Ultralytics YOLO.

Hier sind zwei konkrete Beispiele:

  1. Medizinische Bildanalyse: Modelle mit überwachtem Lernen können auf Datensätzen medizinischer Aufnahmen (wie Röntgenaufnahmen oder MRTs) trainiert werden, die von Radiologen beschriftet wurden. Ein Modell kann zum Beispiel lernen, Tumore in der medizinischen Bildgebung zu erkennen, indem es auf Bildern trainiert wird, die als "Tumor" oder "kein Tumor" gekennzeichnet sind. Das hilft Ärzten bei der Diagnose und der Behandlungsplanung und leistet einen wichtigen Beitrag zu KI-Lösungen im Gesundheitswesen.
  2. Stimmungsanalyse: Unternehmen wollen oft die Meinungen ihrer Kunden anhand von Textdaten wie Bewertungen oder Social-Media-Beiträgen verstehen. Ein überwachtes Modell kann auf Textbeispiele trainiert werden, die mit Stimmungen ("positiv", "negativ", "neutral") gekennzeichnet sind. Einmal trainiert, kann es automatisch neue Texte klassifizieren und so wertvolle Erkenntnisse für die Marktforschung und den Kundenservice liefern. Erfahre mehr über die Stimmungsanalyse.

Weitere gängige Anwendungen sind die Objekterkennung in Bildern und Videos (für autonome Fahrzeuge und Sicherheitssysteme), das Filtern von Spam-E-Mails, die Vorhersage von Immobilienpreisen(Regressionsaufgaben ) und die Gesichtserkennung.

Schlüsselkonzepte

Mehrere Konzepte sind für das Verständnis des überwachten Lernens von zentraler Bedeutung:

  • Beschriftete Daten: Die Grundlage des überwachten Lernens, bestehend aus Eingabedaten, die mit korrekten Ausgabedaten gepaart sind. Eine qualitativ hochwertige Datenerfassung und -beschriftung ist entscheidend.
  • Merkmale: Messbare Eingangsvariablen oder Merkmale, die das Modell verwendet, um Vorhersagen zu treffen. Die Entwicklung von Merkmalen kann die Leistung erheblich beeinflussen.
  • Labels (oder Ziele): Die korrekten Ausgabewerte, die mit den Eingangsmerkmalen in den Trainingsdaten verbunden sind.
  • Klassifizierung: Eine Art von überwachter Lernaufgabe, bei der das Ziel darin besteht, eine bestimmte Kategorie vorherzusagen (z. B. die Klassifizierung von E-Mails als "Spam" oder "kein Spam" oder die Einteilung von Bildern in verschiedene Klassen mit Hilfe von Modellen wie YOLO für die Klassifizierung).
  • Regression: Eine Art von überwachter Lernaufgabe, bei der das Ziel darin besteht, einen kontinuierlichen numerischen Wert vorherzusagen (z. B. die Vorhersage von Temperatur, Aktienkursen oder Hauswerten mithilfe von Algorithmen wie der linearen Regression).
  • Gängige Algorithmen: Dazu gehören Methoden wie Logistische Regression, Support Vector Machines (SVM), Entscheidungsbäume, Zufallswälder und verschiedene Arten von Neuronalen Netzen (NN), insbesondere Convolutional Neural Networks (CNNs) für bildbezogene Aufgaben, die oft mit Frameworks wie PyTorch.

Vergleich mit anderen Lernparadigmen

Überwachtes Lernen unterscheidet sich von anderen primären Paradigmen des maschinellen Lernens:

  • Unüberwachtes Lernen: Algorithmen lernen Muster aus unbeschrifteten Daten ohne explizite Anleitung. Häufige Aufgaben sind Clustering (Gruppierung ähnlicher Datenpunkte) und Dimensionalitätsreduktion (Vereinfachung der Daten). Es wird eingesetzt, wenn keine beschrifteten Daten verfügbar sind oder das Ziel darin besteht, versteckte Strukturen zu entdecken.
  • Verstärkungslernen: Algorithmen lernen, indem sie mit einer Umgebung interagieren und Rückmeldungen in Form von Belohnungen oder Bestrafungen erhalten. Das Ziel ist es, eine Strategie zu erlernen (eine Strategie für die Wahl von Aktionen), die die kumulativen Belohnungen im Laufe der Zeit maximiert. Sie wird häufig in der Robotik, bei Spielen und in Navigationssystemen eingesetzt.

Zusammenfassend lässt sich sagen, dass überwachtes Lernen eine leistungsstarke Technik ist, die markierte Daten nutzt, um Modelle für Vorhersageaufgaben zu trainieren. Sie bildet das Rückgrat vieler erfolgreicher KI-Anwendungen, einschließlich derer, die von Ultralytics und Plattformen wie Ultralytics HUB entwickelt und unterstützt werden.

Alles lesen