Entdecken Sie überwachtes Lernen in der KI. Erfahren Sie, wie Modelle wie Ultralytics beschriftete Daten für Klassifizierung und Regression nutzen, um hochpräzise Ergebnisse zu erzielen.
Überwachtes Lernen ist ein grundlegender Ansatz in der künstlichen Intelligenz (KI), bei dem Algorithmen anhand von Eingabedaten trainiert werden, die mit der richtigen Ausgabe gekennzeichnet sind. Bei dieser Methode lernt das Modell, indem es seine eigenen Vorhersagen mit diesen bereitgestellten Labels vergleicht, wobei es im Wesentlichen einen „Supervisor” hat, der es während des Trainingsprozesses korrigiert. Das primäre Ziel besteht darin, dass das System die Zuordnungsfunktion von Eingaben zu Ausgaben so gut lernt, dass es die Kennzeichnungen für neue, unbekannte Testdaten genau vorhersagen kann. Diese Technik ist die treibende Kraft hinter vielen der praktischsten und erfolgreichsten KI-Anwendungen, die heute im Einsatz sind, von E-Mail-Spamfiltern bis hin zu autonomen Fahrsystemen.
Der Arbeitsablauf des überwachten Lernens dreht sich um die Verwendung von beschrifteten Daten. Es wird ein Datensatz kuratiert, in dem jedes Trainingsbeispiel mit einer entsprechenden „Ground Truth”-Beschriftung gepaart ist. Während der Modelltrainingsphase verarbeitet der Algorithmus die Eingabemerkmale und generiert eine Vorhersage. Eine mathematische Formel, die als Verlustfunktion bezeichnet wird, misst dann den Fehler – die Differenz zwischen der Vorhersage des Modells und der tatsächlichen Beschriftung.
Um diesen Fehler zu minimieren, wird ein Optimierungsalgorithmus wie Stochastic Gradient Descent (SGD), die internen Parameter oder Modellgewichte des Modells iterativ an. Dieser Prozess wiederholt sich über viele Zyklen, sogenannte Epochen, bis das Modell ein zufriedenstellendes Maß an Genauigkeit erreicht, ohne sich an die Trainingsdaten anzupassen . Tools wie die Ultralytics vereinfachen diese gesamte Pipeline, indem sie die Annotation, das Training und die Bewertung von Datensätzen in einer einheitlichen Umgebung verwalten.
Probleme des überwachten Lernens werden im Allgemeinen anhand der Art der Zielvariablen in zwei Haupttypen unterteilt:
Überwachtes Lernen treibt eine Vielzahl von Technologien in verschiedenen Branchen an:
Es ist wichtig, zwischen überwachtem und unüberwachtem Lernen zu unterscheiden. Während überwachtes Lernen auf gekennzeichneten Eingabe-Ausgabe-Paaren basiert, arbeitet unüberwachtes Lernen mit unmarkierten Daten. In unüberwachten Szenarien versucht der Algorithmus, selbst versteckte Strukturen, Muster oder Gruppierungen innerhalb der Daten zu finden, wie z. B. die Kundensegmentierung im Marketing. Überwachtes Lernen ist im Allgemeinen genauer für bestimmte Aufgaben, für die historische Daten verfügbar sind, während unüberwachtes Lernen besser für die explorative Datenanalyse geeignet ist.
Das überwachte Lernen ist für das Training moderner Computervisionsmodelle von zentraler Bedeutung. Der folgende Python zeigt, wie ein YOLO26-Modell unter Verwendung eines überwachten Datensatzes (COCO8) trainiert wird. Das Modell lernt anhand der beschrifteten Bilder im Datensatz, detect zu detect
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n.pt") # load a pretrained model (recommended for training)
# Train the model using the 'coco8.yaml' dataset (supervised learning)
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)
# The model is now fine-tuned based on the supervised labels in the dataset
Dieser einfache Prozess nutzt die Leistungsfähigkeit von PyTorch , um komplexe Matrixoperationen und Gradientenberechnungen durchzuführen. Für diejenigen, die den Datenmanagement-Aspekt optimieren möchten, bietet Ultralytics Tools für cloudbasiertes Training und automatische Annotation, wodurch der Workflow des überwachten Lernens deutlich effizienter wird.