Entdecke, wie das Glätten von Labels die Modelle des maschinellen Lernens verbessert, indem es die Überanpassung reduziert, die Generalisierung verbessert und die Zuverlässigkeit der Vorhersagen erhöht.
Die Glättung von Bezeichnungen ist eine Regulierungstechnik, die häufig beim Training von Machine-Learning-Modellen verwendet wird, insbesondere bei Klassifizierungsaufgaben. Dabei werden die "ground-truth"-Bezeichnungen so verändert, dass sie weniger zuverlässig sind, indem die "one-hot"-Kodierung der Bezeichnungen durch eine geglättete Version ersetzt wird. Durch diese Anpassung wird das Übervertrauen in die Vorhersagen des Modells reduziert, die Generalisierung verbessert und die Überanpassung gemildert.
Bei einem typischen Klassifizierungsproblem wird bei der One-Hot-Codierung der richtigen Klasse eine Wahrscheinlichkeit von 1 und allen anderen Klassen eine Wahrscheinlichkeit von 0 zugewiesen. Das Label Smoothing passt diese Wahrscheinlichkeiten an, indem es einen kleinen Teil des Vertrauens von der richtigen Klasse auf alle Klassen umverteilt. Anstatt ein Label beispielsweise als [1, 0, 0]
Die Glättung des Labels könnte es so darstellen [0.9, 0.05, 0.05]
für einen Glättungsfaktor von 0,1.
Durch die Abschwächung der Basiswahrheit vermeidet das Modell, dass es sich bei seinen Vorhersagen zu sicher ist. Das macht das Modell robuster, besonders in Szenarien, in denen die Daten Rauschen enthalten oder schwer zu klassifizieren sind.
Die Glättung von Bezeichnungen wird bei Bildklassifizierungsaufgaben häufig eingesetzt, um die Modellkalibrierung und -leistung zu verbessern. Modelle, die z. B. auf dem ImageNet-Datensatz für die Bildklassifizierung trainiert werden, verwenden häufig eine Label-Glättung, um eine bessere Generalisierung zu erreichen und eine Überanpassung zu vermeiden.
Im NLP wird das Glätten von Bezeichnungen bei Sequenz-zu-Sequenz-Aufgaben wie der maschinellen Übersetzung eingesetzt. Groß angelegte Sprachmodelle wie BERT (Bidirectional Encoder Representations from Transformers) und Transformator-basierte Modelle profitieren von der Glättung von Bezeichnungen während des Trainings, um ein stabiles Lernen zu gewährleisten und ein zu großes Vertrauen in die Vorhersagen zu vermeiden.
Selbstfahrende Autos: In autonomen Fahrzeugsystemen werden Modelle, die für die Klassifizierung von Bildern und die Objekterkennung trainiert wurden, geglättet. Datensätze wie COCO für die fortgeschrittene Objekterkennung profitieren zum Beispiel von dieser Technik, um die Robustheit von Modellen wie Ultralytics YOLO zu verbessern, die häufig bei der Objekterkennung für selbstfahrende Systeme eingesetzt werden.
Diagnostik im Gesundheitswesen: Bei Anwendungen in der medizinischen Bildgebung, wie z. B. bei der Tumorerkennung mit dem Datensatz zur Erkennung von Hirntumoren, erhöht das Glätten von Labels die Zuverlässigkeit der Vorhersagen. Sie verringert das Risiko, dass sich das Modell zu sehr auf falsche Klassifizierungen verlässt, was in Bereichen mit hohen Anforderungen wie dem Gesundheitswesen von entscheidender Bedeutung ist.
Ultralytics HUB bietet eine nahtlose Integration für das Training von Klassifizierungsmodellen mit Label Smoothing. Ganz gleich, ob du mit Datensätzen wie CIFAR-10 für die Bildklassifizierung oder mit benutzerdefinierten Datensätzen arbeitest, Ultralytics HUB vereinfacht die Einstellung von Hyperparametern, einschließlich der Faktoren für das Label Smoothing, um die Leistung deines Modells zu optimieren.
Das Glätten von Labels ist eine einfache, aber leistungsstarke Technik, die die Robustheit und Zuverlässigkeit von Machine-Learning-Modellen verbessert. Indem sie die Zielbeschriftungen abschwächt, hilft sie den Modellen, besser zu generalisieren, eine Überanpassung zu vermeiden und gut kalibrierte Vorhersagen zu treffen. Ganz gleich, ob du an der Klassifizierung von Bildern, NLP oder der Erkennung von Objekten arbeitest, das Glätten von Beschriftungen ist ein wertvolles Werkzeug in deinem Werkzeugkasten für maschinelles Lernen. Weitere Einblicke in verwandte Techniken und Anwendungen findest du im KI- und Computer-Vision-Glossar von Ultralytics.