Glossar

Hyperparameter-Abstimmung

Beherrsche das Hyperparameter-Tuning, um ML-Modelle wie Ultralytics YOLO zu optimieren. Steigere die Genauigkeit, Geschwindigkeit und Leistung mit Expertentechniken.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Hyperparameter-Tuning, auch bekannt als Hyperparameter-Optimierung, ist ein grundlegender Prozess beim maschinellen Lernen (ML), der darauf abzielt, die beste Kombination von Hyperparametern zu finden, um die Leistung eines Modells zu maximieren. Bei den Hyperparametern handelt es sich um Konfigurationseinstellungen, die vor Beginn des Trainingsprozesses festgelegt werden, im Gegensatz zu den Modellparametern (wie weights and biases in einem neuronalen Netz), die während des Trainings durch Techniken wie Backpropagation gelernt werden. Die Abstimmung dieser externen Einstellungen ist von entscheidender Bedeutung, da sie den Lernprozess selbst steuern und beeinflussen, wie effektiv ein Modell aus Daten lernt und auf neue, ungesehene Beispiele verallgemeinert.

Das Verständnis von Hyperparametern

Hyperparameter legen übergeordnete Eigenschaften des Modells fest, z. B. seine Komplexität oder wie schnell es lernen soll. Gängige Beispiele sind die Lernrate, die in Optimierungsalgorithmen verwendet wird, die Stapelgröße, die bestimmt, wie viele Stichproben verarbeitet werden, bevor die Modellparameter aktualisiert werden, die Anzahl der Schichten in einem neuronalen Netz oder die Stärke der Regularisierungstechniken wie die Verwendung von Dropout-Schichten. Die Wahl der Hyperparameter hat einen großen Einfluss auf die Modellergebnisse. Eine schlechte Wahl kann zu einer Unteranpassung führen, bei der das Modell zu einfach ist, um Datenmuster zu erfassen, oder zu einer Überanpassung, bei der das Modell die Trainingsdaten zu gut lernt, einschließlich des Rauschens, und die Generalisierung auf die Testdaten nicht gelingt.

Warum Hyperparameter-Tuning wichtig ist

Eine effektive Abstimmung der Hyperparameter ist für die Erstellung leistungsstarker ML-Modelle unerlässlich. Ein gut abgestimmtes Modell erzielt eine höhere Genauigkeit, eine schnellere Konvergenz beim Training und eine bessere Generalisierung auf ungesehene Daten. Für komplexe Aufgaben wie die Objekterkennung mit Modellen wie Ultralytics YOLOkann die Suche nach optimalen Hyperparametern Leistungskennzahlen wie die mittlere durchschnittliche Genauigkeit (mAP) und die Inferenzgeschwindigkeit drastisch verbessern, was für Anwendungen, die Echtzeitinferenzen erfordern, entscheidend ist. Das Ziel ist es, die Kompromisse, wie z. B. den Kompromiss zwischen Verzerrung und Varianz, zu navigieren, um den Sweet Spot für ein bestimmtes Problem und einen bestimmten Datensatz zu finden, der häufig anhand von Validierungsdaten bewertet wird.

Techniken zur Abstimmung der Hyperparameter

Es gibt verschiedene Strategien, um die besten Hyperparameterwerte zu finden:

  • Rastersuche: Probiert alle möglichen Kombinationen der angegebenen Hyperparameterwerte aus. Einfach, aber rechenintensiv.
  • Zufällige Suche: Stellt Hyperparameterkombinationen nach dem Zufallsprinzip aus vorgegebenen Verteilungen zusammen. Oft effizienter als die Rastersuche.
  • Bayes'sche Optimierung: Erstellt ein probabilistisches Modell der Zielfunktion (z. B. der Modellgenauigkeit) und verwendet es, um vielversprechende Hyperparameter für die nächste Bewertung auszuwählen. Tools wie Optuna setzen dies um.
  • Evolutionäre Algorithmen: Nutzt von der biologischen Evolution inspirierte Konzepte wie Mutation und Crossover, um Populationen von Hyperparametersätzen iterativ zu verfeinern. Ultralytics YOLO nutzen dies für die Evolution von Hyperparametern.

Tools wie Weights & Biases Sweeps, ClearML, Cometund KerasTuner helfen dabei, diese Tuning-Prozesse zu automatisieren und zu verwalten, wobei sie oft mit Frameworks wie PyTorch und TensorFlow.

Hyperparameter-Tuning im Vergleich zu verwandten Konzepten

Es ist wichtig, das Hyperparameter-Tuning von verwandten ML-Konzepten zu unterscheiden:

  • Modelltraining: Die Abstimmung der Hyperparameter legt die Bedingungen für das Training fest (z. B. Lernrate, Stapelgröße). Die Modellschulung ist der Prozess des Lernens von Modellparameternweights and biases) auf der Grundlage von Daten, unter Verwendung der gewählten Hyperparameter und eines Optimierungsalgorithmus.
  • Optimierungsalgorithmen (Adam, SGD): Diese Algorithmen aktualisieren die Modellparameter während des Trainings auf der Grundlage der Verlustfunktion. Hyperparameter steuern diese Algorithmen (z. B. die Lernrate), aber der Abstimmungsprozess selbst ist von der Funktionsweise des Algorithmus getrennt.
  • Regularisierung: Techniken wie L1/L2-Regularisierung oder Dropout helfen, eine Überanpassung zu verhindern. Die Stärke oder Rate dieser Techniken sind selbst Hyperparameter, die abgestimmt werden müssen.
  • Automatisiertes maschinelles Lernen (AutoML): Ein breiterer Bereich, der darauf abzielt, die gesamte ML-Pipeline zu automatisieren, einschließlich Feature Engineering, Modellauswahl und Hyperparameter-Tuning. HPT ist oft eine Schlüsselkomponente von AutoML-Systemen.

Anwendungen in der realen Welt

Die Abstimmung der Hyperparameter wird auf verschiedene Bereiche angewendet:

Hyperparameter-Tuning mit Ultralytics

Ultralytics bietet Werkzeuge zur Vereinfachung der Abstimmung von Hyperparametern für YOLO . Die Ultralytics Tuner Klasse, dokumentiert in der Hyperparameter Tuning Leitfadenautomatisiert den Prozess mithilfe von evolutionären Algorithmen. Integration mit Plattformen wie Ray Tune bietet weitere Funktionen für verteilte und fortgeschrittene Suchstrategien, die den Nutzern helfen, ihre Modelle effizient für bestimmte Datensätze zu optimieren (wie COCO) und Aufgaben, die Ressourcen wie Ultralytics HUB für die Verfolgung und Verwaltung von Experimenten. Unter Tipps zur Modellausbildung beinhaltet oft eine effektive Abstimmung der Hyperparameter.

Alles lesen