Automatisiertes maschinelles Lernen (Automated Machine Learning, AutoML) ist ein Prozess, der die gesamte Pipeline der Anwendung von maschinellem Lernen (ML) auf reale Probleme automatisiert. Das Hauptziel von AutoML ist es, die Entwicklung von ML-Modellen zu vereinfachen und zu beschleunigen und fortgeschrittene Techniken auch für diejenigen zugänglich zu machen, die keine tiefgreifenden Kenntnisse in Data Science oder ML haben. Durch die Automatisierung sich wiederholender und zeitaufwändiger Aufgaben ermöglicht AutoML Entwicklern und Forschern, leistungsfähige Modelle effizienter zu erstellen und den Bedarf an umfangreichen manuellen Konfigurationen und Experimenten zu reduzieren. Diese Automatisierung umfasst verschiedene Stufen, von der Aufbereitung der Rohdaten bis zur Bereitstellung optimierter Modelle.
Wichtige automatisierte Aufgaben in AutoML
AutoML-Systeme automatisieren mehrere Kernkomponenten des typischen ML-Workflows:
- Datenvorverarbeitung: Automatische Aufgaben wie das Bereinigen von Daten, die Verwaltung fehlender Werte, die Konvertierung von Datentypen und die Anwendung von Techniken wie Normalisierung oder Standardisierung, um Trainingsdaten für die Modellierung vorzubereiten.
- Feature Engineering: Automatisierung der Erstellung, Auswahl und Umwandlung von Eingangsmerkmalen zur Verbesserung der Modellleistung. Dabei können Techniken zum Einsatz kommen, die in den Feature Engineering-Konzepten beschrieben werden.
- Modellauswahl: Automatische Auswahl des besten Modelltyps (z. B. Entscheidungsbäume, neuronale Netze, SVMs) für eine bestimmte Aufgabe und einen bestimmten Datensatz aus einer Reihe von Möglichkeiten, darunter Architekturen zur Objekterkennung wie Ultralytics YOLO.
- Abstimmung der Hyperparameter: Optimierung der Hyperparameter des Modells (z. B. Lernrate, Stapelgröße) mit Techniken wie der Rastersuche, der Zufallssuche oder fortschrittlicheren Methoden wie der Bayes'schen Optimierung, um Spitzenleistungen zu erzielen.
Vorteile von AutoML
Die Einführung von AutoML bietet erhebliche Vorteile:
- Effizienz: Der Zeit- und Rechenaufwand für die Entwicklung und Feinabstimmung von ML-Modellen wird drastisch reduziert.
- Zugänglichkeit: Die Einstiegshürde für ML wird gesenkt, so dass auch Fachleute und Entwickler mit weniger ML-Erfahrung leistungsstarke Vorhersagefunktionen nutzen können. Ultralytics HUB zielt darauf ab, diesen Prozess weiter zu vereinfachen.
- Leistung: Identifiziert oft Modelle und Konfigurationen, die eine hohe Genauigkeit und Robustheit erreichen und manchmal sogar die manuell entwickelten Modelle übertreffen, indem sie einen riesigen Suchraum erkunden.
- Geringere Verzerrungen: Durch die Automatisierung der Modellauswahl und -abstimmung kann AutoML dazu beitragen, menschliche Verzerrungen in der KI, die durch manuelle Entscheidungen entstehen können, zu verringern, auch wenn eine sorgfältige Überwachung der Verzerrungen in den Datensätzen immer noch wichtig ist.
Anwendungen in der realen Welt
AutoML findet in vielen verschiedenen Bereichen Anwendung:
AutoML vs. Verwandte Konzepte
Es ist hilfreich, AutoML von verwandten Bereichen zu unterscheiden:
- AutoML vs. MLOps: Während AutoML speziell auf die Automatisierung der Modellerstellung (Auswahl, Training, Tuning) abzielt, deckt Machine Learning Operations (MLOps) den gesamten ML-Lebenszyklus ab. MLOps umfasst die Bereitstellung, Überwachung, Verwaltung und Steuerung und stellt sicher, dass die Modelle in der Produktion zuverlässig funktionieren. AutoML ist oft eine Komponente in einem größeren MLOps-Framework, das die anfängliche Entwicklungsphase vor der Modellbereitstellung und -überwachung rationalisiert.
- AutoML vs. NAS: Neural Architecture Search (NAS) ist ein Teilbereich von AutoML, der sich speziell auf den automatischen Entwurf der Architektur von neuronalen Netzen (NN) konzentriert. Während NAS den Entwurf von Netzen automatisiert, können umfassendere AutoML-Tools auch das Feature-Engineering und die Abstimmung von Hyperparametern für verschiedene Modelltypen automatisieren, nicht nur für NNs.