Automatisiertes maschinelles Lernen (AutoML) bezeichnet den Prozess der Automatisierung der zeitaufwändigen, iterativen Aufgaben, die mit der Entwicklung von Modellen für maschinelles Lernen (ML) verbunden sind. Ziel ist es, ML-Techniken für Personen zugänglicher zu machen, die keine Experten auf diesem Gebiet sind (z. B. Datenwissenschaftler/innen), und den Entwicklungsprozess für erfahrene Praktiker/innen zu beschleunigen. AutoML-Tools und -Plattformen automatisieren verschiedene Phasen der ML-Pipeline und ermöglichen es den Nutzern, mit minimalem manuellen Aufwand hochwertige Modelle zu erstellen.
Wichtige automatisierte Aufgaben in AutoML
AutoML-Systeme automatisieren in der Regel mehrere wichtige Schritte im Workflow des maschinellen Lernens:
- Vorverarbeitung der Daten: Behandlung fehlender Werte, Skalierung von Merkmalen und Durchführung notwendiger Transformationen an den Trainingsdaten. So wird sichergestellt, dass die Daten für das Modelltraining geeignet sind. Techniken wie die Normalisierung werden oft automatisiert.
- Feature Engineering: Automatisches Erstellen neuer Merkmale aus vorhandenen Merkmalen oder Auswählen der wichtigsten Merkmale zur Verbesserung der Modellleistung. Dies kann mit Techniken geschehen, die in den Feature Engineering-Konzepten behandelt werden.
- Modellauswahl: Auswahl des besten Algorithmus (z. B. Entscheidungsbäume, neuronale Netze wie Ultralytics YOLOoder Support-Vektor-Maschinen) für eine bestimmte Aufgabe und einen bestimmten Datensatz. AutoML-Plattformen untersuchen oft verschiedene Architekturen zur Objekterkennung oder Klassifizierungsmodelle.
- Hyperparameter-Tuning: Optimieren der Konfigurationseinstellungen (Hyperparameter) des ausgewählten Modells, um die beste Leistung zu erzielen. Dies ist ein wichtiger Schritt, der in den Anleitungen zum Hyperparameter-Tuning beschrieben wird.
Vorteile von AutoML
Die Verwendung von AutoML bietet mehrere Vorteile:
- Gesteigerte Effizienz: Automatisiert sich wiederholende Aufgaben und verkürzt die Zeit, die für die Entwicklung und den Einsatz von ML-Modellen benötigt wird, erheblich.
- Verbesserte Zugänglichkeit: Ermöglicht es Domänenexperten und Entwicklern mit weniger ML-Kenntnissen, leistungsstarke Modellierungstechniken zu nutzen.
- Bessere Leistung: Es kann eine größere Bandbreite an Modellen und Hyperparametern untersucht werden als bei manuellen Ansätzen, was zu genaueren und robusteren Modellen führen kann. Plattformen wie Ultralytics HUB vereinfachen den Trainingsprozess und tragen so zu dieser Effizienz bei.
- Geringere Voreingenommenheit: Die Automatisierung kann dazu beitragen, die menschliche Voreingenommenheit bei der Auswahl und Abstimmung von KI-Modellen zu verringern, auch wenn eine sorgfältige Überwachung weiterhin notwendig ist.
Anwendungen in der realen Welt
AutoML wird in verschiedenen Branchen eingesetzt:
- Erkennung von Betrug: Finanzinstitute nutzen AutoML, um schnell Modelle zu erstellen und zu aktualisieren, die betrügerische Transaktionen erkennen, indem sie automatisch verschiedene Algorithmen und Merkmale an Transaktionsdaten testen. Dies verbessert die Aufdeckungsraten und passt sich neuen Betrugsmustern schneller an als die manuelle Modellierung.
- Medizinische Bildanalyse: Im Gesundheitswesen hilft AutoML bei der Entwicklung von Modellen für Aufgaben wie die medizinische Bildanalyse, z. B. die Erkennung von Tumoren oder Anomalien in Röntgenbildern oder MRTs. AutoML kann komplexe Deep-Learning-Modelle für hohe Genauigkeit optimieren.
AutoML vs. MLOps
Während sich AutoML auf die Automatisierung der Modellerstellung (Auswahl, Training, Tuning) konzentriert, umfasst Machine Learning Operations (MLOps) den gesamten Lebenszyklus eines ML-Modells, einschließlich Einsatz, Überwachung, Verwaltung und Governance. AutoML kann als Teil einer umfassenderen MLOps-Strategie betrachtet werden, die die anfängliche Phase der Modellerstellung rationalisiert, bevor sie an die Bereitstellungs- und Modellüberwachungspipelines weitergegeben wird.