Datenabweichung
Entdecken Sie die Arten, Ursachen und Lösungen für Datendrift beim maschinellen Lernen. Erfahren Sie, wie Sie Datendrift für robuste KI-Modelle erkennen und abschwächen können.
Die Datendrift ist eine häufige Herausforderung beim maschinellen Lernen (ML), die auftritt, wenn sich die statistischen Eigenschaften der Daten, auf die ein Modell in der Produktion trifft, im Laufe der Zeit im Vergleich zu den Trainingsdaten, auf denen es aufgebaut wurde, ändern. Diese Veränderung bedeutet, dass das Modell mit Daten arbeitet, auf die es nicht vorbereitet war, was zu einer stillen, aber signifikanten Verschlechterung seiner Vorhersageleistung führen kann. Die effektive Verwaltung der Datendrift ist eine wichtige Komponente des MLOps-Lebenszyklus, um sicherzustellen, dass die Systeme der künstlichen Intelligenz (KI) auch nach der Modellbereitstellung zuverlässig bleiben. Ohne proaktive Modellüberwachung kann dieses Problem unentdeckt bleiben, was zu schlechten Entscheidungen und negativen Geschäftsergebnissen führt.
Datendrift vs. Konzeptdrift
Es ist wichtig, die Datendrift von einem verwandten Problem, der Konzeptdrift, zu unterscheiden. Beide können zwar die Modellleistung beeinträchtigen, haben aber unterschiedliche Ursachen.
- Daten-Drift: Dies ist der Fall, wenn sich die Verteilung der Eingabedaten ändert, die zugrunde liegende Beziehung zwischen Eingaben und Ausgaben jedoch konstant bleibt. So kann beispielsweise ein Bildverarbeitungsmodell, das auf Bildern eines Kameratyps trainiert wurde, bei Bildern einer neuen Kamera mit anderen Sensoreigenschaften schlecht abschneiden. Die Definition der zu erkennenden Objekte ist dieselbe, aber die Merkmale der Eingabedaten haben sich geändert.
- Konzeptdrift: Diese tritt auf, wenn sich die statistischen Eigenschaften der Zielvariablen im Laufe der Zeit ändern. Die grundlegende Beziehung zwischen den Eingangsmerkmalen und der Ausgangsvariablen ändert sich. In einem System zur Erkennung von Finanzbetrug entwickeln sich beispielsweise die von Betrügern angewandten Taktiken weiter, wodurch sich die Definition einer "betrügerischen" Transaktion ändert. Eine detaillierte Untersuchung der Konzeptdrift findet sich in der wissenschaftlichen Literatur.
Beispiele aus der Praxis
- Lagerbestandsmanagement im Einzelhandel: Ein KI-gesteuertes Einzelhandelssystem verwendet Kameraaufnahmen und ein Objekterkennungsmodell wie Ultralytics YOLO11 zur Überwachung des Regalbestands. Das Modell wird auf einen bestimmten Satz von Produktverpackungen trainiert. Wenn ein Lieferant das Verpackungsdesign ändert oder das Geschäft seine Beleuchtung aufrüstet, führt dies zu einer Datenabweichung. Die neuen visuellen Daten unterscheiden sich von dem ursprünglichen Trainingsdatensatz, was dazu führen kann, dass das Modell die Produkte nicht mehr erkennt, was wiederum zu ungenauen Bestandszählungen führt.
- Autonome Fahrzeuge: Selbstfahrende Autos verwenden Modelle, die auf der Grundlage großer Mengen von Sensordaten aus bestimmten geografischen Gebieten und Wetterbedingungen trainiert wurden. Wenn ein Auto in einer neuen Stadt eingesetzt wird oder zum ersten Mal auf ein seltenes Wetterereignis wie Schnee trifft, ist sein Wahrnehmungssystem mit einer Datendrift konfrontiert. Die Verteilung der Eingaben (z. B. Straßenmarkierungen, Verkehrsschilder, Fußgängerverhalten) unterscheidet sich erheblich von der Trainingserfahrung, was die Sicherheit beeinträchtigen kann und sofortige Aufmerksamkeit erfordert. Waymo und andere Unternehmen im Bereich des autonomen Fahrens investieren viel in die Erkennung und Abschwächung dieses Problems.
Erkennen und Abschwächen von Datendrift
Die Erkennung und Behebung von Datendrift ist ein fortlaufender Prozess, der eine Kombination von Überwachungs- und Wartungsstrategien erfordert.
Erkennungsmethoden
- Leistungsüberwachung: Die Verfolgung wichtiger Modellmetriken wie Präzision, Recall und F1-Score im Laufe der Zeit kann eine Leistungsverschlechterung anzeigen, die möglicherweise durch Drift verursacht wird. Tools wie TensorBoard können helfen, diese Metriken zu visualisieren.
- Statistische Überwachung: Anwendung von statistischen Tests, um die Verteilung der eingehenden Daten mit den Trainingsdaten zu vergleichen. Zu den gängigen Methoden gehören der Kolmogorov-Smirnov-Test, der Populationsstabilitätsindex (PSI) oder Chi-Quadrat-Tests.
- Überwachungswerkzeuge: Verwendung von spezialisierten Beobachtungsplattformen, die für die Überwachung von ML-Modellen in der Produktion entwickelt wurden. Zu den Open-Source-Optionen gehören Prometheus und Grafana, während spezielle ML-Tools wie Evidently AI und NannyML spezifischere Funktionen zur Erkennung von Drifts bieten. Cloud-Anbieter bieten auch Lösungen wie AWS SageMaker Model Monitor und Vertex AI Model Monitoring von Google Cloud an.
Strategien zur Schadensbegrenzung
- Neu trainieren: Die einfachste Strategie besteht darin, das Modell regelmäßig anhand frischer, aktueller Daten, die die aktuelle Produktionsumgebung widerspiegeln, neu zu trainieren. Plattformen wie Ultralytics HUB erleichtern die Umschulung und den Einsatz von Workflows.
- Online-Lernen: Hierbei wird das Modell schrittweise aktualisiert, wenn neue Daten eintreffen. Es sollte mit Vorsicht eingesetzt werden, da es empfindlich auf verrauschte Daten reagieren kann und die Leistung des Modells in unvorhersehbarer Weise schwanken kann.
- Datenerweiterung: Der proaktive Einsatz von Datenerweiterungstechniken während der anfänglichen Trainingsphase kann das Modell robuster gegenüber bestimmten Arten von Variationen machen, wie z. B. Änderungen der Beleuchtung, des Maßstabs oder der Ausrichtung.
- Bereichsanpassung: Einsatz fortgeschrittener Techniken, die explizit versuchen, ein auf einer Quelldatenverteilung trainiertes Modell an eine andere, aber verwandte Zieldatenverteilung anzupassen. Dies ist ein aktiver Bereich der ML-Forschung.
Ein effektiver Umgang mit der Datenabweichung ist von entscheidender Bedeutung, um sicherzustellen, dass KI-Systeme, die mit Frameworks wie PyTorch oder TensorFlow entwickelt wurden, während ihrer gesamten Betriebsdauer genau bleiben und einen Mehrwert bieten. In unserem Blog erfahren Sie mehr über Best Practices zur Modellpflege.