Glossar

Datenerweiterung

Verbessere deine Machine-Learning-Modelle mit Datenerweiterung. Entdecke Techniken, um die Genauigkeit zu erhöhen, die Überanpassung zu reduzieren und die Robustheit zu verbessern.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Die Datenerweiterung ist eine Technik, die beim maschinellen Lernen (ML) eingesetzt wird, um den Umfang und die Vielfalt eines Trainingsdatensatzes künstlich zu vergrößern, indem modifizierte Kopien bestehender Datenpunkte erstellt oder neue synthetische Daten daraus erzeugt werden. Dieser Prozess hilft dabei, die Leistung, Generalisierung und Robustheit von ML-Modellen zu verbessern, insbesondere in Bereichen wie dem maschinellen Sehen, in denen das Sammeln großer Mengen unterschiedlicher Daten schwierig und teuer sein kann. Indem wir Modelle wie Ultralytics YOLO während des Trainings einer breiteren Palette von Variationen aussetzen, trägt die Datenerweiterung dazu bei, dass sie bei ungesehenen, realen Daten besser abschneiden.

Wie die Datenerweiterung funktioniert

Bei der Datenerweiterung werden die ursprünglichen Datenpunkte auf verschiedene Weise transformiert, um neue, plausible Beispiele zu erstellen. Bei Bilddaten sind folgende Techniken üblich:

  • Geometrische Transformationen: Drehen, Skalieren, Verschieben, Spiegeln (horizontal oder vertikal) und Scheren von Bildern.
  • Farbraumtransformationen: Anpassen von Helligkeit, Kontrast, Sättigung, Farbton oder Anwenden von Color Jittering.
  • Rauschinjektion: Hinzufügen von zufälligem Rauschen (z. B. Gaußsches Rauschen), um Sensorschwächen oder schlechte Lichtverhältnisse zu simulieren.
  • Random Erasing/Cutout: Das Entfernen von zufälligen Bereichen aus einem Bild, um das Modell dazu zu bringen, sich auf verschiedene Teile eines Objekts zu konzentrieren.
  • Bilder mischen: Das Kombinieren mehrerer Bilder, wie z. B. bei der Mosaik-Erweiterung (die in Modellen wie YOLOv4 verwendet wird) oder MixUp, um zusammengesetzte Trainingsmuster zu erstellen.

Obwohl sie vor allem in der Computer Vision Anwendung finden, gibt es auch für andere Datentypen Augmentierungsverfahren, z. B. für die Ersetzung von Synonymen oder die Rückübersetzung von Textdaten in der natürlichen Sprachverarbeitung (NLP).

Wichtigkeit und Nutzen

Die Datenerweiterung bietet mehrere entscheidende Vorteile bei der Entwicklung von ML-Modellen:

  • Reduziert das Problem der Datenknappheit: Sie erweitert begrenzte Datensätze und macht es möglich, komplexe Modelle wie tiefe neuronale Netze zu trainieren, auch wenn keine großen Mengen an Originaldaten verfügbar sind.
  • Verhindert Overfitting: Durch die Einführung von Variationen verhindert die Augmentation, dass die Modelle die Trainingsdaten nur auswendig lernen(Overfitting), und ermutigt sie, mehr verallgemeinerbare Merkmale zu lernen. Lies unsere Tipps zum Modelltraining für weitere Strategien.
  • Verbessert die Modellrobustheit: Durch das Training mit erweiterten Daten reagieren die Modelle weniger empfindlich auf Veränderungen in der Eingabe, wie z. B. Änderungen der Beleuchtung, der Ausrichtung oder des Maßstabs, was zu einer besseren Leistung unter verschiedenen realen Bedingungen führt.
  • Kosten- und Zeiteffizienz: Es ist oft billiger und schneller, vorhandene Daten zu ergänzen, als neue Daten zu sammeln und zu kennzeichnen.

Techniken und Werkzeuge

Verschiedene Bibliotheken vereinfachen die Implementierung von Techniken zur Datenerweiterung. Zu den beliebten Tools für Computer Vision Aufgaben gehören:

Ultralytics enthalten mehrere eingebaute Augmentierungstechniken, und Nutzer können Datensätze und Modelle mit Plattformen wie Ultralytics HUB verwalten.

Anwendungen in der realen Welt

Die Datenerweiterung wird in vielen verschiedenen Bereichen eingesetzt:

  1. Medizinische Bildgebung: Im Gesundheitswesen kann es aufgrund von Datenschutzbestimmungen und der Seltenheit bestimmter Erkrankungen schwierig sein, große, vielfältige Datensätze medizinischer Bilder (wie Röntgenbilder oder CT-Scans) zu erhalten. Durch Datenanreicherung (z. B. Drehen, Zoomen, Kontrastanpassung) können robuste Modelle für Aufgaben wie die Tumorerkennung oder die Klassifizierung von Krankheiten trainiert und so die Diagnosegenauigkeit verbessert werden. Dies ist ein wichtiger Teil des Fortschritts der KI im Gesundheitswesen.
  2. Autonome Fahrzeuge: Selbstfahrende Autos sind stark auf die Objekterkennung angewiesen, um ihre Umgebung wahrzunehmen. Die Erweiterung von Trainingsbildern durch die Simulation verschiedener Wetterbedingungen (Regen, Nebel), Lichtverhältnisse (Tag, Nacht), das Hinzufügen von Verdeckungen oder unterschiedliche Objektperspektiven tragen dazu bei, dass das Wahrnehmungssystem des Fahrzeugs in verschiedenen Fahrszenarien zuverlässig funktioniert. Dies erhöht die Sicherheit in der KI für Automotive-Anwendungen.

Datenerweiterung vs. synthetische Daten

Die Datenerweiterung ist zwar verwandt, unterscheidet sich aber von der Erzeugung synthetischer Daten. Bei der Datenerweiterung werden in der Regel vorhandene reale Datenpunkte transformiert, um leicht veränderte Versionen zu erstellen. Im Gegensatz dazu sind synthetische Daten völlig neue Daten, die künstlich erzeugt werden, oft mit Hilfe von Simulationen, Algorithmen oder generativen Modellen wie GANs, ohne dass ein echter Datenpunkt zugrunde liegt. Beide Techniken zielen darauf ab, Datensätze zu verbessern, aber synthetische Daten können potenziell Szenarien erzeugen, die in den Originaldaten gar nicht vorkommen, während die Augmentation in erster Linie die Varianz der vorhandenen Daten erhöht.

Alles lesen