Glossar

Datenerweiterung

Entdecken Sie, wie Datenanreicherung die Robustheit von Modellen verbessert und Überanpassung reduziert. Lernen Sie wichtige Techniken kennen, um die Leistung Ultralytics für Computer Vision zu verbessern.

Die Datenvergrößerung ist eine wichtige Technik im maschinellen Lernen und in der Bildverarbeitung, mit der die Größe und Vielfalt eines Trainingsdatensatzes künstlich erhöht wird, indem modifizierte Versionen vorhandener Daten erstellt werden. Anstatt völlig neue Daten zu sammeln und zu kennzeichnen – was zeitaufwändig und teuer sein kann – werden bei der Erweiterung verschiedene Transformationen auf die ursprünglichen Proben angewendet. Diese Modifikationen helfen Maschinellen Lernmodellen dabei, Muster robuster zu erkennen und sicherzustellen, dass sie auch bei Abweichungen in realen Umgebungen gut funktionieren. Indem Modelle während des Trainings einer größeren Bandbreite an Szenarien ausgesetzt werden, können Entwickler Überanpassungen effektiv reduzieren und die Generalisierung verbessern.

Relevanz in der modernen KI

Im Bereich der Computervision haben Modelle oft Schwierigkeiten, wenn sie mit Bildern konfrontiert werden, die sich geringfügig von ihren Trainingsdaten unterscheiden. Unterschiede in der Beleuchtung, Ausrichtung oder Hintergrundunordnung können ein Modell verwirren, das nicht genügend Vielfalt gesehen hat. Die Datenvergrößerung behebt dies, indem sie diese Variationen programmgesteuert simuliert. Beispielsweise kann ein Bild einer Katze gedreht, gespiegelt oder leicht unscharf gemacht werden, um dem Modell beizubringen, dass das Motiv unabhängig von diesen Änderungen eine „Katze” bleibt.

Dieser Prozess ist für den Erfolg moderner Architekturen wie Ultralytics von entscheidender Bedeutung, die auf umfangreiche und vielfältige Datensätze angewiesen sind , um eine hohe Genauigkeit bei Aufgaben wie der Objekterkennung und der Bildsegmentierung zu erreichen. Durch die Synthese neuer Trainingsbeispiele ermöglicht die Augmentierung den Modellen das Erlernen invarianter Merkmale – also Eigenschaften, die sich trotz Änderungen in den Eingaben nicht verändern.

Gängige Techniken und Methoden

Die Datenvergrößerung umfasst eine Vielzahl von Transformationstechniken, die von einfachen geometrischen Anpassungen bis hin zu komplexen generativen Ansätzen reichen:

Geometrische Transformationen: Dazu gehören Operationen wie Drehen, Skalieren, Spiegeln, Zuschneiden und Verschieben (Translation) von Bildern. Diese stellen Änderungen des Blickwinkels der Kamera oder der Position des Objekts dar.
Farbraumanpassungen: Durch die Änderung von Helligkeit, Kontrast, Sättigung und Farbton können Modelle unterschiedliche Lichtverhältnisse oder Kamerasensoren besser verarbeiten.
Rauschinjektion: Durch Hinzufügen von Zufallsrauschen (z. B. Gaußschem Rauschen) können Modelle widerstandsfähiger gegenüber körnigen oder minderwertigen Eingabedaten gemacht werden.
Mixing Images: Techniken wie MixUp Mosaic (beliebt im YOLO ) kombinieren mehrere Bilder zu einem einzigen Trainingsbeispiel und zwingen das Modell so, Kontext- und Objektbeziehungen effektiver zu lernen.
Generative Ansätze: Fortgeschrittene Methoden verwenden generative KI oder Diffusionsmodelle, um völlig neue, synthetische Trainingsbeispiele zu erstellen, die die Eigenschaften des ursprünglichen Datensatzes nachahmen.

Anwendungsfälle in der Praxis

Die praktischen Auswirkungen der Datenvergrößerung erstrecken sich über zahlreiche Branchen, in denen Datenknappheit oder hohe Variabilität eine Herausforderung darstellen.

Autonomes Fahren

Bei der Entwicklung autonomer Fahrzeuge ist es nahezu unmöglich, Daten für alle möglichen Wetterbedingungen oder Lichtszenarien zu sammeln. Ingenieure verwenden Daten Augmentation, um Regen, Nebel, Schnee oder Blendung auf Bildern bei klarem Wetter zu simulieren. Dadurch wird sichergestellt, dass das Wahrnehmungssystem unabhängig von Umweltfaktoren detect , Verkehrszeichen und andere Fahrzeuge zuverlässig detect kann, was die Sicherheit und Zuverlässigkeit erhöht.

Medizinische Bildgebung

Die medizinische Bildanalyse leidet häufig unter begrenzten Datensätzen aufgrund von Datenschutzbedenken und der Seltenheit bestimmter Erkrankungen. Durch Augmentierung können Forscher kleine Datensätze von Röntgen- oder MRT-Aufnahmen durch elastische Verformungen, Rotationen oder Intensitätsverschiebungen erweitern. Dies hilft beim Training robuster Diagnosemodelle, die in der Lage sind, Tumore oder Frakturen mit hoher Sensitivität zu identifizieren, selbst wenn die Positionierung des Patienten oder die Scanqualität variiert.

Unterscheidung von verwandten Konzepten

Es ist wichtig, Datenvergrößerung von synthetischen Daten zu unterscheiden. Während beide darauf abzielen, die Datensatzgröße zu erhöhen, werden synthetische Daten künstlich von Grund auf neu generiert (oft mithilfe von 3D-Rendering- oder Simulations-Engines), während die Datenvergrößerung vorhandene reale Daten modifiziert. Darüber hinaus umfasst die Datenvorverarbeitung die Bereinigung und Formatierung von Daten (z. B. Größenanpassung, Normalisierung), um sie für ein Modell geeignet zu machen, aber im Gegensatz zur Augmentation erhöht sie nicht unbedingt die Anzahl der Trainingsbeispiele.

Implementierung von Augmentation mit Ultralytics

Moderne Frameworks integrieren Augmentationen direkt in die Trainingspipeline. Das folgende Beispiel zeigt, wie Augmentationen wie Spiegelung und Skalierung während des Trainings eines YOLO26-Modells unter Verwendung des ultralytics Paket.

from ultralytics import YOLO

# Load the YOLO26 model
model = YOLO("yolo26n.pt")

# Train with custom data augmentation hyperparameters
# fliplr: 50% chance of horizontal flip, scale: image scaling gain
results = model.train(data="coco8.yaml", epochs=10, fliplr=0.5, scale=0.5)

Durch die Anpassung dieser Hyperparameter können Entwickler die Augmentierungsstrategie auf die spezifischen Anforderungen ihres Datensatzes und ihrer Anwendung zuschneiden und so die Flexibilität der Ultralytics für eine effiziente Modellentwicklung nutzen.

Datenerweiterung

Trainieren Sie Ultralytics YOLO zur Rationalisierung von Arbeitsabläufen in verschiedenen Branchen

Flexible Enterprise-Lizenzlösung zur Förderung Ihrer Innovationen

Trainieren Sie AI-Modelle in Sekundenschnelle mit Ultralytics YOLO

Relevanz in der modernen KI

Gängige Techniken und Methoden

Anwendungsfälle in der Praxis

Autonomes Fahren

Medizinische Bildgebung

Unterscheidung von verwandten Konzepten

Implementierung von Augmentation mit Ultralytics

Mehr in dieser Kategorie lesen

12 Anwendungsfälle für Luftbildaufnahmen, unterstützt durch Computer Vision

Was ist monokulare Tiefenschätzung? Ein Überblick

Ein Blick auf die Verwendung von Ultralytics YOLO für die KI-Bedrohungserkennung

Werden Sie Mitglied der Ultralytics