Grüner Scheck
Link in die Zwischenablage kopiert

Die Bedeutung von qualitativ hochwertigen Computer-Vision-Datensätzen

Erforsche mit uns, wie wichtig qualitativ hochwertige Daten für die Erstellung von Computer Vision Modellen sind. Entdecke, wie sich die Qualität der Daten auf die Leistung des Modells auswirken kann.

Bis 2019 ist die Verbreitung von künstlicher Intelligenz (KI) in Unternehmen in den letzten vier Jahren um 270 % gestiegen. Dieses Wachstum hat die schnelle Integration von Computer-Vision-Anwendungen (CV) vorangetrieben - KI-Systeme, die es Maschinen ermöglichen, visuelle Daten aus ihrer Umgebung zu interpretieren und zu analysieren. Diese Anwendungen ermöglichen eine breite Palette von Technologien, von der Erkennung von Krankheiten in der medizinischen Bildgebung über autonome Fahrzeuge bis hin zur Optimierung des Verkehrsflusses im Transportwesen und der Verbesserung der Überwachung in Sicherheitssystemen. 

Die bemerkenswerte Genauigkeit und unübertroffene Leistung modernster Computer Vision Modelle wie Ultralytics YOLO11 haben dieses exponentielle Wachstum maßgeblich vorangetrieben. Die Leistung dieser Modelle hängt jedoch stark von der Qualität und Quantität der Daten ab, die zum Trainieren, Validieren und Testen der Modelle verwendet werden. 

Ohne ausreichend hochwertige Daten ist es schwierig, Bildverarbeitungsmodelle zu trainieren und sie so zu optimieren, dass sie den Industriestandards entsprechen. In diesem Artikel erfahren wir, welche wichtige Rolle Daten bei der Erstellung von Bildverarbeitungsmodellen spielen und warum hochwertige Daten in der Bildverarbeitung so wichtig sind. Außerdem stellen wir dir einige Tipps vor, die dir helfen, hochwertige Datensätze zu erstellen, während du daran arbeitest, eigene Computer Vision Modelle zu trainieren. Los geht's!

Die Rolle von Daten bei der Erstellung von Computer Vision Modellen

Computer-Vision-Modelle können auf großen Datenmengen von Bildern und Videos trainiert werden, um Muster zu erkennen und genaue Vorhersagen zu treffen. Ein Modell zur Objekterkennung kann zum Beispiel auf Hunderten oder sogar Tausenden von markierten Bildern und Videos trainiert werden, um Objekte genau zu erkennen. 

Die Qualität und Quantität dieser Trainingsdaten beeinflussen die Leistung des Modells

Da Computer-Vision-Modelle nur aus den Daten lernen können, denen sie ausgesetzt sind, ist die Bereitstellung hochwertiger Daten und vielfältiger Beispiele entscheidend für ihren Erfolg. Ohne ausreichende und vielfältige Datensätze können diese Modelle reale Szenarien nicht richtig analysieren und könnten verzerrte oder ungenaue Ergebnisse liefern. 

Deshalb ist es wichtig, die Rolle der Daten beim Modelltraining genau zu verstehen. Bevor wir uns mit den Merkmalen qualitativ hochwertiger Daten befassen, sollten wir die Arten von Datensätzen verstehen, auf die du beim Training von Computer-Vision-Modellen treffen kannst.

Arten von Computer Vision-Datensätzen

In der Computer Vision werden die Daten, die für den Trainingsprozess verwendet werden, in drei Kategorien eingeteilt, die jeweils einem bestimmten Zweck dienen. Hier ist ein kurzer Überblick über jede Art:

  • Ausbildungsdaten: Dies ist der primäre Datensatz, der verwendet wird, um das Modell von Grund auf zu trainieren. Er besteht aus Bildern und Videos mit vordefinierten Bezeichnungen, die es dem Modell ermöglichen, Muster zu lernen und Objekte zu erkennen. 
  • Validierungsdaten: Dies ist ein Datensatz, mit dem überprüft wird, wie gut ein Modell funktioniert, während es trainiert wird. Sie helfen dabei, sicherzustellen, dass das Modell auch bei neuen, ungesehenen Daten korrekt funktioniert.
  • Daten prüfen: Ein separater Datensatz, der verwendet wird, um die endgültige Leistung eines trainierten Modells zu bewerten. Damit wird überprüft, wie gut das Modell Vorhersagen für völlig neue, ungesehene Daten machen kann.
Abb. 1. Wie die Daten in der Computer Vision kategorisiert werden.

Die 5 wichtigsten Merkmale qualitativ hochwertiger Computer Vision Datensätze

Unabhängig von der Art des Datensatzes sind qualitativ hochwertige Daten für die Erstellung erfolgreicher Computer Vision Modelle unerlässlich. Hier sind einige der wichtigsten Merkmale, die einen hochwertigen Datensatz ausmachen:

  • Genauigkeit: Idealerweise sollten die Daten die realen Situationen genau widerspiegeln und korrekte Bezeichnungen enthalten. Wenn es zum Beispiel um Vision AI im Gesundheitswesen geht, müssen die Bilder von Röntgenaufnahmen oder Scans genau beschriftet sein, damit das Modell richtig lernen kann. 
  • Vielfältigkeit: Ein guter Datensatz enthält eine Vielzahl von Beispielen, damit das Modell in verschiedenen Situationen gut funktioniert. Wenn ein Modell zum Beispiel lernt, Autos zu erkennen, sollte der Datensatz Autos verschiedener Formen, Größen und Farben in unterschiedlichen Situationen (Tag, Nacht, Regen usw.) enthalten.
  • Konsistenz: Hochwertige Datensätze folgen einem einheitlichen Format und Qualitätsstandards. Zum Beispiel sollten die Bilder eine ähnliche Auflösung haben (nicht einige unscharf und andere scharf) und die gleichen Vorverarbeitungsschritte durchlaufen, wie Größen- oder Farbanpassungen, damit das Modell aus einheitlichen Informationen lernt.
  • Aktualität: Datensätze, die regelmäßig aktualisiert werden, können mit den Veränderungen in der realen Welt mithalten. Nehmen wir an, du trainierst ein Modell, um alle Arten von Fahrzeugen zu erkennen. Wenn neue Fahrzeuge, wie z. B. Elektroroller, eingeführt werden, sollten sie dem Datensatz hinzugefügt werden, um sicherzustellen, dass das Modell genau und aktuell bleibt.
  • Datenschutz: Wenn ein Datensatz sensible Informationen enthält, wie z. B. Fotos von Personen, muss er den Datenschutzregeln entsprechen. Techniken wie Anonymisierung (Entfernen identifizierbarer Details) und Datenmaskierung (Ausblenden sensibler Teile) können die Privatsphäre schützen und trotzdem eine sichere Nutzung der Daten ermöglichen.

Herausforderungen, die durch Daten geringer Qualität verursacht werden

Es ist zwar wichtig, die Eigenschaften hochwertiger Daten zu verstehen, aber genauso wichtig ist es, zu bedenken, wie sich minderwertige Daten auf deine Computer Vision Modelle auswirken können.

Probleme wie Overfitting und Underfitting können die Leistung eines Modells stark beeinträchtigen. Eine Überanpassung liegt vor, wenn ein Modell bei den Trainingsdaten gut abschneidet, aber bei neuen oder unbekannten Daten Probleme hat, oft weil der Datensatz nicht abwechslungsreich genug ist. Underfitting hingegen tritt auf, wenn der Datensatz nicht genügend Beispiele oder Qualität bietet, damit das Modell sinnvolle Muster lernen kann. Um diese Probleme zu vermeiden, ist es wichtig, vielfältige, unvoreingenommene und qualitativ hochwertige Datensätze zu haben, die eine zuverlässige Leistung sowohl beim Training als auch in der Praxis gewährleisten.

Abb. 2. Underfitting Vs. Overfitting.

Daten von geringer Qualität können es den Modellen auch erschweren, aussagekräftige Muster aus den Rohdaten zu extrahieren und zu lernen, ein Prozess, der als Merkmalsextraktion bekannt ist. Wenn der Datensatz unvollständig, irrelevant oder nicht vielfältig genug ist, kann das Modell nicht effektiv arbeiten. 

Manchmal kann eine schlechte Datenqualität das Ergebnis der Vereinfachung von Daten sein. Die Vereinfachung von Daten kann helfen, Speicherplatz zu sparen und die Verarbeitungskosten zu senken, aber durch eine zu starke Vereinfachung können wichtige Details verloren gehen, die das Modell braucht, um gut zu funktionieren. Deshalb ist es so wichtig, dass die Daten während des gesamten Bildverarbeitungsprozesses, von der Erfassung bis zum Einsatz, von hoher Qualität sind. Als Faustregel gilt, dass die Datensätze die wichtigsten Merkmale enthalten und gleichzeitig vielfältig und genau sein sollten, um zuverlässige Modellvorhersagen zu gewährleisten.

Abb. 3. Verstehen der Merkmalsextraktion.

Tipps zur Erhaltung der Qualität deines Computer Vision-Datensatzes

Nachdem wir nun verstanden haben, wie wichtig qualitativ hochwertige Daten sind und welche Auswirkungen minderwertige Daten haben, wollen wir uns ansehen, wie du sicherstellen kannst, dass dein Datensatz hohe Standards erfüllt.

Alles beginnt mit einer zuverlässigen Datenerhebung. Die Nutzung verschiedener Quellen wie Crowdsourcing, Daten aus unterschiedlichen geografischen Regionen und die Generierung synthetischer Daten verringern Verzerrungen und helfen den Modellen, reale Szenarien zu bewältigen. Sobald die Daten gesammelt sind, ist die Vorverarbeitung entscheidend. Techniken wie die Normalisierung, bei der die Pixelwerte auf einen einheitlichen Bereich skaliert werden, und die Vergrößerung, bei der Transformationen wie Drehen, Spiegeln und Zoomen angewendet werden, verbessern den Datensatz. Diese Schritte tragen dazu bei, dass dein Modell besser verallgemeinert und robuster wird, wodurch das Risiko einer Überanpassung verringert wird.

Die richtige Aufteilung der Datensätze ist ein weiterer wichtiger Schritt. Ein gängiger Ansatz ist es, 70 % der Daten für das Training, 15 % für die Validierung und 15 % für das Testen zu verwenden. Durch die doppelte Überprüfung, dass es keine Überschneidungen zwischen diesen Datensätzen gibt, werden Datenverluste verhindert und eine genaue Modellbewertung gewährleistet.

Abb. 4. Eine gemeinsame Datenaufteilung zwischen Training, Validierung und Test.

Du kannst auch vortrainierte Modelle wie YOLO11 verwenden, um Zeit und Rechenressourcen zu sparen. YOLO11 Diese Modelle, die auf großen Datensätzen trainiert und für verschiedene Bildverarbeitungsaufgaben entwickelt wurden, können auf deinen spezifischen Datensatz abgestimmt werden, um deine Anforderungen zu erfüllen. Indem du das Modell an deine Daten anpasst, kannst du eine Überanpassung vermeiden und eine starke Leistung beibehalten. 

Der Weg in die Zukunft für Computer-Vision-Datensätze

Die KI-Gemeinschaft hat sich traditionell darauf konzentriert, die Leistung zu verbessern, indem sie tiefere Modelle mit mehr Schichten erstellt hat. Mit der Weiterentwicklung der KI verlagert sich der Schwerpunkt jedoch von der Optimierung der Modelle auf die Verbesserung der Qualität der Datensätze. Andrew Ng, der oft als "Vater der KI" bezeichnet wird, ist der Meinung, dass "der wichtigste Wandel, den die KI-Welt in diesem Jahrzehnt vollziehen muss, die Umstellung auf datenzentrierte KI sein wird." 

Bei diesem Ansatz geht es darum, Datensätze zu verfeinern, indem die Genauigkeit der Beschriftung verbessert, verrauschte Beispiele entfernt und die Vielfalt sichergestellt wird. Für die Computer Vision sind diese Prinzipien entscheidend, um Probleme wie Verzerrungen und minderwertige Daten zu beseitigen, damit die Modelle in der realen Welt zuverlässig funktionieren.

Mit Blick auf die Zukunft wird die Weiterentwicklung des maschinellen Sehens von der Erstellung kleinerer, qualitativ hochwertiger Datensätze abhängen, anstatt riesige Datenmengen zu sammeln. Andrew Ng meint dazu: "Die Verbesserung der Daten ist kein einmaliger Vorverarbeitungsschritt, sondern ein zentraler Bestandteil des iterativen Prozesses der Modellentwicklung beim maschinellen Lernen." Durch die Konzentration auf datenzentrierte Prinzipien wird die maschinelle Bildverarbeitung in verschiedenen Branchen immer zugänglicher, effizienter und wirkungsvoller werden.

Die wichtigsten Erkenntnisse

Daten spielen während des gesamten Lebenszyklus eines Visionsmodells eine entscheidende Rolle. Von der Datenerfassung über die Vorverarbeitung, das Training, die Validierung und das Testen wirkt sich die Qualität der Daten direkt auf die Leistung und Zuverlässigkeit des Modells aus. Indem wir uns auf qualitativ hochwertige Daten und genaue Beschriftungen konzentrieren, können wir robuste Computer Vision Modelle erstellen, die zuverlässige und präzise Ergebnisse liefern. 

Auf dem Weg in eine datengesteuerte Zukunft ist es wichtig, ethische Überlegungen anzustellen, um Risiken im Zusammenhang mit Voreingenommenheit und Datenschutzbestimmungen zu minimieren. Letztlich ist die Gewährleistung der Integrität und Fairness von Daten der Schlüssel, um das volle Potenzial von Computer Vision Technologien zu erschließen.

Werde Teil unserer Community und besuche unser GitHub-Repository, um mehr über KI zu erfahren. Auf unseren Lösungsseiten findest du weitere KI-Anwendungen in Bereichen wie Landwirtschaft und Produktion.

Facebook-LogoTwitter-LogoLinkedIn-LogoKopier-Link-Symbol

Lies mehr in dieser Kategorie

Lass uns gemeinsam die Zukunft
der KI gestalten!

Beginne deine Reise in die Zukunft des maschinellen Lernens