Glossar

Datenanalyse

Entdecke, wie Datenanalyse den Erfolg von KI und ML vorantreibt, indem sie die Datenqualität optimiert, Erkenntnisse aufdeckt und intelligente Entscheidungen ermöglicht.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Datenanalyse ist die systematische computergestützte Analyse von Daten oder Statistiken. Sie umfasst die Untersuchung, Bereinigung, Umwandlung und Modellierung von Daten mit dem Ziel, nützliche Informationen zu entdecken, Schlussfolgerungen zu ziehen und Entscheidungen zu unterstützen. Im Bereich der künstlichen Intelligenz (KI) und des maschinellen Lernens (ML) ist die Datenanalyse unverzichtbar, um Datensätze aufzubereiten, Datenmerkmale zu verstehen, aussagekräftige Merkmale zu extrahieren und die Leistung von Modellen zu bewerten, was letztendlich zu robusteren und zuverlässigeren KI-Systemen führt.

Die Bedeutung von Datenanalyse für KI und maschinelles Lernen

Die Datenanalyse bildet das Fundament, auf dem erfolgreiche KI- und ML-Projekte aufgebaut werden. Vor dem Training komplexer Modelle wie Ultralytics YOLOtrainieren, müssen die Rohdaten einer gründlichen Analyse unterzogen werden. Dazu gehören wichtige Schritte wie die Datenbereinigung, um Fehler und Unstimmigkeiten zu beseitigen, und die Datenvorverarbeitung, um die Daten für die Algorithmen angemessen zu formatieren. Techniken wie die explorative Datenanalyse (EDA), die oft mit einer Datenvisualisierung einhergeht, helfen dabei, zugrunde liegende Strukturen, Muster, Ausreißer und potenzielle Verzerrungen in den Daten aufzudecken. Das Verständnis dieser Aspekte ist entscheidend für die Auswahl geeigneter Modelle und die Gewährleistung der für ein effektives Training erforderlichen Datenqualität.

Außerdem spielt die Datenanalyse nach der Modellschulung eine wichtige Rolle. Bei der Bewertung der Modellleistung anhand von Kennzahlen wie Genauigkeit oder mittlerer durchschnittlicher Präzision (mAP) werden die Vorhersageergebnisse mit den tatsächlichen Daten verglichen. Dieser analytische Prozess hilft dabei, Modellschwächen zu erkennen, Fehlertypen zu verstehen und weitere Verbesserungen durch Techniken wie das Tuning von Hyperparametern vorzunehmen.

Datenanalyse vs. verwandte Konzepte

Obwohl sie oft synonym verwendet werden, unterscheidet sich die Datenanalyse subtil von verwandten Begriffen:

  • Data Mining: Konzentriert sich auf die Entdeckung neuer, bisher unbekannter Muster und Beziehungen in großen Datenbeständen. Es wird oft als eine spezielle Technik innerhalb des umfassenderen Bereichs der Datenanalyse betrachtet, der auch die Beschreibung von Daten (deskriptive Analyse) und die Diagnose vergangener Ereignisse (diagnostische Analyse) umfasst. Du kannst die Konzepte des Data Mining weiter erforschen.
  • Maschinelles Lernen: Algorithmen, die aus Daten lernen, um Vorhersagen oder Entscheidungen ohne explizite Programmierung zu treffen. ML wird häufig in der Datenanalyse eingesetzt (insbesondere in der prädiktiven und präskriptiven Analyse), aber die Datenanalyse selbst ist ein umfassenderer Prozess, der das Sammeln, Bereinigen, Erforschen, Visualisieren und Interpretieren von Daten umfasst, was die Erstellung komplexer ML-Modelle beinhalten kann, aber nicht muss. Lies mehr über Maschinelles Lernen (ML).

Real-World AI/ML Anwendungen

Die Datenanalyse treibt den Fortschritt bei verschiedenen KI-Anwendungen voran:

  1. Diagnostik im Gesundheitswesen: In der medizinischen Bildanalyse wird die Datenanalyse eingesetzt, um große Datensätze medizinischer Scans (wie MRTs oder CTs, z. B. den Hirntumordatensatz) zu untersuchen und subtile Muster zu erkennen, die auf eine Krankheit hinweisen könnten. Bevor ein KI-Diagnosemodell trainiert wird, hilft die Analyse dabei, die Verteilung von Merkmalen in verschiedenen Patientengruppen zu verstehen, um sicherzustellen, dass der Datensatz repräsentativ ist und mögliche Verzerrungen erkannt werden. Nach dem Training bewertet die Analytik die diagnostische Genauigkeit des Modells und identifiziert Fehlertypen, die zur Verfeinerung beitragen. Ressourcen wie NIH Biomedical Data Science unterstreichen ihre Bedeutung.
  2. Analyse des Kundenverhaltens im Einzelhandel: Einzelhändler nutzen Datenanalysen, um das Kaufverhalten zu verstehen und den Betrieb zu optimieren. Die Analyse von Transaktionsdaten hilft bei der Entwicklung von Empfehlungssystemen, die dem Kunden Produkte vorschlagen. In physischen Geschäften kann die Analyse von Videobildern mit Hilfe von Computer-Vision-Modellen (CV) Einblicke in den Kundenverkehr und die Interaktion mit den Regalen geben und so die KI für eine intelligentere Bestandsverwaltung im Einzelhandel unterstützen. Die Analyse hilft bei der Interpretation dieser Daten, um die Ladengestaltung und die Produktplatzierung zu optimieren. Unternehmen nutzen für diese Zwecke Plattformen wie Google Cloud AI for Retail.

Werkzeuge und Techniken

Datenanalysten setzen eine Vielzahl von Instrumenten und Techniken ein. Statistische Methoden, einschließlich Regressions- und Zeitreihenanalyse, sind grundlegend. Programmiersprachen wie Python mit Bibliotheken wie Pandas für die Datenmanipulation und Scikit-learn für ML-Aufgaben werden häufig verwendet. Datenvisualisierungstools wie Tableau oder Microsoft Power BI sind entscheidend für die Kommunikation von Ergebnissen. Für spezielle Erkenntnisse über die ML-Leistung bieten Plattformen wie Ultralytics HUB integrierte Analysen, wie im Ultralytics Analytics Guide beschrieben.

Alles lesen