Glossar

Datenvisualisierung

Verwandle komplexe KI/ML-Daten mit leistungsstarken Visualisierungstechniken und -werkzeugen in verwertbare Erkenntnisse. Erfahre mehr unter Ultralytics!

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Bei der Datenvisualisierung werden komplexe Informationen und Rohdaten in einen visuellen Zusammenhang gebracht, z. B. in Form von Diagrammen, Schaubildern und Karten. Dadurch werden die zugrundeliegenden Daten für das menschliche Gehirn leichter verständlich und helfen dabei, sinnvolle Erkenntnisse zu gewinnen. Im Bereich der künstlichen Intelligenz (KI) und des maschinellen Lernens (ML) ist die Datenvisualisierung von entscheidender Bedeutung für die Erkundung von Datensätzen, das Verständnis des Modellverhaltens während des Trainings, die Bewertung der Leistung und die effektive Kommunikation der Ergebnisse. Sie wandelt potenziell überwältigende numerische Daten in intuitive visuelle Darstellungen um und hebt Muster, Trends, Anomalien und Beziehungen hervor, die in rohen Zahlen oder Textberichten möglicherweise nicht erkennbar sind.

Zentrale Konzepte und Techniken

Das Hauptziel der Datenvisualisierung ist es, Daten übersichtlich darzustellen und das Verständnis zu erleichtern. Dies wird mit verschiedenen grafischen Methoden erreicht, darunter:

  • Balkendiagramme: Vergleiche Mengen in verschiedenen Kategorien.
  • Liniendiagramme: Zeigen Trends im Zeitverlauf oder kontinuierliche Intervalle.
  • Streudiagramme: Aufzeigen von Beziehungen und Korrelationen zwischen zwei numerischen Variablen.
  • Heatmaps: Anzeige von Matrixdaten, bei denen die Werte durch Farbintensität dargestellt werden. Sie werden oft für Korrelationsmatrizen oder zur Visualisierung der Aktivierung in neuronalen Netzen verwendet. Siehe den Ultralytics Leitfaden zu Heatmaps.
  • Histogramme: Zeigen die Verteilung einer einzelnen numerischen Variable.
  • Box Plots: Die Verteilung von Daten durch Quartile zusammenfassen.

Die Wahl der richtigen Visualisierungstechnik hängt stark von der Art der Daten und der spezifischen Erkenntnis ab, die du vermitteln willst. Eine effektive Visualisierung erfordert auch eine sorgfältige Berücksichtigung von Designelementen wie Farbpaletten, Skalierung, Achsen und Beschriftungen, um eine genaue Darstellung zu gewährleisten, ohne den Betrachter in die Irre zu führen. Beliebte Python wie Matplotlib und Seaborn bieten leistungsstarke Werkzeuge für die Erstellung einer breiten Palette statischer, animierter und interaktiver Visualisierungen, die in der Datenwissenschaft häufig verwendet werden. Die Einhaltung grundlegender Prinzipien der visuellen Darstellung ist der Schlüssel für wirkungsvolles Data Storytelling.

Bedeutung für KI und maschinelles Lernen

Datenvisualisierung ist während des gesamten Lebenszyklus von KI/ML-Projekten unverzichtbar:

Real-World AI/ML Anwendungen

  1. Medizinische Bildanalyse: In der KI im Gesundheitswesen hilft die Visualisierung bei der Interpretation komplexer medizinischer Scans. Ein Modell zur Objekterkennung, das auf einen Datensatz wie den Hirntumordatensatz trainiert wurde, kann Bounding Boxes ausgeben, die mögliche Anomalien identifizieren. Wenn diese Boxen direkt auf MRT- oder CT-Scans eingeblendet werden, können Radiologen die Ergebnisse des Modells schnell beurteilen und so die Diagnose unterstützen. Außerdem kann die Visualisierung von Patientenergebnissen auf der Grundlage von Bildgebungsmerkmalen helfen, Krankheitsuntertypen zu identifizieren. KI im Gesundheitswesen ist stark auf solche visuellen Hilfsmittel angewiesen. Weitere Anwendungen kannst du beim National Institute of Biomedical Imaging and Bioengineering (NIBIB) erkunden.
  2. Autonome Fahrzeugentwicklung: Selbstfahrende Autosysteme verarbeiten riesige Mengen an Sensordaten. Die Visualisierung wird während der Entwicklung und Prüfung ausgiebig genutzt. Ingenieure visualisieren LiDAR-Punktwolken, Radarsignaturen und Kamerabilder in einer 3D-Simulation der Umgebung. Erkannte Objekte (Autos, Fußgänger, Radfahrer), die von Modellen wie YOLO identifizierten Objekte (Autos, Fußgänger, Radfahrer) werden oft mit Begrenzungsrahmen, Verfolgungspfaden und Vertrauenswerten angezeigt, damit die Entwickler die Genauigkeit und Sicherheit des Wahrnehmungssystems in verschiedenen Szenarien überprüfen können. Sieh dir Beispiele für KI-Lösungen in der Automobilindustrie an und erfahre mehr über Branchenansätze von Unternehmen wie Mobileye.

Unterscheidung von verwandten Begriffen

  • Datenanalyse: Dies ist ein breiterer Bereich, der den gesamten Prozess der Überprüfung, Bereinigung, Umwandlung und Modellierung von Daten umfasst, um nützliche Informationen zu entdecken und die Entscheidungsfindung zu unterstützen. Datenvisualisierung ist eine Komponente oder ein Werkzeug, das innerhalb der Datenanalyse verwendet wird, um Ergebnisse zu präsentieren oder Daten zu erforschen, aber Datenanalyse umfasst auch statistische Modellierung, Hypothesentests und andere nicht-visuelle Methoden. Erfahre mehr über die Grundlagen der Datenanalyse.
  • Bildverarbeitung: In diesem Bereich geht es darum, digitale Bilder zu bearbeiten, um sie zu verbessern oder Informationen direkt aus den Pixeldaten zu extrahieren (z. B. Filterung, Kantenerkennung, Kontrastanpassung). Während es bei der Visualisierung auch um die Darstellung von Bildern gehen kann, geht es bei der Datenvisualisierung in der KI/ML oft um die Darstellung abstrakter Daten (z. B. Modellleistungskennzahlen oder Merkmalsbeziehungen) oder um die Überlagerung von Modellinterpretationen (z. B. Erkennungen) auf Bildern, anstatt die Bilder selbst zu verändern. Mehr über die Unterschiede erfährst du in diesem Blogbeitrag über Computer Vision und Bildverarbeitung.
  • Explorative Datenanalyse (EDA): EDA ist der Prozess der Analyse von Datensätzen, um deren Hauptmerkmale zu verstehen, oft unter Verwendung visueller Methoden. Datenvisualisierungstechniken sind die wichtigsten Werkzeuge, die bei der EDA eingesetzt werden, um Muster aufzudecken, Anomalien zu erkennen, Hypothesen zu testen und Annahmen zu überprüfen. Der Leitfaden zur Vorverarbeitung von annotierten Daten behandelt EDA-Konzepte, die für Computer Vision-Datensätze relevant sind.
Alles lesen