Glossaire

Visualisation des données

Transforme les données complexes de l'IA/ML en informations exploitables grâce à des techniques et des outils de visualisation puissants. Pour en savoir plus, consulte le site Ultralytics!

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

La visualisation des données consiste à traduire des informations complexes et des données brutes dans des contextes visuels, tels que des tableaux, des graphiques et des cartes. Cela rend les données sous-jacentes plus faciles à comprendre pour le cerveau humain et aide à extraire des informations significatives. Dans le domaine de l'intelligence artificielle (IA) et de l'apprentissage automatique (ML), la visualisation des données est cruciale pour explorer les ensembles de données, comprendre le comportement des modèles pendant la formation, évaluer les performances et communiquer les résultats de manière efficace. Elle transforme des données numériques potentiellement écrasantes en représentations visuelles intuitives, mettant en évidence les modèles, les tendances, les anomalies et les relations qui pourraient être obscurcies dans les chiffres bruts ou les rapports textuels.

Concepts et techniques de base

L'objectif principal de la visualisation des données est de les présenter clairement et d'en faciliter la compréhension. Pour ce faire, on utilise diverses méthodes graphiques, notamment :

  • Diagrammes à barres : Comparer les quantités dans différentes catégories.
  • Graphiques linéaires : Montrer les tendances dans le temps ou les intervalles continus.
  • Diagrammes de dispersion : Révéler les relations et les corrélations entre deux variables numériques.
  • Cartes thermiques : Affichage de données matricielles où les valeurs sont représentées par l'intensité de la couleur, souvent utilisé pour les matrices de corrélation ou la visualisation de l'activation dans les réseaux neuronaux. Voir le guideUltralytics sur les cartes thermiques.
  • Histogrammes : Ils montrent la distribution d'une seule variable numérique.
  • Diagrammes en boîte : Résumer la distribution des données par le biais des quartiles.

Le choix de la bonne technique de visualisation dépend fortement du type de données et de l'idée spécifique que tu souhaites transmettre. Une visualisation efficace nécessite également un examen minutieux des éléments de conception tels que les palettes de couleurs, la mise à l'échelle, les axes et les étiquettes afin de garantir une représentation précise sans induire l'observateur en erreur. Les bibliothèques Python populaires comme Matplotlib et Seaborn fournissent des outils puissants pour créer une large gamme de visualisations statiques, animées et interactives couramment utilisées en science des données. Le respect des principes fondamentaux de l'affichage visuel est essentiel pour une narration de données percutante.

L'importance de l'IA et de l'apprentissage automatique

La visualisation des données est indispensable tout au long du cycle de vie des projets d'IA/ML:

Applications IA/ML dans le monde réel

  1. Analyse d'images médicales : Dans le domaine de l'IA en santé, la visualisation aide à interpréter les scans médicaux complexes. Un modèle de détection d'objets entraîné sur un ensemble de données comme celui des tumeurs cérébrales peut produire des boîtes de délimitation identifiant les anomalies potentielles. La visualisation de ces boîtes superposées directement sur des IRM ou des tomodensitogrammes permet aux radiologues d'évaluer rapidement les résultats du modèle, ce qui facilite le diagnostic. De plus, la visualisation de groupes de résultats de patients basés sur des caractéristiques d'imagerie peut aider à identifier des sous-types de maladies. L 'IA dans le domaine de la santé s'appuie fortement sur de telles aides visuelles. Tu peux explorer d'autres applications à l'Institut national d'imagerie biomédicale et de bio-ingénierie (NIBIB).
  2. Développement de véhicules autonomes : Les systèmes de voitures autonomes traitent de grandes quantités de données de capteurs. La visualisation est largement utilisée pendant le développement et les tests. Les ingénieurs visualisent les nuages de points LiDAR, les signatures radar et les flux des caméras dans une simulation 3D de l'environnement. Les objets détectés (voitures, piétons, cyclistes) identifiés par des modèles comme YOLO sont souvent affichés avec des boîtes de délimitation, des trajectoires de suivi et des scores de confiance, ce qui permet aux développeurs de vérifier la précision et la sécurité du système de perception dans divers scénarios. Vois des exemples dans les solutions d'IA dans l'automobile et découvre les approches industrielles d'entreprises comme Mobileye.

Distinguer les termes apparentés

  • L'analyse des données : C'est un domaine plus large qui implique l'ensemble du processus d'inspection, de nettoyage, de transformation et de modélisation des données pour découvrir des informations utiles et soutenir la prise de décision. La visualisation des données est un composant ou un outil utilisé dans le cadre de l'analyse des données pour présenter les résultats ou explorer les données, mais l'analytique comprend également la modélisation statistique, les tests d'hypothèses et d'autres méthodes non visuelles. En savoir plus sur les principes fondamentaux de l'analyse des données.
  • Traitement de l'image : Ce domaine se concentre sur la manipulation d'images numériques pour les améliorer ou extraire des informations directement à partir des données des pixels (par exemple, filtrage, détection des bords, ajustement du contraste). Bien que la visualisation puisse impliquer l'affichage d'images, la visualisation de données en IA/ML traite souvent de la représentation de données abstraites (comme les métriques de performance des modèles ou les relations entre les caractéristiques) ou de la superposition d'interprétations de modèles (comme les détections) sur des images, plutôt que de la transformation des images elles-mêmes. Pour en savoir plus sur les différences entre vision artificielle et traitement d'images, consulte l'article de blog Vision informatique et traitement d'images.
  • Analyse exploratoire des données (AED) : L'AED est le processus d' analyse des ensembles de données pour comprendre leurs principales caractéristiques, souvent à l'aide de méthodes visuelles. Les techniques de visualisation des données sont les principaux outils utilisés pendant l'AED pour découvrir des modèles, repérer des anomalies, tester des hypothèses et vérifier des suppositions. Le guide sur le prétraitement des données annotées aborde les concepts de l'AED relatifs aux ensembles de données de vision par ordinateur.
Tout lire