Glossaire

Emboîtement stochastique de voisins distribué en t (t-SNE)

Explorez le t-SNE, une technique puissante de visualisation des données à haute dimension. Découvrez ses utilisations, ses avantages et ses applications en IA et en ML.

Le t-distributed Stochastic Neighbor Embedding (t-SNE) est une technique puissante de réduction de la dimensionnalité non linéaire, principalement utilisée pour la visualisation des données. Elle permet aux chercheurs et aux praticiens de l'apprentissage automatique de visualiser des ensembles de données à haute dimension dans un espace à faible dimension, généralement un graphique en 2D ou en 3D. Développée par Laurens van der Maaten et Geoffrey Hinton, sa principale force est sa remarquable capacité à révéler la structure locale sous-jacente des données, telle que les clusters et les manifolds, que d'autres techniques pourraient manquer. Des implémentations sont largement disponibles dans des bibliothèques telles que Scikit-learn et des frameworks tels que PyTorch.

L'idée centrale du t-SNE est de placer les points de données similaires proches les uns des autres et les points dissemblables éloignés les uns des autres dans une carte à faible dimension. Pour ce faire, il convertit les distances euclidiennes à haute dimension entre les points de données en probabilités conditionnelles qui représentent les similitudes. Il utilise ensuite une distribution de probabilités similaire dans la carte à faible dimension et minimise la divergence entre ces deux distributions.

Applications en Ai et Ml

Le t-SNE est largement utilisé pour l'exploration visuelle dans divers domaines de l'intelligence artificielle (IA).

  • Visualisation des caractéristiques des réseaux neuronaux : Dans le domaine de la vision artificielle (CV), le t-SNE est très utile pour comprendre ce qu'un modèle d'apprentissage profond a appris. Vous pouvez, par exemple, prendre les caractéristiques d' une couche intermédiaire d'un réseau neuronal convolutif (CNN) formé pour la classification d'images et utiliser le t-SNE pour les représenter graphiquement. Si le modèle, tel que le modèle YOLO d'Ultralytics, est bien entraîné sur un ensemble de données tel que CIFAR-10, le tracé obtenu montrera des groupes distincts correspondant aux différentes catégories d'images (par exemple, "chats", "chiens", "voitures"). Cela confirme visuellement le pouvoir discriminant du modèle.
  • Exploration de données textuelles : Dans le cadre du traitement du langage naturel (NLP), t-SNE permet de visualiser des enchâssements de mots à haute dimension tels que Word2Vec ou GloVe. Cela permet de comprendre les relations sémantiques entre les mots ; par exemple, des mots comme "roi", "reine", "prince" et "princesse" sont regroupés. De telles visualisations sont utiles pour explorer des corpus de textes et déboguer des modèles de langage utilisés dans des tâches telles que la classification de documents.
  • Bioinformatique et imagerie médicale : Les chercheurs utilisent le t-SNE pour visualiser des données biologiques complexes, telles que les profils d'expression génique des puces à ADN, afin d'identifier des populations cellulaires ou des sous-types de maladies. Il est également utilisé dans l'analyse d'images médicales pour regrouper différents types de tissus ou de tumeurs, comme dans l'ensemble de données sur les tumeurs cérébrales.

T-SNE vs. Autres techniques

Il est important de distinguer le t-SNE des autres méthodes de réduction de la dimensionnalité.

  • Analyse en composantes principales (ACP): L'ACP est une technique linéaire axée sur la préservation de la variance maximale des données, ce qui correspond à la préservation de la structure globale à grande échelle. En revanche, le t-SNE est une méthode non linéaire qui excelle à révéler la structure locale (c'est-à-dire la manière dont les points de données individuels se regroupent). Bien que l'ACP soit plus rapide et déterministe, sa nature linéaire peut ne pas permettre de saisir des relations complexes comme le fait le t-SNE. Il est courant d'utiliser d'abord l'ACP pour réduire un ensemble de données à un nombre intermédiaire de dimensions (par exemple, 30-50) avant d'appliquer le t-SNE afin de réduire la charge de calcul et le bruit.
  • Autoencodeurs: Les autoencodeurs sont un type de réseau neuronal capable d'apprendre des représentations de données puissantes et non linéaires. Bien qu'ils soient plus souples que l'ACP et le t-SNE, ils sont souvent moins faciles à interpréter et leur formation est plus coûteuse sur le plan informatique. Ils sont principalement utilisés pour l'extraction de caractéristiques plutôt que pour la visualisation directe.

Considérations et limites

Bien que puissant, le t-SNE présente certaines limites que les utilisateurs doivent prendre en compte.

  • Coût de calcul : L'algorithme a une complexité temporelle et spatiale quadratique en fonction du nombre de points de données, ce qui le rend lent pour les ensembles de données comportant des centaines de milliers d'échantillons. Des techniques telles que le t-SNE de Barnes-Hut offrent des améliorations significatives en termes de performances.
  • Sensibilité aux hyperparamètres : Les résultats peuvent être influencés de manière significative par les hyperparamètres, en particulier la "perplexité", qui est une estimation du nombre de voisins proches de chaque point. Il n'existe pas de valeur de perplexité unique et universelle. L'article de Distillintitulé "How to Use t-SNE Effectively"(Comment utiliser t-SNE efficacement) constitue une excellente ressource pour comprendre ces effets.
  • Interprétation de la structure globale : les visualisations t-SNE doivent être interprétées avec prudence. Les tailles relatives des groupes et les distances qui les séparent dans le graphique final ne reflètent pas nécessairement la séparation réelle dans l'espace à haute dimension d'origine. L'algorithme se concentre sur la préservation des voisinages locaux, et non sur la géométrie globale. Des outils tels que le TensorFlow Projector permettent une exploration interactive, ce qui peut aider à développer l'intuition. La gestion et la visualisation de ces analyses peuvent être rationalisées à l'aide de plateformes comme Ultralytics HUB.

Rejoindre la communauté Ultralytics

Rejoignez l'avenir de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

S'inscrire
Lien copié dans le presse-papiers