Glosario

Incrustación de Vecinos Estocásticos t-distribuida (t-SNE)

Explora t-SNE, una potente técnica para visualizar datos de alta dimensión. Aprende sus usos, ventajas y aplicaciones en IA y ML.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

La incrustación estocástica de vecinos distribuida en t (t-SNE) es una popular técnica de reducción de la dimensionalidad, especialmente adecuada para visualizar conjuntos de datos de alta dimensión en un espacio de baja dimensión, normalmente de dos o tres dimensiones. Desarrollada por Laurens van der Maaten y Geoffrey Hinton, destaca por revelar la estructura subyacente de los datos, como conglomerados y variedades, facilitando la comprensión de datos complejos mediante inspección visual. Se utiliza ampliamente en los campos del aprendizaje automático (AM) y el análisis de datos.

Comprender el t-SNE

La idea central del t-SNE es preservar la estructura local de los datos. Modela la similitud entre puntos de datos de alta dimensión como probabilidades condicionales y luego intenta encontrar una incrustación de baja dimensión que produzca una distribución de probabilidad similar entre los puntos mapeados. A diferencia de los métodos lineales, como el Análisis de Componentes Principales (ACP), el t-SNE es no lineal y probabilístico. Esto le permite captar relaciones complejas que el PCA podría pasar por alto, especialmente cuando los datos se encuentran en múltiples curvas. Sin embargo, el PCA conserva mejor la estructura global y la varianza de los datos.

El algoritmo calcula las similitudes por pares entre puntos tanto en alta como en baja dimensión. Utiliza una distribución gaussiana en el espacio de alta dimensión y una distribución t (en concreto, una distribución t de Student con un grado de libertad) en el espacio de baja dimensión. El uso de la distribución t ayuda a aliviar el "problema de aglomeración" (en el que los puntos tienden a agruparse en el centro del mapa) y separa más eficazmente los puntos disímiles en el mapa de baja dimensión. El proceso consiste en minimizar la divergencia entre estas dos distribuciones mediante el descenso de gradiente. Para una explicación técnica detallada, consulta el documento original t-SNE.

Aplicaciones en IA y ML

El t-SNE es principalmente una técnica de visualización, muy valiosa para explorar y comprender datos de alta dimensión generados por modelos de IA. He aquí algunos ejemplos:

Consideraciones clave

Aunque potente, el t-SNE tiene características que los usuarios deben comprender:

  • Coste computacional: el t-SNE puede ser intensivo desde el punto de vista computacional, especialmente para conjuntos de datos muy grandes, ya que requiere calcular similitudes por pares.
  • Sensibilidad a los hiperparámetros: Los resultados son sensibles a los hiperparámetros, sobre todo a la "perplejidad", que influye en el número de vecinos locales considerados para cada punto. A menudo es necesario un ajuste adecuado de los hiperparámetros. Las implementaciones como la de scikit-learn ofrecen controles para estos parámetros.
  • Interpretación: Los tamaños de los conglomerados y las distancias entre ellos en el gráfico t-SNE no siempre se corresponden directamente con los tamaños reales de los conglomerados o las separaciones en el espacio original de alta dimensión. Revela principalmente similitudes y agrupaciones locales. Es una herramienta de exploración más que un análisis de agrupación definitivo como K-Means.

En resumen, el t-SNE es una valiosa herramienta de la caja de herramientas de la Inteligencia Artificial (IA) para visualizar y obtener intuiciones sobre conjuntos de datos complejos y de alta dimensión, complementando otros métodos analíticos.

Leer todo