Glosario

Incrustaciones

Aprende qué son las incrustaciones y cómo potencian la IA capturando relaciones semánticas en los datos para la PNL, las recomendaciones y la visión por ordenador.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

En el ámbito del aprendizaje automático (AM) y la inteligencia artificial, las incrustaciones son una potente técnica para representar datos -como palabras, frases, imágenes u otros elementos- como vectores numéricos densos en un espacio multidimensional. Esta transformación se aprende a partir de los datos, lo que permite a los algoritmos captar el significado semántico, el contexto o las características de la entrada. La ventaja clave es que los elementos similares se asignan a puntos cercanos en este "espacio de incrustación", lo que permite a las máquinas comprender relaciones y patrones complejos con más eficacia que las representaciones dispersas tradicionales.

¿Qué son las incrustaciones?

Las incrustaciones son esencialmente representaciones vectoriales aprendidas, densas y de baja dimensión, de variables discretas (como palabras) u objetos complejos (como imágenes). A diferencia de métodos como la codificación de un solo punto, que crea vectores dispersos de alta dimensión en los que cada elemento es independiente, las incrustaciones captan relaciones matizadas. Por ejemplo, en las incrustaciones de palabras, las palabras con significados similares o utilizadas en contextos similares, como "perro" y "cachorro", tendrán vectores matemáticamente próximos (por ejemplo, utilizando la similitud del coseno). Esta proximidad en el espacio de incrustación refleja la similitud semántica. Estos vectores suelen estar formados por números reales y pueden tener entre decenas y miles de dimensiones, dependiendo de la complejidad de los datos y del modelo.

Cómo funcionan las incrustaciones

Las incrustaciones suelen generarse mediante modelos de redes neuronales (RN ) entrenados en grandes conjuntos de datos. Por ejemplo, una técnica habitual de incrustación de palabras consiste en entrenar un modelo para predecir una palabra basándose en las palabras que la rodean (su contexto) dentro de las frases. Durante este proceso de entrenamiento, la red ajusta sus parámetros internos, incluidos los vectores de incrustación de cada palabra, para minimizar los errores de predicción. Los vectores resultantes codifican implícitamente la información sintáctica y semántica aprendida del vasto corpus de textos. El número de dimensiones del espacio de incrustación es un hiperparámetro crucial, que influye en la capacidad del modelo para captar detalles frente a su coste computacional. La visualización de estos espacios de alta dimensión suele requerir técnicas de reducción de la dimensionalidad como t-SNE o PCA, que pueden visualizarse con herramientas como el ProyectorTensorFlow .

Aplicaciones de las incrustaciones

Las incrustaciones son fundamentales para muchas aplicaciones modernas de IA:

  • Procesamiento del Lenguaje Natural (PLN): Las incrustaciones de palabras y frases potencian tareas como el análisis de sentimientos, la traducción automática y la clasificación de textos. Permiten a los modelos comprender analogías (por ejemplo, "rey" - "hombre" + "mujer" ≈ "reina") realizando aritmética vectorial. Los modelos clásicos incluyen Word2Vec y GloVe, mientras que los enfoques modernos como BERT generan incrustaciones dependientes del contexto utilizando arquitecturas Transformer.
  • Sistemas de recomendación: Los usuarios y los elementos (como películas o productos) se incrustan en el mismo espacio. Las recomendaciones se hacen encontrando artículos cuyas incrustaciones se acerquen a la incrustación de un usuario, reflejando sus preferencias. Empresas como Netflix confían mucho en las técnicas de incrustación.
  • Visión por ordenador (VC): Las imágenes o parches de imágenes pueden convertirse en incrustaciones para tareas como la recuperación de imágenes (encontrar imágenes visualmente similares) o la agrupación. Modelos como Ultralytics YOLO pueden utilizarse no sólo para la detección de objetos o la segmentación de imágenes, sino que sus capas internas pueden servir potencialmente como potentes extractores de características para generar incrustaciones que representen el contenido de la imagen.

Incrustaciones frente a otras técnicas de representación

Las incrustaciones ofrecen ventajas sobre los métodos de representación más sencillos:

  • Codificación Uniforme: Representa las categorías como vectores binarios dispersos. Estos vectores son ortogonales (disímiles) y no capturan ninguna relación semántica entre categorías. Además, la dimensionalidad crece linealmente con el número de elementos únicos, por lo que resulta ineficaz para vocabularios grandes.
  • Bolsa de palabras (BoW): Representa el texto basándose en la frecuencia de las palabras, ignorando la gramática y el orden de las palabras. Aunque es simple, no capta eficazmente el significado semántico en comparación con las incrustaciones.
  • TF(Frecuencia de términos-Frecuencia inversa de documentos): Pondera las palabras en función de su frecuencia en un documento en relación con su frecuencia en un corpus. Mide la importancia de las palabras, pero no capta intrínsecamente la similitud semántica, como hacen las incrustaciones.

Conclusión

Las incrustaciones representan un avance significativo en la forma en que las máquinas procesan y comprenden datos complejos. Al asignar elementos a representaciones vectoriales significativas, permiten un análisis sofisticado y potencian una amplia gama de aplicaciones de IA, especialmente en PNL y sistemas de recomendación. A medida que los modelos y las técnicas de entrenamiento sigan evolucionando, es probable que las incrustaciones sean aún más importantes para construir sistemas inteligentes. Plataformas como Ultralytics HUB facilitan la formación y el despliegue de modelos que a menudo dependen de estas potentes representaciones, haciendo más accesible la IA avanzada. Para aprender más, explora la documentación de Ultralytics .

Leer todo