Glosario

Búsqueda vectorial

Descubre cómo la búsqueda vectorial revoluciona la IA al permitir la similitud semántica en la recuperación de datos para la PNL, la búsqueda visual, los sistemas de recomendación, ¡y mucho más!

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

La búsqueda vectorial es un método utilizado en inteligencia artificial (IA) y aprendizaje automático (AM) para encontrar datos basándose en la similitud, en lugar de en palabras clave exactas. Imagina buscar imágenes que se parezcan a una foto concreta, o encontrar documentos que sean semánticamente similares a un texto determinado. Aquí es donde entra en juego la búsqueda vectorial, que permite a las máquinas comprender y recuperar información basándose en el significado y el contexto.

Comprender las incrustaciones vectoriales

En el corazón de la búsqueda vectorial se encuentra el concepto de incrustación vectorial. Se trata de representaciones numéricas de datos, como texto, imágenes o audio, transformadas en vectores de alta dimensión. Estos vectores capturan las características esenciales y el significado semántico de los datos. Por ejemplo, en el procesamiento del lenguaje natural (PLN), modelos como el BERT (Bidirectional Encoder Representations from Transformers) pueden convertir frases en vectores, donde las frases similares se colocan muy juntas en el espacio vectorial. Del mismo modo, en visión por ordenador, un modelo Ultralytics YOLO modelo puede generar vectores de características para imágenes, permitiendo comparaciones de similitud entre contenidos visuales.

Una vez convertidos los datos en incrustaciones vectoriales, los algoritmos de búsqueda vectorial utilizan métricas de distancia como la similitud coseno o la distancia euclídea para medir la proximidad entre vectores. Calculando estas distancias, el sistema puede identificar y recuperar los puntos de datos más similares a un vector de consulta, aunque no contengan las palabras clave exactas.

Aplicaciones de la búsqueda vectorial

La búsqueda vectorial está revolucionando varias aplicaciones de IA, sobre todo las que tratan con datos no estructurados:

  • Sistemas de recomendación: Plataformas como Netflix o Spotify utilizan la búsqueda vectorial para recomendar películas o canciones en función de las preferencias del usuario. Al incrustar los perfiles de usuario y las características de los artículos en un espacio vectorial, el sistema puede encontrar rápidamente artículos que sean similares a las interacciones anteriores de un usuario, mejorando la personalización y el compromiso del usuario.Más información sobre los sistemas de recomendación

  • Búsqueda visual: En el comercio electrónico o la recuperación de imágenes, la búsqueda vectorial potencia las capacidades de búsqueda visual. Los usuarios pueden subir una imagen y el sistema, utilizando incrustaciones vectoriales de imágenes, puede encontrar productos o imágenes visualmente similares en una base de datos. Esto es mucho más eficaz que las búsquedas de imágenes basadas en palabras clave, sobre todo cuando describir el contenido visual es un reto.Explora más sobre el reconocimiento de imágenes

  • Procesamiento del lenguaje natural: La búsqueda semántica, impulsada por la búsqueda vectorial, permite a los motores de búsqueda y a los chatbots comprender el significado que hay detrás de las consultas. En lugar de basarse en la concordancia de palabras clave, estos sistemas utilizan incrustaciones vectoriales de texto para encontrar documentos o respuestas contextualmente relevantes, mejorando la precisión y relevancia de los resultados de búsqueda y la IA conversacional.Descubre la búsqueda semántica

  • Detección de anomalías: En campos como la ciberseguridad o la detección del fraude, la búsqueda vectorial puede identificar patrones inusuales o valores atípicos. Al representar el comportamiento normal como vectores, el sistema puede detectar rápidamente puntos de datos que se desvían significativamente de la norma, señalando posibles anomalías para su posterior investigación.Explora las técnicas de detección de anomalías

Aspectos técnicos

Para hacer frente a las exigencias computacionales de la búsqueda vectorial, especialmente con grandes conjuntos de datos y vectores de alta dimensión, se emplean herramientas y técnicas especializadas. Las bases de datos vectoriales, como Pinecone y Milvus, están diseñadas para almacenar, indexar y consultar eficazmente incrustaciones vectoriales a escala. Estas bases de datos suelen utilizar algoritmos de aproximación al vecino más cercano (RNA) para acelerar el proceso de búsqueda, sacrificando una pequeña cantidad de precisión a cambio de ganancias significativas de velocidad, lo que hace factible la búsqueda vectorial en tiempo real.

Además, pueden utilizarse técnicas de reducción de la dimensionalidad, como el Análisis de Componentes Principales (ACP), para reducir el tamaño de las incrustaciones vectoriales conservando su información esencial, optimizando el almacenamiento y la eficacia de la búsqueda.

Ejemplos reales

Los coches autoconducidos dependen en gran medida de la búsqueda vectorial para la percepción en tiempo real. Por ejemplo, cuando los sensores de un coche autoconducido detectan un objeto, el sistema utiliza la búsqueda vectorial para comparar el vector de características del objeto con una base de datos de objetos conocidos (peatones, vehículos, señales) para identificarlo y clasificarlo rápidamente, lo que permite tomar decisiones rápidas para una navegación segura. Explora la IA en los coches autoconducidos

En la contratación impulsada por la IA, la búsqueda vectorial puede hacer coincidir eficazmente los candidatos con las descripciones de los puestos. Los perfiles de los candidatos y las descripciones de los puestos se convierten en incrustaciones vectoriales, y los algoritmos de búsqueda vectorial encuentran a los candidatos cuyos perfiles son más similares a los requisitos de un puesto, agilizando el proceso de adquisición de talentos.

Leer todo