Glosario

Búsqueda vectorial

Descubre cómo la búsqueda vectorial revoluciona la IA al permitir la recuperación de datos basada en la similitud para aplicaciones como la PNL, la visión y la detección de anomalías.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

La búsqueda vectorial es una potente técnica de inteligencia artificial (IA) y aprendizaje automático (AM) diseñada para recuperar puntos de datos basándose en sus representaciones vectoriales. A diferencia de las búsquedas tradicionales basadas en palabras clave, que se basan en coincidencias exactas o simples comparaciones de cadenas, la búsqueda vectorial se centra en la proximidad o similitud de los puntos de datos dentro de un espacio vectorial multidimensional. Este enfoque es especialmente útil para aplicaciones que implican datos no estructurados, como imágenes, audio y texto.

Comprender la búsqueda vectorial

En esencia, la búsqueda vectorial consiste en convertir los datos en representaciones vectoriales: matrices numéricas que captan el significado semántico o las características de los datos. Por ejemplo, los modelos de procesamiento del lenguaje natural (PLN) como BERT generan incrustaciones vectoriales para las frases, capturando su contexto y significado en un espacio de alta dimensión. Del mismo modo, en tareas de visión por ordenador como la clasificación de imágenes, modelos como Ultralytics YOLO generan incrustaciones de características para las imágenes.

Una vez que los datos se representan como vectores, los algoritmos de búsqueda vectorial utilizan medidas de similitud como la similitud coseno o la distancia euclidiana para identificar los puntos de datos que más se aproximan a un vector de consulta dado. Esto permite recuperar resultados que son semántica o contextualmente similares, aunque no haya coincidencias exactas.

Aplicaciones clave de la búsqueda vectorial

Sistemas de recomendación

La búsqueda vectorial se utiliza mucho en los motores de recomendación para sugerir productos, contenidos o servicios en función de las preferencias del usuario. Por ejemplo:

  • Las plataformas de streaming como Netflix y Spotify utilizan la búsqueda vectorial para recomendar películas o canciones que se alinean con el historial de visionado o escucha de un usuario, aprovechando las incrustaciones generadas por modelos de aprendizaje profundo.
  • Las plataformas de comercio electrónico como Amazon implementan la búsqueda vectorial para sugerir productos similares a los que un usuario ha visto o comprado.

Búsqueda visual

En aplicaciones en las que los usuarios buscan imágenes u objetos, la búsqueda vectorial permite una recuperación eficaz basada en características visuales:

  • Un minorista de moda podría permitir a los clientes subir fotos de prendas de vestir, utilizando la búsqueda vectorial para encontrar productos similares en su catálogo.
  • En sanidad, los sistemas pueden identificar imágenes médicas, como radiografías o resonancias magnéticas, que contengan patrones similares a una imagen de consulta, ayudando al diagnóstico. Más información sobre el reconocimiento de imágenes en sanidad.

Procesamiento del Lenguaje Natural

La búsqueda vectorial potencia la búsqueda semántica en PNL, mejorando los motores de búsqueda y los chatbots:

  • Los motores de búsqueda semántica, como los que utilizan las bases de datos académicas, recuperan artículos o documentos basándose en el significado de una consulta y no en palabras clave exactas. Descubre más sobre la búsqueda semántica.
  • Los chatbots aprovechan la búsqueda vectorial para ofrecer respuestas contextualmente relevantes, mejorando la satisfacción del usuario.

Detección de anomalías

En sectores como la ciberseguridad y las finanzas, la búsqueda vectorial se aplica para detectar valores atípicos o anomalías:

  • Los sistemas de detección de intrusos en la red analizan representaciones vectoriales de la actividad de la red para identificar patrones inusuales.
  • Los sistemas de detección de fraude en banca utilizan la búsqueda vectorial para comparar vectores de transacciones, marcando aquellas que se desvían significativamente del comportamiento normal. Explora la detección de anomalías.

Información técnica

Para realizar búsquedas vectoriales a escala, a menudo se utilizan herramientas y marcos especializados. Las bases de datos vectoriales como Milvus y Pinecone están diseñadas para manejar eficazmente datos vectoriales a gran escala y de alta dimensión. Estos sistemas aprovechan los algoritmos de aproximación al vecino más cercano (RNA) para acelerar el rendimiento de la búsqueda, lo que los hace adecuados para aplicaciones en tiempo real.

Además, los pasos de preprocesamiento, como la reducción de la dimensionalidad con técnicas como el Análisis de Componentes Principales (ACP), pueden optimizar el almacenamiento y la recuperación de datos vectoriales, reduciendo su tamaño y conservando al mismo tiempo las relaciones significativas.

Distinción de conceptos afines

  • Búsqueda semántica: Mientras que la búsqueda vectorial sustenta la búsqueda semántica, esta última se centra específicamente en recuperar resultados basados en el significado contextual de las consultas, a menudo en aplicaciones de PNL. Más información sobre la búsqueda semántica.
  • Bases de datos vectoriales: Son sistemas de almacenamiento especializados y optimizados para gestionar y consultar datos vectoriales, lo que permite realizar búsquedas vectoriales a escala. Descubre las bases de datos vectoriales.

Ejemplo real: Coches autónomos

Los vehículos autónomos se basan en la búsqueda vectorial para procesar y analizar su entorno en tiempo real. Por ejemplo:

  • Un coche autoconducido utiliza incrustaciones vectoriales de imágenes captadas por sus cámaras para identificar y clasificar objetos, como peatones o señales de tráfico, mediante algoritmos de búsqueda vectorial. Explora la IA en los coches autoconducidos.

Ejemplo real: Reclutamiento potenciado por IA

En la adquisición de talentos, la búsqueda vectorial se emplea para adecuar los candidatos a las descripciones de los puestos:

  • Los sistemas de IA convierten los currículos y las ofertas de empleo en incrustaciones vectoriales, lo que permite a los reclutadores identificar a los candidatos cuyas habilidades y experiencias se ajustan estrechamente a los requisitos del puesto.

Conclusión

La búsqueda vectorial es una tecnología transformadora que permite a los sistemas de IA realizar recuperaciones basadas en similitudes en varios tipos de datos, desde texto e imágenes hasta audio y vídeo. Al aprovechar las incrustaciones avanzadas y las medidas de similitud, la búsqueda vectorial facilita aplicaciones que van desde las recomendaciones personalizadas a la detección de anomalías y mucho más. Explora herramientas como Ultralytics HUB para incorporar capacidades de IA de visión a tus proyectos sin problemas.

Leer todo