Glossaire

Recherche vectorielle

Découvre comment la recherche vectorielle révolutionne l'IA en permettant la recherche de données basée sur la similarité pour des applications telles que le NLP, la vision et la détection d'anomalies.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

La recherche vectorielle est une technique puissante d'intelligence artificielle (IA) et d'apprentissage automatique (ML) conçue pour récupérer des points de données en fonction de leurs représentations vectorielles. Contrairement aux recherches traditionnelles basées sur des mots-clés, qui reposent sur des correspondances exactes ou de simples comparaisons de chaînes de caractères, la recherche vectorielle se concentre sur la proximité ou la similarité des points de données au sein d'un espace vectoriel multidimensionnel. Cette approche est particulièrement utile pour les applications impliquant des données non structurées, telles que des images, du son et du texte.

Comprendre la recherche vectorielle

À la base, la recherche vectorielle consiste à convertir les données en représentations vectorielles - des tableaux numériques qui capturent la signification sémantique ou les caractéristiques des données. Par exemple, les modèles de traitement du langage naturel (NLP) tels que BERT génèrent des encastrements vectoriels pour les phrases, capturant leur contexte et leur signification dans un espace à haute dimension. De même, dans les tâches de vision par ordinateur telles que la classification d'images, des modèles tels que Ultralytics YOLO génèrent des encastrements de caractéristiques pour les images.

Une fois les données représentées sous forme de vecteurs, les algorithmes de recherche vectorielle utilisent des mesures de similarité telles que la similarité cosinus ou la distance euclidienne pour identifier les points de données les plus proches d'un vecteur d'interrogation donné. Cela permet de retrouver des résultats qui sont sémantiquement ou contextuellement similaires, même s'il n'y a pas de correspondance exacte.

Principales applications de la recherche vectorielle

Systèmes de recommandation

La recherche vectorielle est largement utilisée dans les moteurs de recommandation pour suggérer des produits, des contenus ou des services en fonction des préférences de l'utilisateur. Par exemple :

  • Les plateformes de streaming comme Netflix et Spotify utilisent la recherche vectorielle pour recommander des films ou des chansons qui s'alignent sur l'historique de visionnage ou d'écoute de l'utilisateur, en s'appuyant sur les embeddings générés par des modèles d'apprentissage profond.
  • Les plateformes de commerce électronique comme Amazon mettent en œuvre la recherche vectorielle pour suggérer des produits similaires à ceux qu'un utilisateur a consultés ou achetés.

Recherche visuelle

Dans les applications où les utilisateurs recherchent des images ou des objets, la recherche vectorielle permet une récupération efficace basée sur les caractéristiques visuelles :

  • Un détaillant de mode pourrait permettre aux clients de télécharger des photos de vêtements, en utilisant la recherche vectorielle pour trouver des produits similaires dans leur catalogue.
  • Dans le domaine de la santé, les systèmes peuvent identifier les images médicales, telles que les radiographies ou les IRM, qui contiennent des motifs similaires à une image d'interrogation, ce qui facilite le diagnostic. En savoir plus sur la reconnaissance d'images dans le domaine de la santé.

Traitement du langage naturel

La recherche vectorielle alimente la recherche sémantique dans le NLP, améliorant ainsi les moteurs de recherche et les chatbots :

  • Les moteurs de recherche sémantique, tels que ceux utilisés par les bases de données académiques, récupèrent des articles ou des documents en se basant sur le sens d'une requête plutôt que sur des mots-clés exacts. Découvre plus d'informations sur la recherche sémantique.
  • Les chatbots tirent parti de la recherche vectorielle pour fournir des réponses contextuellement pertinentes, ce qui améliore la satisfaction des utilisateurs.

Détection des anomalies

Dans des secteurs comme la cybersécurité et la finance, la recherche vectorielle est appliquée pour détecter les valeurs aberrantes ou les anomalies :

  • Les systèmes de détection d'intrusion dans les réseaux analysent les représentations vectorielles de l'activité du réseau afin d'identifier des modèles inhabituels.
  • Les systèmes de détection des fraudes dans le secteur bancaire utilisent la recherche vectorielle pour comparer les vecteurs de transaction, en signalant ceux qui s'écartent de manière significative du comportement normal. Explore la détection des anomalies.

Informations techniques

Pour effectuer des recherches vectorielles à grande échelle, on utilise souvent des outils et des cadres spécialisés. Les bases de données vectorielles telles que Milvus et Pinecone sont conçues pour traiter efficacement les données vectorielles à grande échelle et à haute dimension. Ces systèmes s'appuient sur des algorithmes d'approximation du plus proche voisin (ANN) pour accélérer les performances de recherche, ce qui les rend adaptés aux applications en temps réel.

En outre, les étapes de prétraitement telles que la réduction de la dimensionnalité avec des techniques comme l'analyse en composantes principales (ACP) peuvent optimiser le stockage et la récupération des données vectorielles en réduisant leur taille tout en préservant les relations significatives.

Distinction par rapport aux concepts apparentés

  • Recherche sémantique : Alors que la recherche vectorielle sous-tend la recherche sémantique, cette dernière se concentre spécifiquement sur la récupération de résultats basés sur la signification contextuelle des requêtes, souvent dans des applications NLP. En savoir plus sur la recherche sémantique.
  • Bases de données vectorielles : Il s'agit de systèmes de stockage spécialisés optimisés pour la gestion et l'interrogation des données vectorielles, ce qui permet d'effectuer des recherches vectorielles à grande échelle. Découvre les bases de données vectorielles.

Exemple concret : Voitures auto-conduites

Les véhicules autonomes s'appuient sur la recherche vectorielle pour traiter et analyser leur environnement en temps réel. Par exemple :

  • Une voiture auto-conduite utilise les incrustations vectorielles des images capturées par ses caméras pour identifier et classer les objets, tels que les piétons ou les panneaux de signalisation, à l'aide d'algorithmes de recherche vectorielle. Explore l'IA dans les voitures auto-conduites.

Exemple concret : Recrutement assisté par l'IA

Dans l'acquisition de talents, la recherche vectorielle est employée pour faire correspondre les candidats aux descriptions de postes :

  • Les systèmes d'IA convertissent les CV et les offres d'emploi en encastrements vectoriels, ce qui permet aux recruteurs d'identifier les candidats dont les compétences et les expériences correspondent étroitement aux exigences du poste.

Conclusion

La recherche vectorielle est une technologie transformatrice qui permet aux systèmes d'IA d'effectuer des recherches basées sur la similarité dans divers types de données, du texte aux images en passant par l'audio et la vidéo. En tirant parti d'enchâssements et de mesures de similarité avancés, la recherche vectorielle facilite les applications allant des recommandations personnalisées à la détection d'anomalies et au-delà. Explore des outils comme Ultralytics HUB pour incorporer des capacités d'IA de vision dans tes projets de façon transparente.

Tout lire