Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Intégrations (Embeddings)

Découvrez comment les intégrations relient les données humaines et la logique des machines. Apprenez à générer des représentations vectorielles pour les tâches d'IA à l'aide Ultralytics et explorez la Ultralytics .

Les intégrations sont des représentations vectorielles denses, de faible dimension et continues de variables discrètes, qui servent de traducteur fondamental entre les données humaines et la logique machine. Dans le domaine de l' intelligence artificielle (IA), les ordinateurs ne peuvent pas comprendre intuitivement les données désordonnées et non structurées telles que le texte, les images ou l'audio. Les embeddings résolvent ce problème en convertissant ces entrées en listes de nombres réels, appelés vecteurs, qui existent dans un espace mathématique de haute dimension. Contrairement aux encodages traditionnels qui peuvent simplement attribuer un identifiant aléatoire à un objet, les embeddings sont appris par le biais d'un entraînement, garantissant ainsi que des éléments sémantiquement similaires, tels que les mots « roi » et « reine » ou les images de deux chats différents, soient positionnés à proximité les uns des autres dans l' espace vectoriel.

Comment fonctionne l'intégration

La création d'un encodage implique l'alimentation d'un réseau neuronal conçu pour l'extraction de caractéristiques avec des données brutes. Au cours de l'entraînement, le modèle apprend à compresser les caractéristiques essentielles de l'entrée sous une forme numérique compacte. Par exemple, un modèle de vision par ordinateur (CV) analysant une photographie ne se contente pas de voir des pixels ; il mappe les formes, les textures et les couleurs dans une coordonnée spécifique d'un graphique multidimensionnel. Lorsqu'ils mesurent la similarité, les systèmes calculent la distance entre ces coordonnées à l'aide de métriques telles que la similarité cosinus ou la distance euclidienne. Cette proximité mathématique permet aux algorithmes d'effectuer des tâches complexes telles que la classification et le regroupement avec une grande efficacité.

Applications concrètes

Les intégrations constituent le moteur de nombreuses fonctionnalités intelligentes utilisées dans les logiciels modernes.

  • Recherche sémantique: Les moteurs de recherche traditionnels s'appuient souvent sur la correspondance exacte de mots-clés, ce qui échoue si un utilisateur recherche « auto » mais que le document contient « voiture ». Les intégrations capturent le sens derrière les mots. En représentant la requête de recherche et les documents de la base de données sous forme de vecteurs, le système peut récupérer des résultats qui correspondent à l'intention de l'utilisateur, même si les mots spécifiques diffèrent.
  • Systèmes de recommandation: Les services de streaming et les sites de commerce électronique utilisent des intégrations pour personnaliser l'expérience utilisateur. Si un utilisateur regarde un film de science-fiction, le système identifie le vecteur d'intégration de ce film et recherche d'autres films avec des vecteurs proches dans la base de données. Cela permet de faire des suggestions précises basées sur la similitude du contenu plutôt que sur de simples balises ou catégories manuelles .
  • Apprentissage sans apprentissage préalable: Les modèles avancés utilisent des intégrations conjointes pour relier différentes modalités, telles que le texte et les images. Cela permet à un système de reconnaître des objets qu'il n'a jamais explicitement vus pendant l'entraînement en associant l'intégration de l'image à l'intégration du texte du nom de l'objet

Génération d'intégrations avec Python

Des modèles à la pointe de la technologie tels que YOLO26 peut être utilisé pour générer efficacement des intégrations d'images robustes. L'exemple suivant montre comment extraire un vecteur de caractéristiques d'une image à l'aide de la fonction ultralytics Paquet Python .

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Generate embeddings for an image
# The embed() method returns the feature vector representing the image content
embedding_vector = model.embed("https://ultralytics.com/images/bus.jpg")

# Print the shape of the embedding (e.g., a vector of length 1280)
print(f"Embedding shape: {embedding_vector[0].shape}")

Embeddings vs. Concepts connexes

Pour mettre en œuvre efficacement des solutions d'IA, il est utile de distinguer les embeddings des termes techniques étroitement liés.

  • Embeddings vs. Vector Search: L'embedding est la représentation des données elle-même (la liste de nombres). La recherche vectorielle est le processus consécutif qui consiste à interroger une base de données pour trouver les voisins les plus proches de cet embedding. Des outils spécialisés appelés bases de données vectorielles sont souvent utilisés pour stocker et rechercher ces embeddings à grande échelle.
  • Embeddings vs. Tokenisation: Dans le traitement du langage naturel (NLP), la tokenisation est l'étape préliminaire qui consiste à diviser le texte en morceaux plus petits (tokens). Ces tokens sont ensuite mappés à des embeddings. Par conséquent, la tokenisation prépare les données, tandis que les embeddings représentent la signification des données.
  • Embeddings vs Deep Learning: Le Deep Learning est le domaine plus large de l'apprentissage automatique basé sur les réseaux neuronaux. Les embeddings sont une sortie ou une couche spécifique au sein d'une architecture de Deep Learning, servant souvent de pont entre les entrées brutes et les couches de prise de décision du modèle.

Les développeurs qui souhaitent gérer le cycle de vie de leurs ensembles de données, y compris l'annotation et l'entraînement de modèles pour générer des intégrations personnalisées, peuvent utiliser la Ultralytics . Cet outil complet simplifie le flux de travail, de la gestion des données au déploiement, en garantissant que les intégrations qui alimentent vos applications sont dérivées de données de haute qualité et bien organisées. Que vous utilisiez des frameworks tels que PyTorch ou TensorFlow, la maîtrise des intégrations est une étape cruciale dans la construction de systèmes sophistiqués de reconnaissance de formes.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant