Découvrez comment les graphes de connaissances organisent les entités et les relations du monde réel pour l'IA. Découvrez comment utiliser Ultralytics pour extraire des nœuds et améliorer les modèles ML.
Un graphe de connaissances est une représentation structurée des entités du monde réel et des relations qui les unissent. Contrairement à une base de données standard qui stocke les données dans des lignes et des colonnes rigides, un graphe de connaissances organise les informations sous la forme d'un réseau de nœuds (représentant des objets, des personnes ou des concepts) et d'arêtes (représentant les connexions ou les interactions entre ces nœuds). Cette structure imite la manière dont les humains organisent les informations, permettant aux systèmes d'intelligence artificielle (IA) de comprendre le contexte, de déduire de nouveaux faits et de raisonner sur les données d'une manière plus sémantique et interconnectée.
Au cœur d'un graphe de connaissances se trouvent trois composants principaux qui forment des « triplets » (sujet-prédicat-objet) :
Cette structure en forme de toile permet aux systèmes d'effectuer des recherches sémantiques, où le moteur comprend l' intention de l'utilisateur plutôt que de se contenter de faire correspondre des mots-clés. Par exemple, le fait de savoir que « Jaguar » est à la fois un animal et une marque de voiture permet au système de différencier les résultats en fonction du contexte.
Les graphes de connaissances sont de plus en plus essentiels pour améliorer les modèles d'apprentissage automatique (ML). Si les modèles d'apprentissage profond excellent dans la reconnaissance statistique des modèles, ils manquent souvent de fondement factuel. L'intégration d'un graphe de connaissances permet aux modèles d'accéder à une « vision du monde » vérifiée.
Les modèles de vision par ordinateur constituent d'excellents points d'entrée pour alimenter les graphes de connaissances en identifiant des entités physiques dans le monde réel. Python suivant montre comment utiliser le modèle Ultralytics pour detect dans une image. Ces classes détectées peuvent servir de nœuds, qui peuvent ensuite être reliés dans une base de données orientée graphe (comme Neo4j ou Amazon Neptune).
from ultralytics import YOLO
# Load the latest YOLO26 model (released Jan 2026)
model = YOLO("yolo26n.pt")
# Run inference on an image to find entities
results = model("https://ultralytics.com/images/bus.jpg")
# Extract unique detected object names to serve as graph nodes
# e.g., {'bus', 'person'}
detected_entities = {results[0].names[int(c)] for c in results[0].boxes.cls}
print(f"Graph Nodes: {detected_entities}")
Il est important de distinguer un graphe de connaissances d'une base de données relationnelle traditionnelle (SGBDR). Une base de données relationnelle stocke les données dans des tables rigides reliées par des clés étrangères, ce qui est efficace pour les données structurées et transactionnelles (comme les registres bancaires). Cependant, l'interrogation de relations complexes (par exemple, « Trouver les amis d'amis qui aiment la science-fiction ») nécessite des opérations de « jointure » coûteuses.
En revanche, un graphe de connaissances (souvent stocké dans une base de données orientée graphe) traite la relation comme un élément à part entière. Le parcours des connexions est instantané, ce qui rend les graphes supérieurs pour les tâches impliquant des données hautement interconnectées, telles que la détection des réseaux de fraude ou l'analyse des réseaux sociaux. Alors que les SGBDR excellent dans le stockage et la récupération d'enregistrements spécifiques, les graphes de connaissances excellent dans la découverte de modèles et d'informations cachées au sein des connexions elles-mêmes.
L'avenir des graphes de connaissances réside dans l' apprentissage multimodal. À mesure que des modèles tels que Ultralytics continuent de progresser dans la détection d'objets et l'estimation de poses, ils alimenteront automatiquement les graphes en contexte visuel. Cela permet de créer des systèmes qui non seulement « lisent » le texte, mais « voient » également le monde, en reliant les concepts visuels aux définitions linguistiques. À l'aide de Ultralytics , les développeurs peuvent former ces modèles de vision spécialisés à reconnaître des entités personnalisées, créant ainsi efficacement les organes sensoriels de la prochaine génération de systèmes d'IA sensibles aux connaissances.