Un graphique de connaissances organise les informations en reliant des entités du monde réel (comme des personnes, des lieux, des organisations ou des concepts) et en décrivant les relations qui existent entre elles. Il fonctionne comme une carte intelligente des connaissances, où les points représentent les entités et les lignes qui les relient représentent la façon dont elles sont liées. Cette approche structurée est cruciale pour les systèmes d'intelligence artificielle (IA) et d'apprentissage automatique (ML), car elle leur permet de comprendre le contexte, de tirer des conclusions et d'accéder aux informations plus efficacement qu'en recherchant dans des textes non structurés ou des bases de données isolées. Les KG constituent l'épine dorsale sémantique de nombreuses applications avancées d'IA.
Concepts de base
Les graphes de connaissances sont constitués de nœuds (représentant des entités ou des concepts) et d'arêtes (représentant les relations ou les prédicats reliant ces nœuds). Par exemple, un nœud peut êtreUltralytics YOLO" et un autre"Détection d'objets" ; une arête intitulée "est un type de" pourrait les relier. Cette structure permet d'interroger des relations complexes et d'effectuer des tâches de raisonnement, telles que la déduction de nouveaux faits à partir des données connectées existantes. Les KG s'appuient sur des technologies clés : des normes telles que le Resource Description Framework (RDF) fournissent un modèle commun pour la représentation des données, tandis que des langages d'interrogation tels que SPARQL permettent la recherche d'informations sur la base de modèles de graphes. La construction de KG implique souvent l'extraction d'informations à partir de diverses sources, y compris des données structurées (comme les bases de données) et du texte non structuré, en utilisant fréquemment des techniques de traitement du langage naturel (NLP) et des systèmes de raisonnement potentiellement complexes. La qualité des données et la gouvernance des données sont essentielles au maintien de KG fiables.
Graphes de connaissances et autres concepts
Bien qu'ils soient apparentés à d'autres méthodes d'organisation des données, les graphes de connaissances possèdent des caractéristiques uniques :
- Ontologie: Une ontologie définit formellement les types, les propriétés et les relations entre les entités d'un domaine spécifique (le schéma ou le plan). Les KG utilisent souvent une ontologie comme base structurelle, mais contiennent également les données d'instance réelles (les faits et entités spécifiques). Des langages tels que le Web Ontology Language (OWL) sont utilisés pour définir les ontologies.
- Taxonomie : Une taxonomie est un système de classification hiérarchique (par exemple, la classification des animaux par règne, phylum, classe). Les KG sont plus souples et représentent des réseaux complexes et multi-relationnels qui ne sont pas strictement hiérarchiques.
- Bases de données vectorielles: Ces bases de données stockent les données sous forme d'enchâssements numériques optimisés pour les recherches de similarité(recherche vectorielle). Les KG, à l'inverse, représentent des relations explicites et symboliques entre les entités. Bien que distincts, ils peuvent être complémentaires ; les KG peuvent fournir un contexte structuré pour les informations récupérées par le biais de la recherche vectorielle.
Applications en IA/ML
Les graphes de connaissances font partie intégrante de nombreuses applications intelligentes :
- Recherche sémantique: Les moteurs de recherche comme Google utilisent les KG (par exemple, le Google Knowledge Graph) pour comprendre l'intention derrière les requêtes et fournir des résultats plus pertinents et contextuels au-delà de la simple correspondance des mots clés.
- Systèmes de recommandation: En modélisant les relations entre les utilisateurs, les articles et leurs attributs, les KG permettent des recommandations plus sophistiquées et personnalisées dans des domaines tels que le commerce électronique(l'IA dans la vente au détail) et le streaming de contenu.
- Réponse aux questions et Chatbots: Les KG fournissent des connaissances structurées qui permettent aux systèmes d'IA de répondre à des questions complexes en naviguant dans les relations entre entités, améliorant ainsi les capacités d'IA conversationnelle.
- Intégration des données : Les KG peuvent unifier des données provenant de sources disparates, créant ainsi une vue cohérente et interconnectée des informations à l'échelle d'une organisation. Cet aspect est vital pour les analyses de données massives (Big Data).
- Améliorer d'autres modèles d'IA : Les KG peuvent fournir des connaissances contextuelles pour d'autres tâches d'intelligence artificielle. Par exemple, dans le domaine de la vision artificielle, un KG peut relier des objets détectés par des modèles tels que Ultralytics YOLOv8 à des informations connexes sur leurs propriétés, leurs fonctions ou leurs interactions, ce qui permet d'enrichir la compréhension de la scène. Des plateformes comme Ultralytics HUB gèrent des ensembles de données et des modèles qui pourraient potentiellement alimenter ou exploiter les KG.
Exemples concrets
- Personnalisation du commerce électronique : Un détaillant en ligne utilise un graphe de connaissances qui relie les clients, les produits, les marques, les catégories, l'historique de consultation, les données d'achat et les avis sur les produits. Lorsqu'un utilisateur recherche des "chaussures de course", le KG aide le système à comprendre les concepts connexes (par exemple, "marathon", "trail running", marques spécifiques) et les préférences de l'utilisateur (achats antérieurs, articles consultés) afin de fournir des résultats de recherche hautement personnalisés et des recommandations pour des produits complémentaires tels que des vêtements ou des accessoires. L'expérience du client s'en trouve améliorée.
- Solutions d'IA dans le domaine de la santé: Un établissement de recherche médicale construit un graphe de connaissances reliant les maladies, les symptômes, les gènes, les protéines, les médicaments, les essais cliniques et les publications de recherche(comme celles indexées dans PubMed). Cela permet aux chercheurs et aux cliniciens d'interroger des relations complexes, telles que "Trouver des médicaments qui ciblent la protéine X et sont utilisés pour traiter la maladie Y", ce qui accélère la découverte de médicaments et fournit une aide à la décision pour les diagnostics basés sur les données interconnectées relatives aux symptômes et aux patients, améliorant potentiellement l'analyse des images médicales.