Glossaire

Génération Augmentée de Récupération (GAR)

Découvre comment Retrieval Augmented Generation (RAG) améliore les modèles d'IA en intégrant des données externes fiables et en temps réel pour des réponses précises et actualisées.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

Retrieval Augmented Generation (RAG) est une approche innovante visant à améliorer les capacités des modèles génératifs d'IA, en particulier les grands modèles de langage (LLM). Elle s'attaque à l'une des principales limites des LLM standard : leur dépendance exclusive à l'égard des données pré-entraînées, qui peut conduire à des résultats inexacts sur le plan factuel, obsolètes ou dépourvus de compréhension contextuelle spécifique. RAG surmonte ces problèmes en permettant aux modèles d'accéder à des informations provenant de sources externes et de les intégrer en temps réel au cours du processus de génération.

Qu'est-ce que la Génération Augmentée de Récupération (GAR) ?

La génération augmentée par récupération (RAG) est une technique qui enrichit les connaissances des LLM en leur permettant de récupérer des informations dans des bases de connaissances externes avant de générer une réponse. Contrairement aux modèles qui s'appuient uniquement sur leurs paramètres internes pré-entraînés, les modèles basés sur la RAG accèdent dynamiquement aux informations pertinentes provenant de sources externes telles que des documents, des bases de données ou le Web, et les intègrent. Ce processus comble efficacement le fossé entre les vastes connaissances générales intégrées dans les LLM et le besoin d'informations actuelles, précises ou spécifiques à un domaine. Cela permet de s'assurer que le contenu généré est non seulement pertinent sur le plan contextuel, mais qu'il est également fondé sur des faits actualisés et fiables.

Comment fonctionne le RAG

Le processus de Génération Augmentée de Récupération comprend généralement deux étapes principales qui fonctionnent en tandem :

  1. Étape de recherche: Lorsqu'un utilisateur pose une question, le système RAG utilise d'abord un mécanisme d'extraction pour rechercher des informations pertinentes à partir d'une source de connaissances désignée. Cette source de connaissances peut être une base de données vectorielle de documents, une collection de pages Web ou tout autre référentiel de données structurées ou non structurées. Des techniques telles que la recherche sémantique et l'appariement par similarité sont souvent utilisées pour identifier et récupérer les documents ou les morceaux d'information les plus pertinents. Ces méthodes s'appuient sur l'intégration pour comprendre la signification et le contexte de la requête et des informations contenues dans la base de connaissances, ce qui permet de s'assurer que la recherche n'est pas simplement basée sur des mots-clés mais qu'elle s'aligne sur le concept.

  2. Étape d'augmentation et de génération: Une fois que les informations pertinentes sont récupérées, elles sont ensuite "augmentées" ou combinées à la requête originale de l'utilisateur. Cette requête augmentée est ensuite introduite dans le LLM. Le LLM utilise ce contexte enrichi - à la fois la requête originale et les connaissances récupérées - pour générer une réponse plus informée et plus précise. Ce processus garantit que les résultats du modèle sont fondés sur des faits et un contexte externes, plutôt que de s'appuyer uniquement sur les données de pré-entraînement potentiellement limitées ou obsolètes. Des techniques telles que l'ingénierie des messages jouent un rôle crucial dans l'intégration efficace des informations extraites dans le processus de génération, en guidant le LLM pour qu'il produise des réponses cohérentes et pertinentes.

Applications de RAG

Le RAG s'avère être une technique polyvalente qui trouve des applications dans divers domaines :

  • Chatbots améliorés pour le soutien à la clientèle: Dans le cadre du service client, les chatbots alimentés par RAG peuvent fournir des réponses plus précises et plus utiles en récupérant des informations dans des bases de connaissances, des FAQ et de la documentation produit à jour. Cela garantit que les utilisateurs reçoivent des réponses actuelles et spécifiques, ce qui améliore la satisfaction des clients et réduit la nécessité d'une intervention humaine pour les requêtes courantes. Explore davantage les chatbots et leurs applications.

  • Création de contenu et aide à la recherche: Pour les créateurs de contenu et les chercheurs, les systèmes RAG peuvent aider à générer des articles, des rapports et des documents de recherche en donnant accès à de vastes référentiels d'informations. En fondant le texte généré sur des faits et des données récupérés, RAG contribue à garantir l'exactitude des faits et à réduire le risque de plagiat. Cela est particulièrement utile dans les domaines qui nécessitent des informations actualisées ou des approfondissements sur des sujets spécifiques. En savoir plus sur les techniques de génération de texte.

  • Systèmes de gestion des connaissances internes: Les entreprises peuvent utiliser les RAG pour créer des systèmes de gestion des connaissances internes qui permettent aux employés d'accéder rapidement aux informations contenues dans les documents de l'entreprise, les wikis et les bases de données, et d'en faire la synthèse. Cela peut améliorer l'efficacité, faciliter une meilleure prise de décision et rationaliser les processus d'intégration en rendant les connaissances organisationnelles facilement accessibles.

RAG vs. réglage fin

Bien que le RAG et le réglage fin visent tous deux à adapter les MFR à des cas d'utilisation spécifiques, ils fonctionnent différemment :

  • Retrieval Augmented Generation (RAG): RAG améliore le processus de génération en récupérant des informations pertinentes à l'extérieur au moment de la requête. Elle maintient les paramètres du modèle inchangés et s'appuie sur des sources de connaissances externes pour obtenir des informations actualisées et spécifiques au domaine. La RAG est avantageuse lorsqu'il s'agit d'informations qui changent fréquemment ou lorsque le modèle doit accéder à une grande quantité de données qu'il n'est pas pratique d'inclure dans les paramètres du modèle.

  • Mise au point: Le réglage fin, quant à lui, consiste à modifier les paramètres internes d'un modèle pré-entraîné en l'entraînant sur un nouvel ensemble de données spécifique à une tâche. Le réglage fin est efficace pour adapter un modèle à un style, un domaine ou une tâche particulière, mais il met à jour les connaissances de base du modèle et nécessite un réentraînement pour intégrer de nouvelles informations. Explore le concept de réglage fin et d'apprentissage par transfert pour mieux comprendre.

RAG offre un moyen plus souple et plus efficace d'intégrer des connaissances externes et évolutives sans qu'il soit nécessaire de réentraîner l'ensemble du modèle, ce qui en fait un choix pratique pour les applications nécessitant des réponses actualisées et riches en contexte.

Avantages du RAG

L'adoption de RAG offre plusieurs avantages clés :

  • Précision et fiabilité accrues: En fondant les réponses sur des sources externes et vérifiables, le RAG réduit considérablement les erreurs factuelles et les hallucinations dans les MFR, ce qui permet d'obtenir des résultats plus fiables.
  • Accès à des informations actualisées: RAG peut accéder aux dernières informations des bases de connaissances en direct et les intégrer, ce qui garantit que les réponses sont actuelles et pertinentes, un avantage essentiel dans les domaines qui évoluent rapidement.
  • Amélioration de la pertinence contextuelle: RAG s'assure que le contenu généré est très pertinent par rapport à la requête et au contexte de l'utilisateur en récupérant et en incorporant dynamiquement des informations pertinentes.
  • Réduction des hallucinations: En recoupant et en validant les informations par rapport à des sources externes, RAG minimise la génération de contenu fabriqué ou absurde, un problème courant dans les modèles purement génératifs.
  • Mises à jour des connaissances rentables: La mise à jour des connaissances dans un système RAG est aussi simple que la mise à jour de la base de connaissances externe, ce qui demande beaucoup moins de ressources que le recyclage ou l'ajustement d'un grand modèle linguistique.
Tout lire