Glossar

Retrieval Augmented Generation (RAG)

Entdecke, wie Retrieval Augmented Generation (RAG) NLP revolutioniert, indem es externes Wissen mit der Texterstellung kombiniert, um genaue, aktuelle Ergebnisse zu erzielen.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Retrieval Augmented Generation (RAG) ist ein innovativer Ansatz im Bereich der natürlichen Sprachverarbeitung (NLP), der die Fähigkeiten von Sprachmodellen durch die Integration von externem Wissensabruf in den Textgenerierungsprozess erweitert. Im Gegensatz zu traditionellen Modellen, die sich ausschließlich auf ihr vortrainiertes Wissen verlassen, holen sich RAG-Modelle dynamisch relevante Informationen aus einem riesigen Dokumentenkorpus, um ihre Antworten zu ergänzen und zu bereichern. Diese Methode verbessert die Genauigkeit, Relevanz und Tiefe des generierten Textes erheblich, was sie besonders nützlich für Anwendungen macht, die aktuelle oder spezifische Informationen benötigen.

Wie Retrieval Augmented Generation funktioniert

RAG-Modelle vereinen die Stärken von retrieval- und generationsbasierten Ansätzen. Der Prozess umfasst in der Regel zwei Hauptkomponenten: einen Retriever und einen Generator. Wenn eine Anfrage gestellt wird, durchsucht der Retriever eine große Datenbank mit Dokumenten und wählt die relevantesten Passagen auf der Grundlage des Kontextes der Anfrage aus. Diese gefundenen Passagen werden dann in den Generator eingespeist, der diese Informationen nutzt, um eine kohärente und kontextgerechte Antwort zu erstellen. Bei dem Generator handelt es sich häufig um ein Transformer-Modell, ähnlich wie bei GPT (Generative Pre-trained Transformer) oder BERT (Bidirectional Encoder Representations from Transformers), das jedoch zusätzlich externe Informationen einbeziehen kann.

Die wichtigsten Bestandteile der RAG

Die Retriever-Komponente ist dafür zuständig, relevante Dokumente oder Passagen aus einer externen Wissensquelle zu identifizieren und abzurufen. Diese Komponente nutzt oft Techniken wie TF-IDF, BM25 oder Dense Embeddings, um die Ähnlichkeit zwischen der Anfrage und den Dokumenten zu messen. Die Generator-Komponente ist ein Sequenz-zu-Sequenz-Modell, das aus den abgerufenen Informationen und der ursprünglichen Abfrage die endgültige Ausgabe erzeugt. Diese Komponente ist darauf trainiert, Informationen aus verschiedenen Quellen zusammenzufassen und eine flüssige und informative Antwort zu geben.

Vorteile des Einsatzes der RAG

RAG bietet mehrere Vorteile gegenüber herkömmlichen großen Sprachmodellen (LLMs). Da der Generierungsprozess auf externen, überprüfbaren Informationen beruht, können RAG-Modelle genauere und zuverlässigere Ergebnisse liefern. Dadurch verringert sich das Risiko von Halluzinationen, bei denen das Modell zwar plausible, aber falsche Informationen erzeugt. Außerdem können sich RAG-Modelle leicht an neue Informationen anpassen, indem sie die Retrieval-Datenbank aktualisieren. Das macht sie flexibler und aktueller als Modelle, die sich ausschließlich auf statisches, vorab trainiertes Wissen verlassen.

Anwendungen der RAG in der realen Welt

Verbesserte Fragenbeantwortung

RAG-Modelle eignen sich hervorragend für die Beantwortung von Fragen, insbesondere wenn die Antworten spezifische, aktuelle oder Nischeninformationen erfordern. Ein RAG-gestützter Chatbot für den Kundensupport kann zum Beispiel die neuesten Produktdokumentationen oder FAQs abrufen, um genaue und hilfreiche Antworten auf Benutzeranfragen zu geben. So wird sichergestellt, dass die Kunden die aktuellsten Informationen erhalten, ohne dass das Modell häufig umgeschult werden muss.

Erstellung von Inhalten und Zusammenfassungen

RAG kann verwendet werden, um hochwertige, informative Inhalte zu erstellen, indem relevante Fakten, Statistiken und Details aus verschiedenen Quellen herangezogen werden. Ein RAG-Modell kann zum Beispiel beim Verfassen von Nachrichtenartikeln helfen, indem es die neuesten Ereignisse und Daten zum Thema abfragt. Auch bei der Textzusammenfassung kann RAG umfassendere und genauere Zusammenfassungen erstellen, indem es Informationen aus mehreren Dokumenten einbezieht.

RAG vs. andere Sprachmodelle

Im Vergleich zu anderen Sprachmodellen wie GPT hebt sich die RAG durch ihre Fähigkeit ab, auf externes Wissen zuzugreifen und es zu nutzen. GPT-Modelle wie GPT-3 und GPT-4 können zwar menschenähnlichen Text erzeugen, sind aber durch die Daten, auf denen sie trainiert wurden, eingeschränkt. Im Gegensatz dazu verbessert RAG den Generierungsprozess, indem es dynamisch relevante Informationen abruft, was zu fundierteren und präziseren Ergebnissen führt. Dieser Unterschied macht RAG besonders wertvoll in Szenarien, in denen Genauigkeit und aktuelle Informationen entscheidend sind.

Herausforderungen und zukünftige Wege

Trotz seiner Vorteile steht RAG auch vor Herausforderungen. Die Qualität des generierten Outputs hängt stark von der Effektivität des Retrievers ab. Wenn der Retriever nicht in der Lage ist, relevante Dokumente zu finden, kann die Leistung des Generators darunter leiden. Außerdem kann die Integration und Verarbeitung von Informationen aus verschiedenen Quellen sehr rechenintensiv sein. Zukünftige Forschungsrichtungen umfassen die Verbesserung der Effizienz der Abrufmechanismen, die Verbesserung der Fähigkeit des Generators, Informationen zu synthetisieren, und die Erforschung neuer Wege, um strukturierte und unstrukturierte Datenquellen einzubeziehen. Mehr über RAG erfährst du in diesem Forschungspapier.

Weitere Einblicke in fortgeschrittene NLP-Techniken und -Modelle findest du im Ultralytics Blog.

Alles lesen