Yolo Vision Shenzhen
Shenzhen
Iscriviti ora
Glossario

Retrieval Augmented Generation (RAG)

Scopri come la Retrieval Augmented Generation (RAG) ottimizza i modelli di linguaggio grande (LLM) con dati in tempo reale. Impara a creare pipeline multimodali utilizzando Ultralytics per la RAG visiva.

Il Recovery Augmented Generation (RAG) è una tecnica avanzata nel campo dell'intelligenza artificiale che ottimizza l'output di un Large Language Model (LLM) facendo riferimento a una base di conoscenza autorevole al di fuori dei suoi dati di addestramento. I modelli generativi tradizionali si basano esclusivamente su informazioni statiche aprese durante il loro addestramento iniziale, il che può portare a risposte obsolete o a inesattezze sicure note come allucinazioni. RAG colma questa lacuna recuperando informazioni pertinenti e aggiornate da fonti esterne, come database aziendali, notizie di attualità o manuali tecnici, e inserendole nel modello come contesto prima che venga generata una risposta. Questo processo garantisce che i risultati dell'IA non siano solo linguisticamente coerenti, ma anche accurati dal punto di vista fattuale e basati su dati specifici.

Come funzionano i sistemi RAG

L'architettura di un sistema RAG prevede in genere due fasi principali: recupero e generazione. Questo flusso di lavoro consente agli sviluppatori di mantenere un modello di base senza la costosa necessità di un frequente retraining.

  1. Recupero: quando un utente invia una query, il sistema esegue innanzitutto una ricerca semantica in un sistema di archiviazione specializzato chiamato database vettoriale. Questo database contiene dati che sono stati convertiti in rappresentazioni numeriche note come embedding, consentendo al sistema di trovare informazioni concettualmente simili anziché limitarsi a trovare parole chiave corrispondenti.
  2. Generazione: i documenti o i frammenti di dati rilevanti trovati durante il recupero vengono combinati con la domanda originale dell'utente. Questo prompt arricchito viene quindi inviato al modello generativo. Il modello utilizza il contesto fornito per sintetizzare una risposta, assicurando che essa si basi sui fatti recuperati. Per approfondire i meccanismi, IBM fornisce una guida completa sui flussi di lavoro RAG.

Visual RAG: integrazione della visione artificiale

Mentre il RAG è tradizionalmente basato sul testo, l'ascesa dell' apprendimento multimodale ha introdotto il "Visual RAG". In questo scenario, i modelli di visione artificiale fungono da meccanismo di recupero. Essi analizzano immagini o flussi video per estrarre dati testuali strutturati, come nomi di oggetti, conteggi o attività, che vengono poi inseriti in un LLM per rispondere a domande sulla scena visiva.

Ad esempio, uno sviluppatore può utilizzare YOLO26 per detect in un'immagine e passare l'elenco degli oggetti a un modello di testo per generare un rapporto descrittivo.

from ultralytics import YOLO

# Load the YOLO26 model for state-of-the-art detection
model = YOLO("yolo26n.pt")

# Perform inference to 'retrieve' visual facts from an image
results = model("https://ultralytics.com/images/bus.jpg")

# Extract class names to build a text context for an LLM
detected_classes = [model.names[int(c)] for c in results[0].boxes.cls]
context_string = f"The scene contains: {', '.join(detected_classes)}."

print(context_string)
# Output example: "The scene contains: bus, person, person, person."

Applicazioni nel mondo reale

RAG sta trasformando i settori industriali consentendo agli agenti di IA di accedere in modo sicuro a dati proprietari o in tempo reale.

  • Basi di conoscenza aziendali: le aziende utilizzano RAG per creare chatbot interni che rispondono alle domande dei dipendenti sulle politiche HR o sulla documentazione tecnica. Collegando un LLM a un archivio di documenti in tempo reale, il sistema evita di fornire informazioni obsolete sulle politiche. Per ulteriori informazioni sulle implementazioni aziendali, consultare la panoramicaGoogle su RAG in Vertex AI.
  • Supporto alle decisioni cliniche: nell'ambito dell' intelligenza artificiale in campo sanitario, i sistemi RAG possono recuperare la storia clinica dei pazienti e i recenti articoli di ricerca medica per assistere i medici nella diagnosi, garantendo che la consulenza tenga conto degli studi clinici più recenti.
  • Assistenti di vendita intelligenti: le applicazioni che utilizzano l' intelligenza artificiale nella vendita al dettaglio sfruttano il RAG per controllare i database delle scorte in tempo reale . Se un cliente chiede a un chatbot: "Avete queste scarpe da corsa nella taglia 44?", il modello recupera i livelli delle scorte in tempo reale prima di rispondere, evitando la frustrazione per gli articoli esauriti.

RAG vs. messa a punto

È fondamentale distinguere il RAG dal fine-tuning, poiché risolvono problemi diversi.

  • RAG (Retrieval Augmented Generation): ideale per accedere a dati dinamici e in frequente evoluzione (ad esempio, quotazioni di borsa, notizie) o dati privati non presenti nel set di addestramento pubblico. Si concentra sulla fornitura di nuove informazioni in fase di esecuzione.
  • Messa a punto: ideale per adattare il comportamento, lo stile o la terminologia del modello. Comporta l'aggiornamento dei pesi del modello su un set di dati specifico. Sebbene la messa a punto aiuti un modello ad apprendere uno specifico modello linguistico (come il gergo medico), non garantisce l'accesso a fatti in tempo reale. Consulta la guida di OpenAI sulla messa a punto rispetto al RAG per i quadri decisionali.

Concetti correlati

  • LangChain: un popolare framework open source progettato specificamente per semplificare la creazione di applicazioni RAG concatenando retriever e LLM.
  • Grafico di conoscenza: un modo strutturato di rappresentare i dati che può essere utilizzato come fonte di recupero, offrendo relazioni più ricche dal punto di vista contestuale rispetto alla semplice similarità vettoriale.
  • Prompt Engineering: L'arte di creare input per guidare il modello. RAG è essenzialmente una forma automatizzata di prompt engineering in cui il "prompt" è arricchito con dati recuperati in modo programmatico.
  • Ultralytics : mentre RAG gestisce la generazione di testo , piattaforme come questa sono essenziali per gestire la pre-elaborazione dei dati e l'addestramento dei modelli di visione che alimentano i dati visivi nelle pipeline multimodali RAG.

Unitevi alla comunità di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora