Padroneggia l'intelligenza artificiale con l'arricchimento immediato! Migliora i risultati dei Large Language Models usando il contesto, istruzioni chiare ed esempi per ottenere risultati precisi.
L'arricchimento del prompt è il processo di miglioramento automatico o semi-automatico della richiesta di input iniziale dell'utente prima di darla in pasto a un modello di intelligenza artificiale (AI), in particolare ai Large Language Models (LLM). L'obiettivo è aggiungere un contesto rilevante, chiarire le ambiguità, imporre vincoli o includere dettagli specifici che aiutino l'IA a generare una risposta più accurata, pertinente e utile. Questa tecnica migliora la qualità dell'interazione tra gli utenti e i sistemi di intelligenza artificiale rendendo i suggerimenti più efficaci senza richiedere all'utente di essere un esperto di ingegneria dei suggerimenti.
Il processo prevede in genere l'analisi del messaggio originale e l'utilizzo di fonti di informazione aggiuntive o di regole predefinite per aumentarlo. Ciò potrebbe includere l'accesso alla cronologia degli utenti, il recupero di documenti rilevanti da una base di conoscenza, l'incorporazione del contesto della conversazione o l'applicazione di istruzioni di formattazione specifiche. Per esempio, una richiesta vaga come "Parlami di Ultralytics YOLO" potrebbe essere arricchita con un contesto che specifichi che l'utente è interessato all'ultima versione(YOLOv11) o alle sue prestazioni rispetto ad altri modelli come YOLOv8. Spesso vengono utilizzate tecniche come la Retrieval-Augmented Generation (RAG), in cui il sistema recupera frammenti di dati rilevanti e li aggiunge alla finestra contestuale del prompt.
L'arricchimento immediato trova applicazione in diverse attività guidate dall'intelligenza artificiale:
È importante distinguere l'arricchimento immediato da termini simili:
Sebbene sia meno comune nei compiti tradizionali di visione computerizzata, come il rilevamento di oggetti standard, il concetto è rilevante per i nuovi modelli di visione con prompt, come YOLOE, che utilizzano messaggi di testo o immagini che potrebbero potenzialmente beneficiare dell'arricchimento contestuale per migliorare le prestazioni a colpo zero. Piattaforme come Ultralytics HUB potrebbero incorporare queste tecniche per semplificare l'interazione con l'utente durante la definizione di compiti di visione complessi.