Glossario

Ingegneria tempestiva

Padroneggiate l'arte del prompt engineering per guidare i modelli di intelligenza artificiale come gli LLM per ottenere risultati precisi e di alta qualità nei contenuti, nel servizio clienti e altro ancora.

L'ingegneria dei prompt è l'arte e la scienza di progettare input efficaci (prompt) per guidare i modelli di intelligenza artificiale (AI), in particolare i Large Language Models (LLM), verso la generazione degli output desiderati. È come essere un abile comunicatore con un'intelligenza artificiale, sapendo esattamente cosa dire e come dirlo per ottenere la migliore risposta possibile. Questa pratica è fondamentale perché le prestazioni, la pertinenza e la qualità dei risultati di un modello di intelligenza artificiale sono molto sensibili al modo in cui viene formulata la domanda. Un prompt engineering efficace consente agli utenti di sfruttare tutto il potenziale dei potenti modelli di base per un'ampia gamma di attività.

Come funziona Prompt Engineering

Il fulcro dell'ingegneria dei prompt è la strutturazione di un input che fornisca un contesto chiaro e sufficiente per il modello. Mentre una domanda semplice può produrre una risposta di base, un prompt ben strutturato può controllare il tono, il formato e la complessità. I componenti chiave di un prompt avanzato possono includere

  • Istruzione: Una direttiva chiara e specifica che indica al modello il compito da svolgere (ad esempio, "Riassumi il seguente articolo in tre punti").
  • Contesto: Fornire informazioni di base o dati rilevanti che il modello deve utilizzare per informare la sua risposta.
  • Persona: Assegnazione di un ruolo all'IA, che influenza il tono e lo stile dell'output (ad esempio, "Agisci come un esperto analista finanziario").
  • Formato: Specificare la struttura desiderata dell'output, come un elenco, un oggetto JSON o uno stile di scrittura specifico.
  • Esempi: L'inclusione di esempi del formato di input e output desiderato, una tecnica nota come apprendimento a pochi colpi, aiuta a guidare la risposta del modello. Una risorsa completa per queste tecniche è disponibile nella Guida al prompt.

Applicazioni del mondo reale

  1. Automazione dell'assistenza clienti: Per garantire la coerenza e l'accuratezza del marchio, un'azienda può utilizzare l'ingegneria dei prompt per guidare il suo chatbot di assistenza. Un prompt potrebbe indicare all'IA di adottare un tono amichevole e disponibile, di utilizzare una base di conoscenze interna per rispondere alle domande sui prodotti e di definire un protocollo chiaro per stabilire quando passare una conversazione a un agente umano. In questo modo si controlla il comportamento dell'intelligenza artificiale, impedendole di fornire informazioni errate o di interagire con i clienti in modo non conforme al marchio.

  2. Generazione di contenuti creativi: Nei modelli text-to-image come Midjourney o DALL-E 3 di OpenAI, la richiesta è lo strumento principale per la creazione. Una richiesta semplice come "la foto di un'auto" produrrà un risultato generico. Tuttavia, un prompt dettagliato come "Un'auto sportiva rossa d'epoca degli anni '60 che sfreccia su un'autostrada costiera al tramonto, stile fotorealistico, illuminazione cinematografica, risoluzione 8K" fornisce istruzioni specifiche sul soggetto, l'ambientazione, lo stile e la qualità, producendo un'immagine altamente personalizzata e di grande impatto visivo.

Rilevanza nella visione artificiale

Pur essendo nata nell'ambito dell'elaborazione del linguaggio naturale (NLP), l'ingegneria del prompt è sempre più rilevante nell'ambito della visione artificiale (CV). Ciò è dovuto allo sviluppo di modelli multimodali in grado di elaborare contemporaneamente testo e immagini. Modelli come CLIP e rilevatori di vocaboli aperti come YOLO-World possono eseguire compiti come il rilevamento di oggetti sulla base di descrizioni testuali arbitrarie. Per questi modelli, la creazione di un prompt testuale efficace (ad esempio, "rileva tutte le 'biciclette' ma ignora le 'motociclette'") è una forma di ingegneria del prompt cruciale per guidare questi modelli linguistici di visione. Piattaforme come Ultralytics HUB facilitano l'interazione con i vari modelli, dove la definizione dei compiti attraverso le interfacce può trarre vantaggio dai principi dell'ingegneria dei prompt.

Ingegneria di base e concetti affini

È importante distinguere il prompt engineering da altri concetti di apprendimento automatico:

  • Messa a punto: Si tratta di aggiornare i pesi di un modello continuando il processo di addestramento su un nuovo set di dati. Il Prompt Engineering, invece, non modifica il modello stesso, ma guida il comportamento del modello esistente al momento dell'inferenza.
  • Sintonizzazione del prompt: Un metodo di regolazione fine efficiente dei parametri (PEFT), la sintonizzazione dei prompt comporta l'apprendimento di un piccolo insieme di incorporamenti di "prompt morbidi" che vengono aggiunti all'input. Questo metodo automatizza la creazione di prompt attraverso l'addestramento, mentre l'ingegnerizzazione dei prompt è il processo manuale di creazione di "hard prompt" basati sul testo.
  • Prompting a catena di pensiero (CoT): Il CoT è una tecnica specifica di ingegneria dei prompt in cui al prompt viene aggiunta un'istruzione del tipo "pensa passo dopo passo". Questo incoraggia il modello a scomporre i problemi complessi in fasi di ragionamento intermedie, che spesso portano a risultati più accurati, come illustrato nel documento di ricerca originale di Google AI.
  • Prompt di concatenamento: Questa tecnica prevede la suddivisione di un compito complesso in più prompt sequenziali, in cui il risultato di una fase è l'input per la successiva. L'ingegneria dei prompt è la pratica più ampia di progettare in modo efficace ciascuno di questi singoli prompt. Framework come LangChain sono progettati per orchestrare tali catene.
  • Generazione aumentata dal recupero (RAG): RAG è un sistema che migliora un prompt recuperando prima i dati rilevanti da una base di conoscenza esterna. L'ingegnerizzazione del prompt è fondamentale in un sistema RAG per formulare correttamente sia la query di ricerca iniziale sia il prompt finale che combina la domanda dell'utente con le informazioni recuperate.

Unitevi alla comunità di Ultralytics

Entrate a far parte del futuro dell'IA. Connettetevi, collaborate e crescete con gli innovatori globali.

Iscriviti ora
Link copiato negli appunti