Glossario

Ingegneria tempestiva

Impara l'arte dell'ingegneria dei tempi per guidare i modelli di intelligenza artificiale come gli LLM per ottenere risultati precisi e di alta qualità nei contenuti, nel servizio clienti e altro ancora.

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

L'ingegneria dei prompt è l'arte e la scienza di creare input efficaci (prompt) per guidare i modelli di intelligenza artificiale (AI), in particolare i Large Language Models (LLM), verso la generazione degli output desiderati. Si tratta di capire come questi modelli interpretano le istruzioni e di progettare iterativamente suggerimenti che siano chiari, specifici e che forniscano un contesto sufficiente a suscitare risposte accurate, pertinenti e utili. Poiché i modelli di intelligenza artificiale sono sempre più integrati in vari strumenti e flussi di lavoro, la padronanza dell'ingegneria dei prompt è fondamentale per massimizzare il loro potenziale e garantire prestazioni affidabili in compiti che vanno dalla semplice risposta alle domande alla complessa generazione di testi creativi.

Come funziona Prompt Engineering

L'ingegnerizzazione efficace dei prompt è spesso un processo iterativo. Si parte dall'analisi dei requisiti dell'attività e dalla comprensione delle capacità e dei limiti del modello di intelligenza artificiale di destinazione. L'ingegnere progetta quindi un prompt iniziale, lo testa, valuta l'output e lo perfeziona in base ai risultati. Questo perfezionamento potrebbe comportare l'aggiunta di istruzioni più specifiche, la fornitura di esempi(apprendimento con pochi colpi), la definizione del formato di output desiderato (ad esempio, JSON), l'impostazione di vincoli o la regolazione del tono. Le tecniche chiave spesso si basano sui principi dell'elaborazione del linguaggio naturale (NLP) e richiedono un'attenta considerazione del modo in cui la formulazione influisce sul comportamento del modello, influenzato dai dati di addestramento e dall'architettura, come il modello Transformer descritto nel famoso articolo "Attention Is All You Need".

Tecniche chiave di sollecitazione

Nell'ingegneria della tempestività vengono comunemente impiegate diverse strategie:

  • Prompting Zero-Shot: Chiedere direttamente al modello di eseguire un compito senza fornire esempi precedenti all'interno del prompt stesso. In questo modo si fa affidamento sulle conoscenze preesistenti del modello acquisite durante l'addestramento. Vedi Apprendimento Zero-Shot.
  • Prompt a pochi colpi: Includere un piccolo numero di esempi (coppie input-output) direttamente all'interno del prompt per guidare il modello sul compito e sul formato desiderato.
  • Prompting della catena di pensiero (CoT): Incoraggiare il modello a "pensare passo dopo passo" chiedendogli di scomporre il suo processo di ragionamento prima di fornire la risposta finale, spesso migliora le prestazioni su compiti complessi.
  • Prompt di ruolo: Indicare al modello di adottare un personaggio o un ruolo specifico (ad esempio, "Agisci come uno sviluppatore esperto di Python ") per adattare lo stile e il contenuto delle sue risposte.
  • Specificare la struttura dell'output: Definire chiaramente il formato desiderato per l'output, come ad esempio richiedere un elenco numerato, una tabella o un codice formattato in un linguaggio specifico. Risorse come la OpenAI Prompt Engineering Guide offrono le migliori pratiche.

Applicazioni del mondo reale

Una progettazione tempestiva è fondamentale per il successo di molte applicazioni di intelligenza artificiale:

  1. Automazione del servizio clienti: Progettazione di messaggi per chatbot e assistenti virtuali per gestire le richieste dei clienti in modo accurato, mantenere una voce specifica del marchio e risolvere problemi complessi in modo appropriato. Le aziende utilizzano queste tecniche per migliorare l'esperienza dei clienti, come dimostrano piattaforme come Zendesk AI.
  2. Creazione di contenuti e riassunto: Creare suggerimenti per gli strumenti di intelligenza artificiale generativa (come quelli sviluppati da Cohere o da Anthropic) per generare copy di marketing, scrivere email, riassumere lunghi documenti(sintesi del testo) o persino generare snippet di codice utilizzando strumenti come GitHub Copilot.

Altre applicazioni includono l'alimentazione di motori di ricerca semantici, l'utilizzo di strumenti didattici interattivi e la possibilità di effettuare analisi sofisticate dei dati attraverso interfacce in linguaggio naturale.

Ingegneria di base vs. concetti correlati

È utile distinguere l'ingegneria tempestiva dai termini correlati:

  • Arricchimento del prompt: Si concentra sull'arricchimento automatico del prompt iniziale dell'utente con un contesto aggiuntivo (ad esempio, da una base di conoscenza che utilizza RAG) prima che raggiunga il LLM. L'ingegnerizzazione del prompt è la creazione manuale delle istruzioni principali.
  • Sintonizzazione dei prompt: Una tecnica di messa a punto efficiente dei parametri (PEFT) in cui gli embeddings apprendibili (suggerimenti morbidi) vengono aggiunti all'input del modello e ottimizzati, piuttosto che creare suggerimenti testuali.
  • Fine-Tuning: Si tratta di aggiornare i pesi effettivi del modello addestrandolo ulteriormente su un set di dati specifico, adattando il modello stesso piuttosto che il semplice input richiesto.

Pur essendo distinte, queste tecniche possono essere complementari. Ad esempio, un prompt di base ben congegnato potrebbe essere arricchito automaticamente con i dati recuperati prima di essere elaborato da un modello perfezionato. Framework come LangChain spesso integrano questi diversi approcci.

Rilevanza nella visione artificiale

Tradizionalmente meno importante nella Computer Vision (CV) rispetto all'NLP, l'ingegneria del prompt sta diventando sempre più rilevante con l'ascesa dei modelli multimodali e dei sistemi di visione con prompt. Modelli come CLIP, YOLO o YOLOE possono eseguire compiti come il rilevamento di oggetti o la segmentazione di immagini sulla base di descrizioni testuali. La creazione di suggerimenti testuali efficaci (ad esempio, "rileva tutte le 'auto rosse' ma ignora i 'camion'") è una forma di ingegneria dei suggerimenti fondamentale per guidare questi modelli di linguaggio di visione. Piattaforme come Ultralytics HUB facilitano l'interazione con diversi modelli, tra cui Ultralytics YOLO modelli come YOLOv8 e YOLO11dove la definizione dei compiti attraverso le interfacce può trarre vantaggio dai principi di ingegneria immediata, soprattutto quando i modelli acquisiscono maggiori capacità interattive.

Leggi tutto