Impara l'arte dell'ingegneria dei tempi per guidare i modelli di intelligenza artificiale come gli LLM per ottenere risultati precisi e di alta qualità nei contenuti, nel servizio clienti e altro ancora.
L'ingegneria dei prompt è l'arte e la scienza di creare input efficaci (prompt) per guidare i modelli di intelligenza artificiale (AI), in particolare i Large Language Models (LLM), verso la generazione degli output desiderati. Si tratta di capire come questi modelli interpretano le istruzioni e di progettare iterativamente suggerimenti che siano chiari, specifici e che forniscano un contesto sufficiente a suscitare risposte accurate, pertinenti e utili. Poiché i modelli di intelligenza artificiale sono sempre più integrati in vari strumenti e flussi di lavoro, la padronanza dell'ingegneria dei prompt è fondamentale per massimizzare il loro potenziale e garantire prestazioni affidabili in compiti che vanno dalla semplice risposta alle domande alla complessa generazione di testi creativi.
L'ingegnerizzazione efficace dei prompt è spesso un processo iterativo. Si parte dall'analisi dei requisiti dell'attività e dalla comprensione delle capacità e dei limiti del modello di intelligenza artificiale di destinazione. L'ingegnere progetta quindi un prompt iniziale, lo testa, valuta l'output e lo perfeziona in base ai risultati. Questo perfezionamento potrebbe comportare l'aggiunta di istruzioni più specifiche, la fornitura di esempi(apprendimento con pochi colpi), la definizione del formato di output desiderato (ad esempio, JSON), l'impostazione di vincoli o la regolazione del tono. Le tecniche chiave spesso si basano sui principi dell'elaborazione del linguaggio naturale (NLP) e richiedono un'attenta considerazione del modo in cui la formulazione influisce sul comportamento del modello, influenzato dai dati di addestramento e dall'architettura, come il modello Transformer descritto nel famoso articolo "Attention Is All You Need".
Nell'ingegneria della tempestività vengono comunemente impiegate diverse strategie:
Una progettazione tempestiva è fondamentale per il successo di molte applicazioni di intelligenza artificiale:
Altre applicazioni includono l'alimentazione di motori di ricerca semantici, l'utilizzo di strumenti didattici interattivi e la possibilità di effettuare analisi sofisticate dei dati attraverso interfacce in linguaggio naturale.
È utile distinguere l'ingegneria tempestiva dai termini correlati:
Pur essendo distinte, queste tecniche possono essere complementari. Ad esempio, un prompt di base ben congegnato potrebbe essere arricchito automaticamente con i dati recuperati prima di essere elaborato da un modello perfezionato. Framework come LangChain spesso integrano questi diversi approcci.
Tradizionalmente meno importante nella Computer Vision (CV) rispetto all'NLP, l'ingegneria del prompt sta diventando sempre più rilevante con l'ascesa dei modelli multimodali e dei sistemi di visione con prompt. Modelli come CLIP, YOLO o YOLOE possono eseguire compiti come il rilevamento di oggetti o la segmentazione di immagini sulla base di descrizioni testuali. La creazione di suggerimenti testuali efficaci (ad esempio, "rileva tutte le 'auto rosse' ma ignora i 'camion'") è una forma di ingegneria dei suggerimenti fondamentale per guidare questi modelli di linguaggio di visione. Piattaforme come Ultralytics HUB facilitano l'interazione con diversi modelli, tra cui Ultralytics YOLO modelli come YOLOv8 e YOLO11dove la definizione dei compiti attraverso le interfacce può trarre vantaggio dai principi di ingegneria immediata, soprattutto quando i modelli acquisiscono maggiori capacità interattive.