Glossario

IA generativa

Scopri come l'IA generativa crea contenuti originali come testi, immagini e audio, trasformando i settori con applicazioni innovative.

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

L'Intelligenza Artificiale Generativa (IA) è un sottoinsieme dell'intelligenza artificiale (IA) incentrato sulla creazione di sistemi in grado di generare contenuti nuovi, come testi, immagini, audio, codici o dati sintetici. A differenza dei modelli di intelligenza artificiale discriminativa che imparano a classificare o a prevedere in base ai dati di input (ad esempio, identificando gli oggetti in un'immagine), i modelli generativi imparano i modelli e le distribuzioni sottostanti all'interno di un set di dati per produrre nuovi output originali che assomigliano ai dati di addestramento. I recenti progressi, in particolare con modelli come i Generative Pre-trained Transformers (GPT) e i modelli di diffusione, hanno permesso di creare contenuti altamente realistici e complessi.

Come funziona l'intelligenza artificiale generativa

I modelli di intelligenza artificiale generativa funzionano in genere imparando una rappresentazione della distribuzione di probabilità dei dati di formazione. Possono poi campionare da questa distribuzione appresa per generare nuovi punti dati. Le architetture più comuni includono:

  • Reti avversarie generative (GAN): Si tratta di due reti neurali, un generatore e un discriminatore, che competono tra loro per migliorare la qualità degli output generati.
  • Trasformatori: Ampiamente utilizzati nei modelli linguistici di grandi dimensioni (LLM) come il GPT-4, questi modelli utilizzano meccanismi di attenzione per generare sequenze coerenti e contestualmente rilevanti, principalmente testo.
  • Autoencoder variazionali (VAE): Apprendono rappresentazioni compresse dei dati e possono generare nuovi dati decodificando punti campionati dallo spazio latente.
  • Modelli di diffusione: Questi modelli funzionano aggiungendo gradualmente del rumore ai dati e imparando poi a invertire il processo, consentendo una generazione ad alta fedeltà, soprattutto per le immagini (ad esempio, la Diffusione Stabile).

IA generativa vs. Computer Vision

Pur essendo entrambe branche dell'IA, l'IA generativa e la Computer Vision (CV) hanno scopi fondamentalmente diversi.

  • Focus sull'intelligenza artificiale generativa: Creare nuovi contenuti (ad esempio, generare immagini da descrizioni di testo, scrivere articoli, comporre musica).
  • Focus sulla visione artificiale: Analizzare e comprendere i dati visivi esistenti (ad esempio, rilevamento di oggetti, classificazione di immagini, segmentazione di istanze utilizzando modelli come Ultralytics YOLO).

Come discusso nel corso di YOLO Vision 2024, i modelli di IA generativa sono spesso molto più grandi (miliardi di parametri) rispetto ai modelli CV efficienti progettati per l'analisi in tempo reale (come ad esempio Ultralytics YOLOv8con modelli che partono da pochi milioni di parametri). L'intelligenza artificiale generativa richiede notevoli risorse computazionali per l'addestramento e l'inferenza, mentre molti modelli CV sono ottimizzati per l'implementazione su hardware standard o dispositivi edge.

Tuttavia, questi campi si stanno intersecando sempre di più. L'IA generativa può aiutare il CV creando dati sintetici per l'addestramento dei modelli di rilevamento o di segmentazione, soprattutto per gli scenari rari, migliorando potenzialmente la robustezza e le prestazioni del modello.

Esempi e applicazioni del mondo reale

L'IA generativa ha numerose applicazioni in vari settori:

  1. Creazione di contenuti: Generazione di articoli, copie di marketing, script(generazione di testo), creazione di immagini o arte originali(text-to-image), composizione di musica o generazione di video(text-to-video). Strumenti come ChatGPT per il testo e Midjourney per le immagini sono esempi popolari.
  2. Aumento dei dati: Creare campioni di dati artificiali per ampliare set di dati limitati. Ad esempio, la generazione di immagini sintetiche di condizioni mediche rare per migliorare l'accuratezza dei sistemi di intelligenza artificiale diagnostica utilizzati nell'analisi delle immagini mediche. Questo aiuta a superare la scarsità di dati e migliora la generalizzazione dei modelli.
  3. Scoperta e sviluppo di farmaci: Simulare le strutture molecolari e prevederne le proprietà per accelerare la ricerca di nuovi farmaci, come esplorato da aziende come DeepMind.
  4. Personalizzazione: Alimentare chatbot e assistenti virtuali sofisticati, creare materiali didattici personalizzati o generare raccomandazioni di prodotti su misura.

Considerazioni etiche

La potenza dell'IA generativa comporta anche importanti sfide etiche. Tra queste, il potenziale di generare disinformazione o contenuti dannosi, la creazione di deepfakes convincenti, le questioni legate al copyright e alla proprietà intellettuale dei contenuti generati e i pregiudizi intrinseci appresi dai dati di formazione. Per risolvere questi problemi è necessaria un'attenta considerazione dell'etica dell'IA, della trasparenza e di solidi quadri normativi. Sviluppare e utilizzare queste tecnologie in modo responsabile è fondamentale. Per gestire e addestrare i tuoi modelli di IA, prendi in considerazione piattaforme come Ultralytics HUB.

Leggi tutto