Glossario

Deepfakes

Scopri la tecnologia, le applicazioni e i problemi etici dei deepfakes, dall'intrattenimento alla disinformazione. Scopri le soluzioni di rilevamento e di intelligenza artificiale.

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

I deepfakes sono video, immagini o registrazioni audio altamente realistici, generati o manipolati sinteticamente e creati utilizzando tecniche avanzate di intelligenza artificiale (AI) e di apprendimento automatico (ML), in particolare il deep learning (DL). Il termine è un portmanteau di "deep learning" e "fake". Queste tecniche consentono di sostituire o sintetizzare in modo convincente volti, voci e azioni, facendo sembrare che qualcuno abbia detto o fatto qualcosa che in realtà non ha mai fatto. Pur avendo origine dalle comunità online, la tecnologia deepfake si è rapidamente evoluta, presentando sia opportunità creative che sfide etiche significative.

Come vengono creati i deepfake

La tecnologia alla base di molti deepfakes coinvolge le reti generative avversarie (GAN). Una GAN è composta da due reti neurali in competizione tra loro: un generatore che crea il contenuto falso (ad esempio, un'immagine con un volto scambiato) e un discriminatore che cerca di distinguere tra contenuto reale e falso. Attraverso un addestramento iterativo, il generatore diventa sempre più abile nel produrre falsi realistici in grado di ingannare il discriminatore e, infine, gli osservatori umani. Gli autoencoder sono un'altra tecnica comune, in quanto apprendono rappresentazioni compresse (codifiche) dei volti da grandi insiemi di dati e poi decodificano queste rappresentazioni per ricostruire o scambiare i volti con i video di destinazione. La creazione di deepfake convincenti richiede spesso dati di addestramento consistenti (immagini o video clip degli individui target) e una significativa GPU di calcolo, spesso gestite da piattaforme come Ultralytics HUB.

Applicazioni ed esempi

La tecnologia Deepfake ha una serie di applicazioni che spaziano dagli usi benefici alle attività dannose:

  • Intrattenimento e media: Utilizzata nel cinema per de-invecchiare gli attori, ricreare personaggi storici o migliorare il doppiaggio alterando i movimenti delle labbra per adattarli all'audio tradotto. Ad esempio, i registi hanno utilizzato le tecniche di deepfake in The Mandalorian per ricreare digitalmente una versione più giovane di un attore. Un altro esempio è Synthesia, una piattaforma che utilizza avatar AI per creare video di formazione e presentazioni, generando di fatto contenuti video sintetici.
  • Educazione e accessibilità: Creare istruttori virtuali o dare vita a personaggi storici per scopi educativi. La clonazione vocale può aiutare le persone che hanno perso la voce.
  • Generazione didati sintetici: Creazione di set di dati artificiali per l'addestramento di altri modelli di ML, in particolare nella computer vision, dove i dati reali potrebbero essere scarsi o sensibili. Questo può aiutare a migliorare la robustezza di modelli come Ultralytics YOLO11 per compiti come il riconoscimento facciale.
  • Disinformazione e malizia: Diffusione di disinformazione politica, creazione di falsi appoggi o scandali di celebrità, generazione di pornografia non consensuale e frode attraverso l'impersonificazione (ad esempio, deepfakes vocali per autorizzare transazioni). Tutto ciò solleva serie preoccupazioni in merito all'etica dell'IA e alla privacy dei dati.

Rilevamento di deepfake

L'aumento dei deepfakes ha stimolato la ricerca di metodi di rilevamento. Spesso si tratta di addestrare modelli di ML per identificare sottili incongruenze o artefatti caratteristici dei contenuti generati, come ad esempio modelli di battito di ciglia insoliti, espressioni facciali innaturali o incongruenze nell'illuminazione o nelle ombre. Le tecniche di computer vision (CV) sono fondamentali per questo sforzo. Tuttavia, il rilevamento è una corsa agli armamenti in corso, poiché le tecniche di generazione dei deepfake migliorano continuamente per eludere il rilevamento. Organizzazioni come la Deepfake Detection Challenge (DFDC) di Meta AI e iniziative di aziende come Microsoft mirano a far progredire lo stato della tecnologia di rilevamento. I benchmark e i dataset standard sono fondamentali per sviluppare e valutare questi modelli di rilevamento.

Distinzione da altre manipolazioni mediatiche

I deepfake si differenziano dall'editing tradizionale di foto o video (come l'utilizzo di Adobe Photoshop o After Effects) soprattutto per l'utilizzo del deep learning per generare elementi visivi o audio completamente nuovi e realistici basati su schemi appresi, piuttosto che alterare semplicemente i pixel esistenti manualmente o attraverso algoritmi più semplici. Mentre il riconoscimento delle immagini si concentra sull'identificazione di oggetti o caratteristiche all'interno di un'immagine, la tecnologia deepfake si concentra sulla sintesi di immagini o video plausibili. Rappresenta una sofisticata applicazione dell'intelligenza artificiale generativa nel campo visivo. Il potenziale di abuso sottolinea l'importanza di uno sviluppo responsabile dell'IA e della sensibilizzazione del pubblico.

Leggi tutto