Scopri la tecnologia, le applicazioni e i problemi etici dei deepfakes, dall'intrattenimento alla disinformazione. Scopri le soluzioni di rilevamento e di intelligenza artificiale.
I deepfakes sono video, immagini o registrazioni audio altamente realistici, generati o manipolati sinteticamente e creati utilizzando tecniche avanzate di intelligenza artificiale (AI) e di apprendimento automatico (ML), in particolare il deep learning (DL). Il termine è un portmanteau di "deep learning" e "fake". Queste tecniche consentono di sostituire o sintetizzare in modo convincente volti, voci e azioni, facendo sembrare che qualcuno abbia detto o fatto qualcosa che in realtà non ha mai fatto. Pur avendo origine dalle comunità online, la tecnologia deepfake si è rapidamente evoluta, presentando sia opportunità creative che sfide etiche significative.
La tecnologia alla base di molti deepfakes coinvolge le reti generative avversarie (GAN). Una GAN è composta da due reti neurali in competizione tra loro: un generatore che crea il contenuto falso (ad esempio, un'immagine con un volto scambiato) e un discriminatore che cerca di distinguere tra contenuto reale e falso. Attraverso un addestramento iterativo, il generatore diventa sempre più abile nel produrre falsi realistici in grado di ingannare il discriminatore e, infine, gli osservatori umani. Gli autoencoder sono un'altra tecnica comune, in quanto apprendono rappresentazioni compresse (codifiche) dei volti da grandi insiemi di dati e poi decodificano queste rappresentazioni per ricostruire o scambiare i volti con i video di destinazione. La creazione di deepfake convincenti richiede spesso dati di addestramento consistenti (immagini o video clip degli individui target) e una significativa GPU di calcolo, spesso gestite da piattaforme come Ultralytics HUB.
La tecnologia Deepfake ha una serie di applicazioni che spaziano dagli usi benefici alle attività dannose:
L'aumento dei deepfakes ha stimolato la ricerca di metodi di rilevamento. Spesso si tratta di addestrare modelli di ML per identificare sottili incongruenze o artefatti caratteristici dei contenuti generati, come ad esempio modelli di battito di ciglia insoliti, espressioni facciali innaturali o incongruenze nell'illuminazione o nelle ombre. Le tecniche di computer vision (CV) sono fondamentali per questo sforzo. Tuttavia, il rilevamento è una corsa agli armamenti in corso, poiché le tecniche di generazione dei deepfake migliorano continuamente per eludere il rilevamento. Organizzazioni come la Deepfake Detection Challenge (DFDC) di Meta AI e iniziative di aziende come Microsoft mirano a far progredire lo stato della tecnologia di rilevamento. I benchmark e i dataset standard sono fondamentali per sviluppare e valutare questi modelli di rilevamento.
I deepfake si differenziano dall'editing tradizionale di foto o video (come l'utilizzo di Adobe Photoshop o After Effects) soprattutto per l'utilizzo del deep learning per generare elementi visivi o audio completamente nuovi e realistici basati su schemi appresi, piuttosto che alterare semplicemente i pixel esistenti manualmente o attraverso algoritmi più semplici. Mentre il riconoscimento delle immagini si concentra sull'identificazione di oggetti o caratteristiche all'interno di un'immagine, la tecnologia deepfake si concentra sulla sintesi di immagini o video plausibili. Rappresenta una sofisticata applicazione dell'intelligenza artificiale generativa nel campo visivo. Il potenziale di abuso sottolinea l'importanza di uno sviluppo responsabile dell'IA e della sensibilizzazione del pubblico.