Découvre la technologie, les applications et les préoccupations éthiques des deepfakes, du divertissement à la désinformation. Apprends les solutions de détection et d'intelligence artificielle.
Les Deepfakes sont des vidéos, des images ou des enregistrements audio très réalistes, générés ou manipulés synthétiquement, créés à l'aide de techniques avancées d'intelligence artificielle (IA) et d'apprentissage automatique (ML), en particulier l'apprentissage profond (DL). Le terme est un portmanteau de "deep learning" et "fake". Ces techniques permettent de remplacer ou de synthétiser de manière convaincante des visages, des voix et des actions, en donnant l'impression que quelqu'un a dit ou fait quelque chose qu'il n'a jamais réellement fait. Bien qu'issue des communautés en ligne, la technologie deepfake a rapidement évolué, présentant à la fois des opportunités créatives et des défis éthiques importants.
La technologie Deepfake a toute une série d'applications, allant des utilisations bénéfiques aux activités malveillantes :
L'essor des deepfakes a stimulé la recherche sur les méthodes de détection. Celles-ci impliquent souvent l'entraînement de modèles ML pour identifier les incohérences subtiles ou les artefacts caractéristiques du contenu généré, tels que des schémas de clignotement inhabituels, des expressions faciales non naturelles ou des incohérences au niveau de l'éclairage ou des ombres. Les techniques de vision par ordinateur (VA) sont au cœur de cet effort. Cependant, la détection est une course aux armements permanente, car les techniques de génération de deepfake s'améliorent sans cesse pour échapper à la détection. Des organisations comme le Deepfake Detection Challenge (DFDC) de Meta AI et des initiatives d'entreprises comme Microsoft visent à faire progresser l'état de la technologie de détection. Les repères et les ensembles de données standard sont essentiels au développement et à l'évaluation de ces modèles de détection.
Les deepfakes se distinguent de l'édition traditionnelle de photos ou de vidéos (comme l'utilisation d'Adobe Photoshop ou d'After Effects) principalement par leur utilisation de l'apprentissage profond pour générer des éléments visuels ou audio entièrement nouveaux et réalistes basés sur des modèles appris, plutôt que de simplement modifier les pixels existants manuellement ou à l'aide d'algorithmes plus simples. Alors que la reconnaissance d'images se concentre sur l'identification d'objets ou de caractéristiques au sein d' une image, la technologie deepfake se concentre sur la synthèse d' images ou de vidéos plausibles. Elle représente une application sophistiquée de l'IA générative dans le domaine visuel. Le risque d'utilisation abusive souligne l'importance d'un développement responsable de l'IA et de la sensibilisation du public.
Comment les Deepfakes sont créés
La technologie de base derrière de nombreux deepfakes fait appel aux réseaux adverbiaux génératifs (GAN). Un GAN se compose de deux réseaux neuronaux concurrents : un générateur qui crée le faux contenu (par exemple, une image avec un visage échangé) et un discriminateur qui tente de faire la distinction entre le vrai et le faux contenu. Grâce à un entraînement itératif, le générateur devient de plus en plus habile à produire des faux réalistes qui peuvent tromper le discriminateur et, en fin de compte, les observateurs humains. Les autoencodeurs sont une autre technique courante, qui consiste à apprendre des représentations compressées (encodages) de visages à partir de vastes ensembles de données, puis à décoder ces représentations pour reconstruire ou permuter des visages sur des vidéos cibles. La création de deepfakes convaincants nécessite souvent des données d'entraînement substantielles (images ou clips vidéo des personnes ciblées) et une importante puissance de calcul du GPU souvent gérées par des plateformes comme Ultralytics HUB.