Glosario

Deepfakes

Descubre la tecnología, las aplicaciones y los problemas éticos de los deepfakes, desde el entretenimiento a la desinformación. Aprende soluciones de detección e IA.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

Los Deepfakes son vídeos, imágenes o grabaciones de audio altamente realistas, generados sintéticamente o manipulados, creados mediante técnicas avanzadas de Inteligencia Artificial (IA) y Aprendizaje Automático (AM ), en particular Aprendizaje Profundo (AD). El término es un portmanteau de "deep learning" (aprendizaje profundo) y "fake" (falso). Estas técnicas permiten sustituir o sintetizar de forma convincente rostros, voces y acciones, haciendo que parezca que alguien dijo o hizo algo que en realidad nunca hizo. Aunque tiene su origen en las comunidades online, la tecnología deepfake ha evolucionado rápidamente, presentando tanto oportunidades creativas como importantes desafíos éticos.

Cómo se crean los Deepfakes

La tecnología central de muchos deepfakes son las Redes Generativas Adversariales (GAN). Una GAN consta de dos redes neuronales que compiten entre sí: un generador que crea el contenido falso (por ejemplo, una imagen con una cara intercambiada) y un discriminador que intenta distinguir entre el contenido real y el falso. Mediante un entrenamiento iterativo, el generador se vuelve cada vez más experto en producir falsificaciones realistas que pueden engañar al discriminador y, en última instancia, a los observadores humanos. Otra técnica habitual son los autocodificadores, que aprenden representaciones comprimidas (codificaciones) de rostros a partir de grandes conjuntos de datos y luego decodifican estas representaciones para reconstruir o intercambiar rostros en los vídeos objetivo. La creación de falsificaciones profundas convincentes suele requerir datos de entrenamiento sustanciales (imágenes o clips de vídeo de los individuos objetivo) y una cantidad significativa de datos de la GPU a menudo gestionados a través de plataformas como Ultralytics HUB.

Aplicaciones y ejemplos

La tecnología Deepfake tiene diversas aplicaciones, desde usos beneficiosos hasta actividades maliciosas:

  • Entretenimiento y medios de comunicación: Se utiliza en el cine para envejecer a los actores, recrear personajes históricos o mejorar el doblaje alterando los movimientos de los labios para que coincidan con el audio traducido. Por ejemplo, los cineastas utilizaron técnicas de deepfake en El Mandaloriano para recrear digitalmente una versión más joven de un actor. Otro ejemplo es Synthesia, una plataforma que utiliza avatares de IA para crear vídeos de entrenamiento y presentaciones, generando eficazmente contenido de vídeo sintético.
  • Educación y accesibilidad: Crear instructores virtuales o dar vida a personajes históricos con fines educativos. La clonación de la voz puede ayudar a las personas que han perdido la voz.
  • Generación deDatos Sintéticos: Creación de conjuntos de datos artificiales para entrenar otros modelos de ML, sobre todo en visión por ordenador, donde los datos reales pueden ser escasos o delicados. Esto puede ayudar a mejorar la robustez de modelos como Ultralytics YOLO11 para tareas como el reconocimiento facial.
  • Desinformación y malicia: Difundir desinformación política, crear falsos apoyos o escándalos de famosos, generar pornografía no consentida y perpetrar fraudes mediante la suplantación de identidad (por ejemplo, falsificaciones de voz para autorizar transacciones). Esto plantea serias preocupaciones sobre la ética de la IA y la privacidad de los datos.

Detección de Deepfake

El auge de los deepfakes ha estimulado la investigación de métodos de detección. Estos suelen implicar el entrenamiento de modelos ML para identificar sutiles incoherencias o artefactos característicos del contenido generado, como patrones de parpadeo inusuales, expresiones faciales poco naturales o incoherencias en la iluminación o las sombras. Las técnicas de Visión por Computador (VC ) son fundamentales en este esfuerzo. Sin embargo, la detección es una carrera armamentística en curso, ya que las técnicas de generación de deepfakes mejoran continuamente para eludir la detección. Organizaciones como el Deepfake Detection Challenge (DFDC) de Meta AI e iniciativas de empresas como Microsoft tienen como objetivo avanzar en el estado de la tecnología de detección. Los puntos de referencia y conjuntos de datos estándar son cruciales para desarrollar y evaluar estos modelos de detección.

Distinción de otras manipulaciones mediáticas

Los deepfakes se diferencian de la edición tradicional de fotos o vídeos (como el uso de Adobe Photoshop o After Effects) principalmente en su uso del aprendizaje profundo para generar elementos visuales o de audio totalmente nuevos y realistas basados en patrones aprendidos, en lugar de limitarse a alterar los píxeles existentes manualmente o mediante algoritmos más sencillos. Mientras que el reconocimiento de imágenes se centra en identificar objetos o características dentro de una imagen, la tecnología deepfake se centra en sintetizar imágenes o vídeos verosímiles. Representa una aplicación sofisticada de la IA generativa en el ámbito visual. El potencial de uso indebido subraya la importancia del desarrollo responsable de la IA y de la concienciación pública.

Leer todo