Deepfake 是人工智能生成的媒体,利用复杂的机器学习技术令人信服地模仿真实的图像、视频或音频。deepfake "一词结合了 "深度学习 "和 "伪造",突出了深度学习模型,特别是生成对抗网络(GAN)在创建这些合成现实中的关键作用。深度伪造展示了人工智能的创造潜力,但同时也引发了道德问题,尤其是在错误信息和侵犯隐私的情况下。
深度伪造通常依赖于生成对抗网络(GANs),这是一类深度学习模型,其中有两个神经网络,一个生成内容(生成器),另一个评估内容(鉴别器),通过竞争产生逼真的输出。随着时间的推移,生成器会提高其创建可信媒体的能力。这种对抗过程使 GAN 能够合成逼真的面部动画、声音模仿,甚至整个视频序列。
例如,在视频深度伪造中,算法在包含人物图片或视频的大量数据集上进行训练。模型学会映射面部特征、表情和动作,从而在新的情境中对其外观进行逼真的处理。
深度伪造在各行各业都有多方面的应用,既有有益的用例,也有可能有害的用例:
虽然深度伪造有其合法用途,但也会带来风险,例如
Deepfakes 经常与神经风格转移或稳定扩散等其他技术相混淆。神经风格转移侧重于将艺术风格融入现有图像,稳定扩散则根据文本提示生成图像,而深度伪造则专注于创建超逼真的真实实体模拟。
随着人工智能的发展,深度伪造将变得更加复杂,影响到计算机视觉和内容创作等领域。Ultralytics HUB 等平台已经在彻底改变人工智能在各行各业的应用,同时确保可访问性和道德考量。
为了降低风险,研究人员正在研究强大的检测方法,并倡导建立法律框架,以规范负责任地使用深度伪造技术。