术语表

深度伪造

了解从娱乐到错误信息等深度伪造的技术、应用和道德问题。了解检测和人工智能解决方案。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

Deepfakes 指的是利用人工智能(AI),特别是深度学习技术制作的合成媒体--图像、视频或音频。该术语是 "深度学习 "和 "伪造 "的谐音。这些技术可以篡改或生成高度逼真的视觉和音频内容,从而有可能描绘出一些人说的话或做的事,而这些人实际上从未说过或做过。虽然这种技术通常与恶意使用有关,但也有合法的应用。

深度伪造是如何产生的

最常见的深度伪造方法涉及生成对抗网络(GAN)或自动编码器等深度学习模型。在 GAN 设置中,两个神经网络相互竞争:生成器生成虚假图像/视频,而鉴别器则试图将虚假数据与真实训练数据区分开来。这种对抗过程会促使生成器生成越来越有说服力的假图像。自动编码器的工作原理是学习人脸或声音的压缩表示,然后解码以重建或交换特征。这两种方法通常都需要大量的目标个人数据(图像或音频片段),才能有效地学习他们的肖像和举止。其质量和逼真度通常取决于这些数据的数量和种类以及用于训练的计算能力。

应用与实例

Deepfake 技术的应用范围很广,既有有益的用途,也有有害的用途:

  • 娱乐和媒体:用于将电影配音成不同语言,同时同步唇部动作、为演员去老化或制作特效。Synthesia等公司也使用类似的人工智能来制作虚拟主持人的培训视频。
  • 教育和无障碍环境:创造逼真的历史重现,或为有交流障碍的人开发工具。
  • 错误信息和宣传:捏造政客等公众人物的视频,以传播虚假信息或影响公众舆论。例如,网上出现了一些经过篡改的视频,显示政治家发表了煽动性言论(英国广播公司关于 Deepfakes 的新闻报道)。
  • 欺诈和冒充:制作虚假音频或视频进行金融诈骗,例如冒充首席执行官授权欺诈交易(《福布斯》关于语音克隆欺诈的文章)。这还包括身份盗窃和创建虚假档案。
  • 未经同意的色情制品:最早和最有害的应用之一是在未经个人同意的情况下,以数字方式将其脸部植入色情材料。

深度伪造与相关概念

虽然照片和视频编辑软件已经存在了几十年,但深度伪造是一次重大飞跃,因为它们依靠人工智能来学习生成新的、逼真的内容,而不仅仅是手动处理现有像素。它们属于生成式人工智能(Generative AI)的范畴,其重点是创建新颖的数据。这不同于计算机视觉(CV)中常见的物体检测图像分类等辨别式人工智能任务,后者的目标通常是使用以下模型对现有内容进行识别或分类 Ultralytics YOLO.

检测和伦理问题

检测深度伪造是一项持续的挑战,因为用于制造深度伪造的技术在不断改进。研究人员和机构正在积极开发识别合成媒体的技术,通常是寻找生成过程中留下的细微不一致或人工痕迹(DARPA 的媒体取证计划)。深度伪造的兴起引发了与同意、数据隐私、错误信息以及对数字媒体信任的潜在侵蚀有关的重大人工智能伦理问题(布鲁金斯学会分析)。解决生成和检测模型中潜在的数据集偏差也至关重要。Ultralytics HUB等平台为各种人工智能模型的训练和管理提供了便利,突出了整个人工智能领域负责任的开发实践的必要性。要进一步了解人工智能的发展,《麻省理工学院技术评论》(MIT Technology Review on AI)等资源提供了广泛的见解。

阅读全部