了解 GAN 如何通过生成逼真图像、增强数据以及推动医疗保健、游戏等领域的创新,彻底改变人工智能。
生成对抗网络(GAN)是一类功能强大的机器学习(ML)框架,由Ian Goodfellow 及其同事于 2014 年首次提出。它们属于生成式人工智能领域,侧重于创建与给定训练数据集相似的新数据。GANs 背后的核心理念涉及两个神经网络(NN)--生成器和判别器--之间的竞争博弈。这种对抗过程促使系统产生高度逼真的合成输出,如图像、音乐或文本。
GAN 架构由两个同时进行训练的主要组件组成:
GAN 的训练是一个动态的过程,在这个过程中,生成器和判别器相互竞争,共同进步:
如此循环往复,最终达到理想的平衡状态,即生成器生成的数据非常逼真,鉴别器只能随机猜测(准确率为 50%)样本的真假。此时,"生成器 "已学会近似训练集的基本数据分布。
GAN 在各个领域都取得了重大进展:
必须将 GAN 与其他类型的模型区分开来:
由于以下问题,训练 GANs 的难度可想而知:
为了应对这些挑战,研究人员开发了许多 GAN 变体,例如提高稳定性的 Wasserstein GAN(WGAN)和允许根据特定属性生成数据(例如生成特定数字的图像)的条件 GAN(cGAN)。框架,如 PyTorch和 TensorFlow等框架提供了各种工具和库,为GANs 的实施和训练提供了便利。