了解生成式人工智能如何创建文本、图像和音频等原创内容,并通过创新应用改变各行各业。
生成式人工智能(AI)是人工智能(AI)的一个子集,侧重于创建能够生成新内容(如文本、图像、音频、代码或合成数据)的系统。与根据输入数据(如识别图像中的物体)学习分类或预测的判别式人工智能模型不同,生成式模型学习数据集中的基本模式和分布,以生成与训练数据类似的新的原始输出。最近的进步,尤其是生成预训练变换器(GPT)和扩散模型等模型的进步,使得创建高度逼真和复杂的内容成为可能。
生成式人工智能模型通常通过学习训练数据概率分布的表示来工作。然后,它们可以从学习到的分布中采样,生成新的数据点。常见的架构包括
虽然都是人工智能的分支,但生成式人工智能和计算机视觉(CV)的用途却有着本质的不同。
正如在YOLO Vision 2024 "会议上所讨论的,与专为实时分析而设计的高效 CV 模型(如 Ultralytics YOLOv8等,其模型仅有几百万个参数)相比,生成式人工智能模型通常要大得多(数十亿个参数)。生成式人工智能需要大量计算资源进行训练和推理,而许多 CV 模型经过优化,可在标准硬件或边缘设备上部署。
不过,这些领域的交叉越来越多。生成式人工智能可以通过创建用于训练检测或分割模型的合成数据来协助 CV,尤其是在罕见情况下,从而有可能提高模型的稳健性和性能。
生成式人工智能在各个领域都有大量应用:
生成式人工智能的强大功能也带来了重大的伦理挑战。其中包括生成错误信息或有害内容的可能性、创建令人信服的深度伪造内容、与生成内容的版权和知识产权相关的问题,以及从训练数据中学到的固有偏见。要解决这些问题,需要认真考虑人工智能伦理、透明度和健全的监管框架。负责任地开发和部署这些技术至关重要。要管理和训练您自己的人工智能模型,可以考虑Ultralytics HUB 等平台。