术语表

基础模型

了解基础模型如何通过可扩展的架构、广泛的预训练和对各种应用的适应性,彻底改变人工智能。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

基础模型代表着人工智能(AI)领域的重大转变。这些功能强大的模型在海量数据的基础上进行训练,旨在适应各种下游任务。传统的机器学习模型通常是为特定目的而构建的,而基础模型则与之不同,它是在广泛的数据集上预先训练好的,只需极少的特定任务训练数据就能对其进行微调或调整,以执行各种任务。这一功能大大减少了为每个新应用收集大量数据和从头开始训练的需要,使人工智能变得更加高效和易用。

基础模型的核心特征

基础模型的特点是规模大、通用性强、适应性强。

  • 规模:这些模型在异常庞大的数据集上进行训练,通常包括文本、图像和音频等不同类型的数据。这种大规模允许模型学习丰富的世界表征。
  • 通用性:基础模型的一个主要特点是其广泛的适用性。它们不是为单一任务而设计的,而是能够理解和生成各种类型的数据,因此是各种应用的通用工具。
  • 适应性:基础模型可以针对特定的下游任务进行有效的调整或微调。这通常是通过迁移学习等技术实现的,即利用预训练模型的知识,以更少的数据和计算量解决新的相关问题。这类似于Ultralytics YOLO 模型可以在定制数据集上针对特定物体检测任务进行微调。

基础模型通常利用深度学习架构,特别是以处理顺序数据和捕捉长距离依赖关系的能力而著称的变换器。这些模型可以学习数据中的复杂模式和关系,使其能够执行从自然语言处理(NLP)计算机视觉(CV)等各种任务。

地基模型的应用

基础模型的多功能性使其迅速被众多领域所采用。下面是几个例子:

  • 文本生成和聊天机器人GPT-4等大型语言模型(LLM)是 NLP 基础模型的典型代表。它们在海量文本数据集上进行训练,可以生成人类质量的文本、翻译语言并为复杂的聊天机器人提供动力。从内容创建和客户服务到高级文本生成工具,这些模型都是应用的基础。
  • 图像理解与生成:在计算机视觉领域,基础模型可用于各种任务,包括图像分类物体检测图像分割。Meta AI 公司的Segment Anything Model (SAM) 等模型可以执行可提示的图像分割,展示了基础模型在理解和处理视觉数据方面的强大功能。同样,扩散模型也是能够根据文本提示生成高质量图像的基础模型,为创意产业及其他领域开辟了新的可能性。

此外,基础模型还被用于机器人流程自动化(RPA)等领域,以实现复杂工作流程的自动化;用于医学图像分析,以提高诊断准确性;甚至用于科学研究,以完成药物发现和材料科学等任务。

基础模式与传统模式

基础模型与传统机器学习模型的主要区别在于它们的范围和可重用性。传统模型通常是针对特定任务和数据集进行训练的,这限制了它们对其他问题的适用性。相比之下,基础模型的设计具有广泛的适用性和适应性。这种模式的转变具有以下几个优势:

  • 减少开发时间和成本:通过利用预先训练好的基础模型,开发人员可以大大减少构建人工智能应用所需的时间和资源。微调基础模型通常比从头开始训练一个模型更快、更便宜。
  • 利用有限数据提高性能:即使在小数据集上进行微调,基础模型通常也能表现出很强的性能,这使它们在数据稀缺的情况下显得弥足珍贵。
  • 新兴能力:由于其规模和训练,基础模型可以表现出突发性能力,这意味着它们可以执行没有经过明确训练的任务,这让研究人员大吃一惊,并扩大了人工智能的应用范围。

不过,承认与基础模型相关的挑战也很重要。这些挑战包括:训练和部署的计算需求、从庞大数据集中了解到的潜在偏差,以及围绕其广泛能力和潜在滥用的伦理考虑。随着该领域的发展,目前的研究重点是应对这些挑战,进一步释放基础模型的潜力,使人工智能民主化,推动不同领域的创新。Ultralytics HUB 等平台旨在使这些先进的模型更容易获取,使用户能够在他们的项目和工作流程中利用人工智能的力量。

阅读全部