了解基础模型如何通过可扩展的架构、广泛的预训练和对各种应用的适应性,彻底改变人工智能。
基础模型代表了人工智能(AI)领域的重大范式转变,其特点是规模庞大,可在大量不同的数据集上进行训练。与为特定任务设计的传统机器学习(ML)模型不同,基础模型是在广泛的数据上预先训练的,使其能够在任务特定数据相对较少的情况下,为广泛的下游应用进行调整或微调。这种方法通常利用迁移学习,加快了人工智能的发展,使强大的能力更容易获得。这一术语由斯坦福以人为本人工智能研究所(HAI)推广。
基础模型有三个主要特征:规模、通用性和适应性。
基础模型的多功能性推动了众多领域的创新。
主要区别在于范围和可重用性。传统的 ML 模型通常使用定制的数据集,针对单一的特定任务进行训练。如果出现新任务,往往需要从头开始构建和训练新模型。基础模型则提供了一个可重复使用的基础。它们广泛的预训练可以捕捉到一般知识,然后可以有效地对其进行专门化。
这种模式的优势在于减少了为每项新任务收集和注释大量数据的需要,并有可能加快模型的部署。然而,挑战包括预训练所需的巨大计算成本和能源、继承和放大训练数据中存在的偏差的风险,以及有关其潜在滥用和社会影响的重大伦理考虑。Ultralytics HUB等平台旨在简化访问、训练和部署高级人工智能模型的流程,帮助用户有效利用这些强大的技术。