了解基础模型如何通过可扩展的架构、广泛的预训练和对各种应用的适应性,彻底改变人工智能。
基础模型是一种大规模的人工智能(AI)模型,在大量广泛的无标记数据上进行预训练,旨在针对各种下游任务进行调整或微调。这些模型通常以Transformer 等架构为基础,从数据中学习一般模式、结构和表征,为各种专业应用提供通用基础,而无需从头开始进行特定任务的训练。基础模型的开发代表了机器学习(ML)领域的一个重大范式转变,即转向构建可高效专业化的通用模型。
基础模型由几个核心属性定义:
基础模型的创建和使用通常分为两个阶段:
基础模型跨越多个领域:
预训练基础模型的计算成本很高,通常需要大规模的 GPU 或 TPU 集群和大量的工程设计工作,通常由大型研究实验室或公司承担,如 Google、Meta AI 和OpenAI 等大型研究实验室或公司承担。不过,这些模型一旦经过预训练,就可以更高效地进行调整。Ultralytics HUB等平台提供了训练自定义模型、管理数据集Ultralytics Datasets)和部署解决方案(模型部署选项)的工具,通常利用体现基础知识的预训练权重。有效的适应性仍然需要仔细调整超参数,并可能需要增加数据。
基础模型正在改变人工智能的格局Roboflow 关于基础模型)。它们加快了发展速度,实现了新的应用,并提出了有关人工智能伦理、偏见和计算访问的重要问题。斯坦福大学基础模型研究中心(CRFM)等研究机构致力于研究它们的能力和社会影响。未来可能会有更强大、更高效、更多模式的基础模型来推动科学、工业和日常生活中的创新(人工智能用例)。