探索人工智能中基础模型的强大功能。学习如何利用Ultralytics ,Ultralytics 等大型模型适配于定制任务。
基础模型标志着人工智能(AI)领域的重要范式转变。它是一种基于海量数据训练的大型机器学习模型——通常包含数十亿参数——能够适应广泛的下游任务。 与传统机器学习(ML)模型不同——后者通常为特定单一目标构建(如识别特定花卉种类)——基础模型在资源密集型预训练阶段学习广泛的模式、结构与关联。这种广博的知识库使开发者能通过迁移学习将模型应用于新问题,大幅缩减达成顶尖水平所需的时间与数据投入。
基础模型的强大之处在于其两阶段开发流程:预训练与微调。在预训练阶段,模型会接触海量数据集,例如互联网的大部分内容、多样化的图像库或庞大的代码库。 该阶段通常采用自监督学习技术, 即模型从数据结构本身生成标签, 从而消除了人工数据标注的瓶颈。 例如语言模型可学习预测句子中的下一个单词, 而视觉模型则能理解边缘、纹理及物体恒常性。
预训练完成后,模型便成为多功能的起点。通过称为微调的过程,开发者可在更小规模的特定领域数据集上调整模型权重。这一能力是人工智能普及的核心所在,它使计算资源有限的组织也能利用强大的架构。 现代工作流常借助Ultralytics 等工具优化该适配流程,无需从零构建神经网络,即可高效完成定制化数据集的训练。
基础模型是各行业创新发展的核心支柱。其泛化能力使其能够应用于从自然语言处理到高级计算机视觉等广泛领域。
开发者可借助基础模型以极少代码完成复杂任务。以下示例演示了如何加载预训练的YOLO26模型——一款针对实时应用优化的视觉基础模型——并对图像执行目标检测。
from ultralytics import YOLO
# Load a pre-trained YOLO26 foundation model
# 'n' stands for nano, the smallest and fastest version
model = YOLO("yolo26n.pt")
# Perform inference on an image to detect objects
# The model uses its pre-trained knowledge to identify common objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results
results[0].show()
在人工智能领域中,区分"基础模型"与相关概念有助于理解它们的具体作用:
基础模型的演进正朝着多模态人工智能方向发展,单一系统可同时处理并关联来自文本、图像、音频及传感器数据的信息。斯坦福大学人本人工智能研究所(HAI)等机构的研究表明,这类系统有望以更接近人类的方式对世界进行推理。随着模型效率的提升,在边缘计算设备上的部署日益可行,将强大的人工智能能力直接带入智能手机、无人机和物联网传感器。