深圳Yolo 视觉
深圳
立即加入
词汇表

基础模型

探索人工智能中基础模型的强大功能。学习如何利用Ultralytics ,Ultralytics 等大型模型适配于定制任务。

基础模型标志着人工智能(AI)领域的重要范式转变。它是一种基于海量数据训练的大型机器学习模型——通常包含数十亿参数——能够适应广泛的下游任务。 与传统机器学习(ML)模型不同——后者通常为特定单一目标构建(如识别特定花卉种类)——基础模型在资源密集型预训练阶段学习广泛的模式、结构与关联。这种广博的知识库使开发者能通过迁移学习将模型应用于新问题,大幅缩减达成顶尖水平所需的时间与数据投入。

核心机制:预训练与适应

基础模型的强大之处在于其两阶段开发流程:预训练与微调。在预训练阶段,模型会接触海量数据集,例如互联网的大部分内容、多样化的图像库或庞大的代码库。 该阶段通常采用自监督学习技术, 即模型从数据结构本身生成标签, 从而消除了人工数据标注的瓶颈。 例如语言模型可学习预测句子中的下一个单词, 而视觉模型则能理解边缘、纹理及物体恒常性。

预训练完成后,模型便成为多功能的起点。通过称为微调的过程,开发者可在更小规模的特定领域数据集上调整模型权重。这一能力是人工智能普及的核心所在,它使计算资源有限的组织也能利用强大的架构。 现代工作流常借助Ultralytics 等工具优化该适配流程,无需从零构建神经网络,即可高效完成定制化数据集的训练。

实际应用

基础模型是各行业创新发展的核心支柱。其泛化能力使其能够应用于从自然语言处理到高级计算机视觉等广泛领域。

  • 医疗领域的计算机视觉:专业视觉基础模型可通过微调辅助医学影像分析。最初在通用图像上训练的模型,可被改造为detect MRI扫描中的detect 或识别X光片中的带状骨折。该应用展示了通用视觉理解如何转化为挽救生命的诊断工具。
  • 工业自动化:在制造业中Ultralytics 视觉模型作为物体检测的基础架构发挥作用。工厂利用这些模型实现质量检测自动化,以高速高精度在装配线上识别缺陷。该模型对物体边界的预存认知加速了这些智能制造解决方案的部署。

技术实现示例

开发者可借助基础模型以极少代码完成复杂任务。以下示例演示了如何加载预训练的YOLO26模型——一款针对实时应用优化的视觉基础模型——并对图像执行目标检测。

from ultralytics import YOLO

# Load a pre-trained YOLO26 foundation model
# 'n' stands for nano, the smallest and fastest version
model = YOLO("yolo26n.pt")

# Perform inference on an image to detect objects
# The model uses its pre-trained knowledge to identify common objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

区分关键术语

在人工智能领域中,区分"基础模型"与相关概念有助于理解它们的具体作用:

  • 大型语言模型(LLM) 大型语言模型是一种专门设计用于处理和生成文本的基础模型。虽然所有大型语言模型都是基础模型,但并非所有基础模型都是大型语言模型;该类别还包括视觉模型(SAM Segment Anything Model))和多模态系统。
  • 迁移学习这是将基础模型应用于新任务的技术。基础模型是该成果(即保存的神经网络),而迁移学习则是为特定应用场景(如农业害虫防治)更新该成果知识的过程。
  • 生成式人工智能指能够创造新内容(文本、图像、代码)的系统。许多基础模型为生成式人工智能应用提供支持,但它们也可用于分类或目标追踪等鉴别性任务,这些任务严格来说并非"生成式"。

未来方向与影响

基础模型的演进正朝着多模态人工智能方向发展,单一系统可同时处理并关联来自文本、图像、音频及传感器数据的信息。斯坦福大学人本人工智能研究所(HAI)等机构的研究表明,这类系统有望以更接近人类的方式对世界进行推理。随着模型效率的提升,在边缘计算设备上的部署日益可行,将强大的人工智能能力直接带入智能手机、无人机和物联网传感器。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入