术语表

型号重量

了解模型权重在机器学习中的重要性、它们在预测中的作用,以及Ultralytics YOLO 如何简化它们在人工智能任务中的使用。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

模型权重是机器学习(ML)模型在训练过程中学习的核心参数。这些数值代表了从训练数据中获得的知识,是模型如何对未见过的新数据进行预测或决策的基础。从本质上讲,权重决定了模型内连接的强度和重要性,例如神经网络(NN)中神经元之间的连接。权重是可调节的 "旋钮",可以捕捉模型学习到的模式。

了解模型权重

想象一下,一台复杂的机器上有许多可调节的旋钮;模型权重就像这些旋钮。在模型训练过程中,模型会看到数据集中的示例,并做出初步预测。这些预测与实际正确答案(地面实况)之间的差异由损失函数来衡量。然后,随机梯度下降 算法 (SGD)亚当 算法等优化算法会使用反向传播等技术系统地调整这些权重,以最小化损失。这一过程会重复多次迭代或历时,逐步完善权重。

最初,权重通常设置为较小的随机值,但通过训练,权重会趋近于捕捉数据中潜在模式的值。将权重与超参数(如学习率批量大小)区分开来至关重要。超参数是在训练开始设置的配置,用于指导学习过程本身,而权重则是训练过程中学习的参数。偏置是另一种学习参数,通常与权重一起出现在神经网络中,代表神经元的基线激活水平,与其输入无关。权重可以调节输入的影响,而偏置则会改变激活函数的输出。

模型权重的意义

模型权重至关重要,因为它们直接编码了从训练数据中学到的模式和关系。优化良好的权重能使模型实现良好的泛化,对以前未遇到过的数据进行准确预测。权重的质量会直接影响模型的性能指标,如准确度精确度召回率和鲁棒性,通常用mAP 等指标来概括。数据不足、训练时间不足或过度拟合(模型对训练数据的学习效果太好,包括噪音)等问题通常会导致权重训练不佳,从而导致对新数据的预测不可靠。

在许多现代人工智能应用中,尤其是在计算机视觉(CV)领域,模型通常是在大型通用数据集(如ImageNetCOCO)上预先训练的。由此产生的权重可以捕捉到适用于许多任务的广泛视觉特征。这些预先训练好的权重,如Ultralytics YOLO 模型的权重,可以直接用于推理,也可以作为在特定任务或自定义数据集上进行微调的起点。这种被称为迁移学习的技术大大加快了训练速度,通常能带来更好的性能,尤其是在自定义数据有限的情况下。Ultralytics HUB等平台允许用户管理数据集、训练模型,并高效处理由此产生的模型权重。

实际应用

模型权重是无数人工智能应用背后的引擎:

管理和跟踪重量

随着模型变得越来越复杂,管理其权重和产生权重的实验对可重复性和协作至关重要。Weights & Biases (Weights & Biases ,W&B)等工具专门为MLOps 提供了一个平台,允许团队跟踪超参数、指标、代码版本以及每次实验产生的模型权重。值得注意的是,Weights & Biases与偏差 "平台有别于作为神经网络参数的 "权重 "和 "偏差 "概念;该平台有助于管理寻找最佳weights and biases过程。您可以在文档中了解更多关于将Ultralytics 与 W&B 整合的信息。从超参数调整到使用以下框架部署模型,高效管理都是关键所在 PyTorchTensorFlow.

阅读全部