术语表

不合适

通过专家提示、策略和实际案例，了解如何识别、预防和解决机器学习模型中的欠拟合问题。

欠拟合是机器学习（ML）中的一个常见问题，即模型过于简单，无法捕捉到训练数据中的潜在模式。这种简单性阻碍了模型学习输入特征与目标变量之间的关系，导致模型在训练数据和未见过的新数据上都表现不佳。欠拟合模型具有高偏差，这意味着它对数据做出了强烈的、往往是不正确的假设。这导致模型无法达到较高的准确度，也不能很好地泛化。

欠拟合与过拟合过度拟合

欠拟合和过拟合是人工智能领域的两个关键挑战，涉及模型从训练数据泛化到新数据的能力。它们代表了模型复杂性光谱上的两个极端。

拟合不足：模型过于简单，偏差较大。它无法学习数据的底层结构，导致损失函数值偏高，在训练数据集和验证数据集上的表现都很差。
过度拟合：模型过于复杂，方差较大。它能很好地学习训练数据，包括噪声和随机波动。这导致模型在训练集上表现优异，但在未见数据上表现不佳，因为模型基本上记住了训练示例，而不是学习一般模式。

ML 的最终目标是在这两者之间取得平衡，即所谓的偏差-方差权衡概念，从而创建一个能有效泛化到新的真实世界场景的模型。分析学习曲线是诊断模型是欠拟合、过拟合还是拟合良好的常用方法。

匹配不足的原因和解决方案

识别和解决拟合不足问题对于建立有效的模型至关重要。问题通常由几个常见原因造成，每个原因都有相应的解决方案。

模型过于简单:对复杂的非线性问题使用线性模型是拟合不足的典型原因。
- 解决方案：提高模型复杂度。这可能需要切换到更强大的模型架构，比如更深入的神经网络或更大的预训练模型，比如从更小的Ultralytics YOLO模型变体切换到更大的模型变体。您可以对各种YOLO 模型进行比较，以选择更合适的架构。
功能不足或质量不佳:如果提供给模型的输入特征不包含足够的信息来进行准确预测，模型就会拟合不足。
- 解决方案：通过特征工程改进特征。这可能涉及创建新特征、使用多项式特征或应用不同的数据预处理技术，以更好地体现潜在模式。还可以应用特征选择技术。
培训不足:模型的训练时间可能不够纪元来学习数据中的模式。
- 解决方案：延长训练时间。监控验证指标非常重要，以确保延长训练时间不会导致过度拟合。Ultralytics HUB等工具可以帮助您跟踪和管理训练实验。
过度正规化:技术，如 L1 和 L2 正则化或高辍学者率是用来防止过度拟合的，但如果过于激进，就会对模型限制过多，导致拟合不足。
- 解决方案：减少正则化的数量。这可能意味着降低正则化函数中的惩罚项，或者降低剔除率。遵循模型训练的最佳实践有助于找到正确的平衡点。

拟合不足的真实案例

简单图像分类器：试想一下，在复杂的图像分类任务（如识别ImageNet 数据集中的数千种物体类别）上训练一个只有一到两层的非常基本的卷积神经网络（CNN）。该模型的容量有限，无法学习区分如此多类别所需的复杂特征，导致训练和测试数据的准确率都很低。PyTorch和TensorFlow等框架提供了构建更复杂架构的工具，以克服这一问题。
基本预测性维护：考虑使用简单的线性回归模型进行预测建模，仅根据机器的工作温度来估计机器何时会出现故障。如果机器故障实际上受到振动、使用年限和压力等因素复杂的非线性相互作用的影响，那么简单的线性模型将无法拟合。它无法捕捉系统的真实复杂性，导致预测性能低下，无法准确预测故障。更复杂的模型，如梯度提升机或神经网络，将更为合适。

不合适

灵活的企业许可解决方案为您的创新提供动力

使用 Ultralytics YOLO 在数秒内训练人工智能模型

使用 Ultralytics HUB 简单训练 YOLO 模型

欠拟合与过拟合过度拟合

匹配不足的原因和解决方案

拟合不足的真实案例

在此类别中阅读更多内容

了解快速成型制造：技术和使用案例

使用 Ultralytics YOLO 监测机场地面运行11

机器人技术在制造业中的发展与未来

加入 Ultralytics 社区