术语表

不合适

通过专家提示、策略和实际案例,了解如何识别、预防和解决机器学习模型中的欠拟合问题。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

机器学习(ML)领域,实现最佳模型性能需要在简单性和复杂性之间找到平衡。欠拟合是一个常见问题,即模型过于简单,无法捕捉到训练数据中存在的潜在模式。这意味着模型无法有效学习,导致不仅在训练数据上,而且在新的、未见过的数据上都表现不佳。拟合不足的模型缺乏必要的能力来准确表示数据中的关系。

什么原因导致不匹配?

有几个因素会导致模型拟合不足:

  • 模型复杂性不足:所选模型架构可能过于简单,无法胜任任务。例如,对复杂的非线性数据使用线性模型,或者神经网络的层数或神经元太少。了解模型的复杂性是关键。
  • 特征不足:提供给模型的输入特征可能没有包含足够的相关信息来进行准确预测。有效的特征工程是防止这种情况发生的关键。
  • 训练不足:模型可能没有经过足够的历时训练,这意味着它没有足够的机会学习训练数据中的模式。
  • 过度正则化:虽然正则化技术用于防止过度拟合,但过于激进地应用正则化技术会过度限制模型,阻碍其学习数据模式的能力,导致拟合不足。

识别欠拟合

欠拟合通常是通过评估模型在训练期间和训练之后的表现来诊断的:

  • 训练误差大:即使在训练数据上,模型的表现也很差。准确率精确度召回率等性能指标较低,而损失函数值却居高不下。
  • 验证误差大:模型在验证数据上的表现也很差,说明它还没有学会一般模式。
  • 学习曲线:绘制模型在训练集和验证集上的误差随时间变化的曲线(学习曲线),如果两条曲线都在较高的误差水平上趋于平稳,则可以发现拟合不足。对于物体检测等特定任务,请参考YOLO 性能指标指南。

解决欠拟合问题

有几种策略可以帮助克服拟合不足的问题:

拟合不足的真实案例

  • 用有限的特征预测房价:试想一下,如果只用卧室数量来预测房价。这种简单的模型(特征少)很可能不合适,因为它忽略了位置、面积和房龄等关键因素,无法捕捉到房地产市场的真正复杂性。
  • 复杂场景的基本图像分类器:训练一个只有一到两个卷积层的非常简单的卷积神经网络(CNN)来完成复杂的图像分类任务,例如识别不同环境中的各种鸟类。该模型可能无法学习区分不同物种的复杂特征,从而导致在熟悉图像和新图像上都表现不佳。

欠拟合与过拟合

欠拟合是过拟合的反义词。欠拟合模型过于简单,无法捕捉数据的潜在趋势,导致偏差较大。过拟合模型过于复杂;它对训练数据的学习效果太好,包括噪音和异常值,导致方差大,在新数据上表现不佳。机器学习的目标是在这两个极端之间取得平衡,实现良好的泛化。这种平衡通常用偏差-方差权衡来讨论。交叉验证(参见Ultralytics K-Fold 指南)和仔细的超参数调整(参见Ultralytics 调整指南)等技术对于找到最佳平衡点至关重要。Ultralytics HUB等平台可以帮助管理实验并跟踪模型性能,从而识别并减轻欠拟合和过拟合。

阅读全部