术语表

不合适

了解什么是欠拟合、欠拟合的原因、征兆和解决方案。了解如何提高模型性能并避免不完全拟合问题。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

当机器学习模型过于简单,无法捕捉数据的底层结构时,就会出现欠拟合。这种情况通常发生在模型的参数或特征相对于其试图学习的数据的复杂性来说太少的时候。因此,模型无法从训练数据中充分学习,不仅在训练集上表现不佳,在未见数据(如验证 测试集)上也表现不佳。

欠拟合的主要特征

欠拟合模型通常具有高偏差和低方差的特点。偏差是指用简化模型逼近现实世界问题(可能很复杂)时引入的误差。欠拟合模型对数据的假设过于简单,从而导致系统误差。另一方面,方差指的是模型对训练数据波动的敏感度。欠拟合模型表现出低方差,是因为它们过于简单,受训练数据变化的影响不大。然而,这种简单性也意味着它们无法捕捉数据中的重要模式和细微差别。

拟合不足的原因

有几个因素会导致拟合不足:

  • 模型复杂性:使用的模型过于简单,无法满足数据的复杂性。例如,试图用一个线性模型去拟合高度非线性关系的数据。
  • 训练不足:没有对模型进行足够的历时训练,或使用过高的学习率,导致模型在学习到基本模式之前过早收敛。
  • 糟糕的特征工程:未包含相关特征或使用的特征不能充分代表数据的基本结构。有效的特征工程对于建立具有良好通用性的模型至关重要。
  • 过度正则化:过度正则化:应用过多的正则化,会降低模型的复杂性,并妨碍模型学习重要的模式。

检测欠拟合

识别拟合不足对提高模型性能至关重要。不完全拟合的迹象包括

  • 训练误差大:模型在训练数据上的表现很差,表明它没有学会基本模式。
  • 验证/测试误差大:验证或测试集表现不佳,与训练误差类似,表明模型过于简单。
  • 学习曲线:将模型在训练集和验证集上的表现随时间变化绘制成曲线图,可以揭示模型拟合不足的情况。如果两条曲线都在高误差率时趋于平稳,则模型很可能拟合不足。

解决欠拟合问题

要解决拟合不足的问题,可以考虑以下策略:

  • 增加模型复杂性:使用参数或层数更多、更复杂的模型。例如,从线性模型转换为多项式模型,或从浅层神经网络转换为深层神经网络
  • 延长训练时间:增加训练历元数或调整学习率,让模型有更多时间从数据中学习。
  • 改进特征工程:添加更多相关特征或转换现有特征,以更好地体现数据结构。创建交互项或多项式特征等技术可以提供帮助。
  • 减少正则化:减少应用于模型的正则化量,使其更贴近训练数据。

欠拟合与过拟合

区分不完全拟合和过度拟合非常重要。当模型过于简单时就会出现拟合不足,而当模型过于复杂并开始记忆训练数据(包括噪声和异常值)时就会出现拟合过度。过拟合模型在训练数据上表现优异,但在未见数据上却表现不佳。要避免欠拟合和过拟合,平衡模型的复杂性和训练至关重要。

真实案例

示例 1:预测房价

试想一下,您正在建立一个根据房屋面积预测房价的模型。如果您使用简单的线性回归模型,并假设房价随面积线性增长,您可能会对数据拟合不足。实际上,房屋面积与价格之间的关系可能更为复杂,其中涉及到一些因素,如面积越大收益越小,或某些面积范围的房屋价格越高。线性模型无法捕捉到这些细微差别,导致对训练数据和新数据的预测性能都很差。

示例 2:图像分类

考虑一项图像分类任务,您需要将动物图像分为不同类别。如果您使用一个非常简单的模型,如逻辑回归,您可能会对数据拟合不足。图像分类通常需要捕捉图像中复杂的模式和特征,而简单的模型无法做到这一点。因此,模型在训练集和未见过的新图像上的表现都会很差。使用卷积神经网络(CNN)等更复杂的模型可以显著提高性能。

通过了解欠拟合的原因和迹象,从业人员可以采取适当的措施来增强他们的模型。Ultralytics YOLOv8 等工具为建立和调整复杂模型提供了先进的功能,有助于避免拟合不足,提高各种计算机视觉任务的性能。有关模型训练和优化的更多见解,请访问Ultralytics 博客

阅读全部