术语表

不合适

通过专家提示、策略和实际案例,了解如何识别、预防和解决机器学习模型中的欠拟合问题。

欠拟合是机器学习(ML)中的一个常见问题,即模型过于简单,无法捕捉到训练数据中的潜在模式。这种简单性阻碍了模型学习输入特征与目标变量之间的关系,导致模型在训练数据和未见过的新数据上都表现不佳。欠拟合模型具有高偏差,这意味着它对数据做出了强烈的、往往是不正确的假设。这导致模型无法达到较高的准确度,也不能很好地泛化。

欠拟合与过拟合过度拟合

欠拟合和过拟合是人工智能领域的两个关键挑战,涉及模型从训练数据泛化到新数据的能力。它们代表了模型复杂性光谱上的两个极端。

  • 拟合不足:模型过于简单,偏差较大。它无法学习数据的底层结构,导致损失函数值偏高,在训练数据集验证数据集上的表现都很差。
  • 过度拟合:模型过于复杂,方差较大。它能很好地学习训练数据,包括噪声和随机波动。这导致模型在训练集上表现优异,但在未见数据上表现不佳,因为模型基本上记住了训练示例,而不是学习一般模式。

ML 的最终目标是在这两者之间取得平衡,即所谓的偏差-方差权衡概念,从而创建一个能有效泛化到新的真实世界场景的模型。分析学习曲线是诊断模型是欠拟合、过拟合还是拟合良好的常用方法

匹配不足的原因和解决方案

识别和解决拟合不足问题对于建立有效的模型至关重要。问题通常由几个常见原因造成,每个原因都有相应的解决方案。

  • 模型过于简单:对复杂的非线性问题使用线性模型是拟合不足的典型原因。
    • 解决方案:提高模型复杂度。这可能需要切换到更强大的模型架构,比如更深入的神经网络或更大的预训练模型,比如从更小的Ultralytics YOLO模型变体切换到更大的模型变体。您可以对各种YOLO 模型进行比较,以选择更合适的架构。
  • 功能不足或质量不佳:如果提供给模型的输入特征不包含足够的信息来进行准确预测,模型就会拟合不足。
  • 培训不足:模型的训练时间可能不够 纪元 来学习数据中的模式。
  • 过度正规化:技术,如 L1 和 L2 正则化 或高 辍学者 率是用来防止过度拟合的,但如果过于激进,就会对模型限制过多,导致拟合不足。
    • 解决方案:减少正则化的数量。这可能意味着降低正则化函数中的惩罚项,或者降低剔除率。遵循模型训练的最佳实践有助于找到正确的平衡点。

拟合不足的真实案例

  1. 简单图像分类器:试想一下,在复杂的图像分类任务如识别ImageNet 数据集中的数千种物体类别上训练一个只有一到两层的非常基本的卷积神经网络(CNN)。该模型的容量有限,无法学习区分如此多类别所需的复杂特征,导致训练和测试数据的准确率都很低。PyTorchTensorFlow等框架提供了构建更复杂架构的工具,以克服这一问题。
  2. 基本预测性维护:考虑使用简单的线性回归模型进行预测建模,仅根据机器的工作温度来估计机器何时会出现故障。如果机器故障实际上受到振动、使用年限和压力等因素复杂的非线性相互作用的影响,那么简单的线性模型将无法拟合。它无法捕捉系统的真实复杂性,导致预测性能低下,无法准确预测故障。更复杂的模型,如梯度提升机或神经网络,将更为合适。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、合作和成长

立即加入
链接复制到剪贴板