术语表

过度拟合

学习如何利用数据增强、正则化和交叉验证等技术检测和防止机器学习中的过度拟合。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

过拟合是机器学习中的一个常见问题,即模型对训练数据的学习效果太好,包括噪声和异常值。这导致模型在训练数据上表现优异,但在验证或测试集等未见数据上表现不佳。从根本上说,模型无法泛化,只能捕捉到训练数据的具体细节,而不是基本模式。

检测和防止过度拟合

识别过度拟合需要监测模型在训练数据和单独验证数据上的性能。如果这两个数据集的性能差异很大,则表明可能存在过度拟合。有几种技术可以帮助防止过度拟合:

  • 数据扩充:通过数据扩充来增加训练数据集的规模和多样性,有助于模型学习更强大的特征。
  • 交叉验证:使用K 折交叉验证等技术有助于评估模型对新数据的泛化程度。
  • 正则化:正则方法(如 L1 和 L2 正则化)会在损失函数中加入惩罚项,以避免模型过于复杂。
  • 及早停止:监控模型在验证集上的性能,并在性能开始下降时停止训练,可以防止过度拟合。
  • 简化模型:选择不太复杂、参数较少的模型可以降低过度拟合的风险,尤其是在数据集较小的情况下。

相关性和影响

在各种机器学习(ML)应用中,过拟合是一个令人担忧的关键问题,它会影响模型在真实世界场景中的可靠性和准确性。例如,在计算机视觉(CV)中,过拟合模型可能在识别训练图像中的特定对象时表现良好,但却无法泛化到新的、未见过的图像中。

真实案例

医疗诊断

在医疗保健领域,一个过度拟合的模型可能会根据训练数据集准确诊断疾病,但当遇到新的患者数据时就会失效。例如,一个利用有限的核磁共振扫描数据集训练出的检测脑肿瘤的模型可能会学习这些扫描数据的特定特征,而不是肿瘤的一般特征。当模型遇到来自不同患者或成像设备的扫描时,这可能会导致误诊。更多关于人工智能在医疗保健领域的应用

自动驾驶汽车

自动驾驶汽车而言,一个过度拟合的物体检测模型可能在模拟或受控环境中表现完美,但在现实世界的各种驾驶条件下却难以发挥作用。例如,一个仅在晴朗天气下对行人图像进行训练的模型可能无法检测到雨雪天气下的行人。有关物体检测的更多信息,请访问Ultralytics 网站。

杰出术语

不合适

欠拟合与过拟合正好相反。当模型过于简单,无法捕捉数据中的基本模式,导致在训练集和验证集上都表现不佳时,就会出现欠拟合。这通常是由于模型不够复杂或训练不足造成的。

偏差-方差权衡

偏差-方差权衡是机器学习中的一个基本概念,与过拟合和欠拟合有关。高偏差会导致拟合不足,而高方差则会导致过度拟合。平衡这两者对于建立一个具有良好泛化能力的模型至关重要。

工具和技术

有几种工具和技术可以帮助减轻过度拟合。 Ultralytics YOLO例如,美国国家科学院(NASDAQ:NASDAQ.COM)的超拟合模型采用了各种防止过拟合的技术,如先进的数据增强和正则化方法。此外,Ultralytics HUB 等平台还提供了用于监控模型性能和调整超参数以实现最佳结果的工具。

框架,如 TensorFlowPyTorch等框架为实施正则化技术、交叉验证和其他对抗过拟合的方法提供了广泛支持。这些工具提供了构建稳健可靠的机器学习模型所需的灵活性。

阅读全部