术语表

规范化

了解 L1、L2、剔除和早期停止等正则化技术如何防止过拟合,确保建立稳健的 ML 模型。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

正则化是机器学习(ML)和深度学习(DL)中的一项重要技术,用于防止过拟合,过拟合是指模型对训练数据(包括噪声和异常值)学习得太好。这会导致模型在新的未见数据上泛化效果不佳。正则化为模型的学习过程引入了额外的约束或惩罚,鼓励模型学习更简单的模式,从而更有可能实现良好的泛化。通过在损失函数中添加正则化项,模型就不会过于依赖任何单一特征,也不会给特征分配过大的权重。

正则化类型

正则化技术有多种类型,每种技术都有自己控制模型复杂性的方法。最常见的两种类型是 L1 正则化和 L2 正则化。

  • L1 正则化(Lasso 回归):这种技术会增加一个惩罚,惩罚值等于系数大小的绝对值。它可以产生稀疏模型,其中一些系数恰好为零,从而有效地进行特征选择。了解有关特征工程的更多信息。
  • L2 正则化(岭回归):这种技术会增加一个惩罚,惩罚值等于系数大小的平方。它倾向于将系数缩小为零,但不会使其精确为零。了解有关优化算法的更多信息。

其他正规化技术包括

  • 丢弃:这种技术会在每次训练迭代中随机丢弃(设置为零)一部分神经元,从而迫使网络学习不依赖于特定神经元存在的更强健的特征。
  • 早期停止:这包括监控模型在验证数据集上的表现,并在表现开始下降时停止训练过程,这表明模型开始过拟合。
  • 数据增强:这种技术通过对现有数据进行随机转换,人为地增加训练数据集的大小,例如对图像数据进行旋转、翻转或裁剪。了解有关数据增强的更多信息。

正则化的重要性

正则化在构建稳健、可泛化的 ML 模型中起着至关重要的作用。没有正则化,模型更容易出现过拟合,尤其是在处理高维数据或深度神经网络等复杂模型架构时。通过控制模型的复杂性,正则化有助于提高模型对未见过的新数据进行准确预测的能力。这对实际应用至关重要,因为在实际应用中,模型的部署环境可能与训练环境不同。

正则化的应用

正则化被广泛应用于多种 ML 应用中,包括

现实世界中的人工智能/移动语言应用实例

  1. 医疗诊断:在医疗保健领域,人工智能模型用于分析 X 射线或核磁共振成像等医学图像,以进行异常检测和诊断。正则化技术(如 dropout 和 L2 正则化)被应用于 CNN,以确保模型不会过度拟合训练数据,并能准确识别新患者扫描中的潜在健康问题。如需进一步了解,请参阅人工智能如何改变放射学
  2. 自动驾驶汽车:自动驾驶汽车在很大程度上依赖计算机视觉模型来进行物体检测、车道检测和场景理解。正则化方法(包括数据增强和早期停止)可用于训练强大的模型,使其能够很好地适应各种驾驶条件和环境。了解有关自动驾驶中的视觉人工智能的更多信息。

正规化及相关术语

正则化与 ML 中的其他概念密切相关,例如偏差-方差权衡过拟合欠拟合。虽然正则化有助于通过控制模型复杂度来防止过拟合,但在偏差和方差之间取得平衡也很重要。过于简单的模型可能对数据拟合不足,而过于复杂的模型则可能过度拟合。超参数调整通常用于找到特定模型和数据集的最佳正则化水平。

结论

正则化是人工智能从业者工具包中的一项基本技术。通过了解和应用各种正则化方法,从业人员可以建立更稳健、更通用的模型,并在新的、未见过的数据上表现出色。无论您处理的是图像数据、文本数据还是其他类型的数据,正则化都能帮助您提高 ML 模型的性能和可靠性。有关计算机视觉和最先进模型(如Ultralytics YOLO )的更多见解,请访问Ultralytics 博客

阅读全部