术语表

梯度下降

了解梯度下降如何优化人工智能模型,如Ultralytics YOLO ,从而在从医疗保健到自动驾驶汽车等任务中实现准确预测。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

梯度下降是机器学习中的一种基本优化算法,是训练许多人工智能模型(包括Ultralytics YOLO )的主要工具。它用于微调模型参数,使预测值与实际值之间的差异最小化--这种差异被称为损失函数。将其想象为在黑暗中沿着斜坡向下导航,梯度下降法通过向最陡的下坡方向迭代,帮助你找到通往坡底的最快路线。这种迭代改进对于模型从数据中学习并在广泛的应用中做出准确预测至关重要。

机器学习的相关性

在机器学习领域,梯度下降对于训练神经网络深度学习架构等复杂模型尤为重要。这些模型,包括最先进的 Ultralytics YOLO模型都依赖梯度下降技术从大量数据集中学习复杂的模式。如果没有这一优化过程,要在物体检测或复杂的医学图像分析等任务中实现高准确度将面临巨大挑战。基于梯度下降的技术是Ultralytics YOLO 等框架不可或缺的一部分,增强了它们在从医疗保健人工智能农业人工智能等各种应用中提供实时推理和精确结果的能力。

主要概念和变体

为了应对不同的计算和数据相关挑战,梯度下降算法已经发展出多种变体,从而提高了基本算法的效率和适用性。两个突出的例子包括

  • 随机梯度下降法(SGD):这种方法引入了随机性,根据随机选择的单个数据点或一小批数据(而不是整个数据集)计算出的梯度更新模型参数。这种随机性有助于摆脱局部极小值并加快计算速度,尤其是在处理大型数据集时。了解有关随机梯度下降法 (SGD) 的更多信息。
  • 亚当优化器Adam 是自适应矩估计(Adaptive Moment Estimation)的缩写,它建立在梯度下降(Gradient Descent)的基础上,为每个参数加入了自适应学习率。它通过对梯度的第一和第二矩的估计,计算出单个自适应学习率,从而提供高效的优化,在深度学习中尤其受到青睐。有关Adam 优化器的更多详情,请点击此处。

这些方法通常集成在Ultralytics HUB 等用户友好型平台中,简化了 Ultralytics YOLO 和其他模型用户的模型训练和优化过程。

与相关概念的区别

梯度下降是模型训练的核心,但必须将其与机器学习中的相关概念区分开来:

  • 超参数调整:梯度下降法优化模型参数,而超参数调整法则不同,它侧重于优化学习过程本身的设置,如学习率或网络架构。超参数是在训练前设置的,而不是通过梯度下降从数据中学习的。
  • 正则化正则化技术通过在梯度下降法旨在最小化的损失函数中添加惩罚项来防止过度拟合。正则化是对梯度下降法的补充,它能引导梯度下降法找到对未知数据具有更好泛化效果的解决方案。
  • 优化算法优化算法是一个更广泛的类别,包括梯度下降算法及其变种,如 Adam 和 SGD。这些算法旨在为模型找到最佳参数,但在方法和效率上会有很大不同。

实际应用

梯度下降法具有优化复杂模型的能力,因此在众多实际应用中不可或缺:

医学影像增强

医疗保健领域,梯度下降对于训练用于医学图像分析的人工智能模型至关重要。例如,在从核磁共振成像扫描中检测肿瘤时,使用梯度下降法训练的模型会学习如何最大限度地减少其预测与放射科专家注释之间的差异,从而提高诊断的准确性。Ultralytics YOLO 模型以其实时性而著称,它采用类似的优化原理来提高医学图像分割的精确度。

自主车辆导航

自动驾驶汽车严重依赖梯度下降算法来优化物体检测和路径规划等关键任务的算法。通过最大限度地减少定位和感知方面的误差,梯度下降确保自动驾驶系统能够做出安全、实时的决策。YOLO Vision等活动上的演示经常展示由优化模型驱动的自动导航技术的进步。

对于那些希望在实际人工智能项目中实施梯度下降技术的人来说,Ultralytics HUB 等平台提供了利用这种优化技术的强大功能训练自定义模型的便捷工具。

阅读全部