术语表

损失函数

了解损失函数在机器学习中的作用、类型、重要性以及真实世界中的人工智能应用，如YOLO 和物体检测。

在人工智能（AI）和机器学习（ML）中，损失函数是模型训练过程中使用的一个重要组成部分。它测量模型的预测值与训练数据的实际真实值之间的差异或 "损失"。可以把它想象成一个分数，量化模型在特定任务中的表现有多差。损失值越高，说明预测结果偏离越远；损失值越低，说明预测结果越接近实际值。训练大多数机器学习模型，尤其是深度学习（DL）模型的基本目标，就是使这个损失函数最小化，从而使模型尽可能准确可靠。

损失函数的重要性

损失函数至关重要，因为它们为模型训练过程提供了一个具体、可量化的目标。它们将 "从数据中学习 "这一抽象目标转化为一个数学值，优化算法可以将其最小化。这种优化过程通常使用梯度下降和反向传播等技术，依靠损失值反复调整模型的内部参数（模型权重），以减少预测误差。选择合适的损失函数至关重要，这在很大程度上取决于具体的 ML 任务，如回归、分类或物体检测。即使有足够的数据和计算资源，使用错误的损失函数也会导致模型性能不理想。损失函数是复杂神经网络（NN）学习过程的指南。

损失函数的类型

不同的机器学习任务需要不同的损失函数，以适应问题的性质和所需的输出。一些常见的例子包括

平均平方误差 (MSE)：常用于以预测连续数值为目标的回归任务。它计算预测值和实际值之间平方差的平均值，对较大的误差进行重罚。
平均绝对误差 (MAE)：另一种回归损失函数，计算预测值与实际值之间绝对差值的平均值。与 MSE 相比，它对异常值的敏感度较低。
交叉熵损失（对数损失）： 分类任务的标准损失函数。二元交叉熵用于两类问题，而分类交叉熵用于多类问题。
铰链损失：主要用于训练支持向量机 (SVM)，目的是最大化类别间的差值。
物体检测损失等模型 Ultralytics YOLO等模型使用的是复合损失函数，通常由多个部分组成。例如 YOLOv8使用的损失函数包含边框回归项（边框定位对象的准确程度）、分类项（对象所属类别），有时还包括对象性（对象是否存在于网格单元中）。具体实现方法可参见Ultralytics 损失工具文档。

实际应用

损失函数是众多人工智能应用中训练模型的基础：

医学图像分析：在训练肿瘤检测或器官分割模型时，需要最小化损失函数，如骰子损失或交叉熵的变体。这将促使模型预测与放射科医生提供的地面实况注释密切匹配的分割掩膜，从而直接影响人工智能在医疗保健领域的诊断准确性。
自动驾驶汽车： 自动驾驶汽车的感知系统使用通过最小化损失函数训练的物体检测模型。这些函数对预测道路上物体的位置（边界框）和类别（行人、汽车、骑车人）的错误进行惩罚，这对安全导航和避免碰撞至关重要。这里通常采用YOLO 模型。

与其他重要概念的关系

损失函数与其他几个核心 ML 概念密切相关：

优化算法：损失函数定义了优化算法的 "景观"。亚当优化算法和随机梯度下降（SGD）等算法利用损失函数的梯度，在学习率的指导下更新模型权重。
评估指标：将损失函数与准确度、精确度、召回率、F1 分数和平均精确度 (mAP) 等评价指标区分开来至关重要。损失函数在训练过程中用于指导优化过程。它们必须是可微分的，这样基于梯度的方法才能发挥作用。评估指标用于训练后（或验证期间）评估模型在未见数据（验证数据或测试数据）上的实际性能。虽然较低的损失通常与较好的指标得分相关，但它们衡量的是不同的东西，并不总是可以直接互换。例如，优化交叉熵损失并不能直接优化准确性，尽管它通常能提高准确性。您可以在这里了解有关YOLO 性能指标的更多信息。
过拟合和欠拟合：监控训练集和单独验证集的损失是诊断这些问题的关键。当训练损失不断减少，而验证损失开始增加时，就会出现过拟合。两个集上的损失值都很高，则表示欠拟合。解决这些问题的策略将在《模型训练技巧》和《模型评估洞察》等指南中讨论。

结论

损失函数是训练有效机器学习模型的基石。它们为优化算法调整模型参数提供了必要的信号，使模型能够从数据中学习复杂的模式，并解决计算机视觉（CV）及其他领域的挑战性任务。了解它们的用途、不同的可用类型以及它们与评估指标之间的关系，对于开发成功的人工智能应用至关重要。Ultralytics HUB等平台简化了复杂模型的训练过程，例如 Ultralytics YOLO11等平台简化了复杂模型（如 Ultralytics YOLO11）的训练过程，在幕后处理复杂的损失函数实现和优化，使高级人工智能更易于使用。您可以通过Ultralytics 文档做进一步了解。

损失函数

使用Ultralytics HUB 对YOLO 模型进行简单培训

灵活的企业许可解决方案为您的创新提供动力

利用Ultralytics YOLO

使用Ultralytics HUB 对YOLO 模型进行简单培训

损失函数的重要性

损失函数的类型

实际应用

与其他重要概念的关系

结论

阅读更多博客

加入Ultralytics 社区