曲线下面积(AUC)是一个广受认可的性能指标,用于评估机器学习(ML)中分类模型的有效性。它量化了模型区分不同类别的整体能力,提供了一个单一的标量值,代表了模型在所有可能的分类阈值下的性能。AUC 在处理不平衡数据集时特别有用,因为在不平衡数据集中,一个类别的数量明显多于其他类别。它通常与接收者工作特征曲线(ROC)结合使用,后者是模型性能的图形表示。
受试者工作特征曲线 (ROC)是理解 AUC 的基本概念。ROC 曲线绘制了在不同阈值设置下的真阳性率 (TPR) 与假阳性率 (FPR) 的对比图。TPR 也称为灵敏度或召回率,用于衡量正确识别的实际阳性比例。FPR 衡量的是实际阴性样本中被错误归类为阳性样本的比例。完美分类器的 TPR 值为 1,FPR 值为 0,这意味着它能正确识别所有阳性和阴性。
AUC 值从 0 到 1 不等,其中
一般来说,AUC 超过 0.8 通常被视为良好,而 AUC 超过 0.9 则被视为优秀。不过,对 "良好 "AUC 的解释可能因具体应用和问题的复杂程度而异。
AUC 实际上就是 ROC 曲线下的面积。ROC 曲线直观地描述了模型在不同分类阈值下的真阳性率和假阳性率之间的权衡。AUC 较高的模型,其 ROC 曲线会更接近曲线图的左上角,表示在所有阈值下都有较好的性能。探索YOLO 性能指标,深入了解类似的评估指标。
作为一种性能指标,AUC 具有多种优势:
AUC 可用于各种实际应用,包括
虽然 AUC 是一个有价值的指标,但重要的是要将它与其他性能指标一起考虑。例如,精确度和召回率能让人深入了解模型在特定类别上的表现,而F1 分数则能平衡精确度和召回率。与常用于对象检测的 平均精度(mAP)不同,AUC 主要用于二元分类问题。
AUC 是评估分类模型性能的一个强大指标,尤其是在数据集不平衡的情况下。其阈值不变性、对类不平衡的鲁棒性以及概率解释使其成为评估和比较模型的重要工具。通过了解 ROC 曲线和 AUC 值的含义,从业人员可以更深入地了解其模型的性能,并就模型选择和优化做出明智的决策。您可以学习如何将Ultralytics YOLO 模型导出为各种格式,如 ONNX等多种格式,以便在不同平台上进行优化推理。