术语表

曲线下面积 (AUC)

了解曲线下面积 (AUC) 在 ML 模型评估中的重要性。了解其优势、ROC 曲线见解和实际应用。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

曲线下面积(AUC)是一个广受认可的性能指标,用于评估机器学习(ML)中分类模型的有效性。它量化了模型区分不同类别的整体能力,提供了一个单一的标量值,代表了模型在所有可能的分类阈值下的性能。AUC 在处理不平衡数据集时特别有用,因为在不平衡数据集中,一个类别的数量明显多于其他类别。它通常与接收者工作特征曲线(ROC)结合使用,后者是模型性能的图形表示。

了解 ROC 曲线

受试者工作特征曲线 (ROC)是理解 AUC 的基本概念。ROC 曲线绘制了在不同阈值设置下的真阳性率 (TPR) 与假阳性率 (FPR) 的对比图。TPR 也称为灵敏度或召回率,用于衡量正确识别的实际阳性比例。FPR 衡量的是实际阴性样本中被错误归类为阳性样本的比例。完美分类器的 TPR 值为 1,FPR 值为 0,这意味着它能正确识别所有阳性和阴性。

解释 AUC 值

AUC 值从 0 到 1 不等,其中

  • AUC = 1:表示完美分类器,能完美区分所有正负实例。
  • AUC = 0.5:表明分类器的表现并不比随机机会好,基本上是通过掷硬币来进行预测。
  • AUC < 0.5: Implies that the classifier is performing worse than random, potentially indicating an issue with the model or data.
  • AUC > 0.5:表示分类器的性能优于随机分类器,数值越高表示性能越好。

一般来说,AUC 超过 0.8 通常被视为良好,而 AUC 超过 0.9 则被视为优秀。不过,对 "良好 "AUC 的解释可能因具体应用和问题的复杂程度而异。

AUC 与 ROC 之间的关系

AUC 实际上就是 ROC 曲线下的面积。ROC 曲线直观地描述了模型在不同分类阈值下的真阳性率和假阳性率之间的权衡。AUC 较高的模型,其 ROC 曲线会更接近曲线图的左上角,表示在所有阈值下都有较好的性能。探索YOLO 性能指标,深入了解类似的评估指标。

使用 AUC 的优势

作为一种性能指标,AUC 具有多种优势:

  • 阈值不变性:AUC 衡量模型的整体性能,与所选分类阈值无关。这使得它在比较可能在不同阈值下运行的模型时非常有用。
  • 类失衡鲁棒性:准确率等其他指标相比,AUC 对类不平衡的敏感度较低。当某一类别明显多于其他类别时,它能提供更可靠的性能衡量标准。
  • 概率解释:AUC 可以解释为模型将随机选择的正向实例排序高于随机选择的负向实例的概率。

AUC 的实际应用

AUC 可用于各种实际应用,包括

  • 医学诊断:医学图像分析中,AUC 可用来评估从 X 光或核磁共振成像等医学图像中检测疾病的模型的性能。例如,可以使用 AUC 评估区分癌症和良性肿瘤的模型,以衡量其诊断准确性。了解有关医疗保健领域人工智能的更多信息。
  • 欺诈检测:在金融领域,AUC 用于评估识别欺诈交易的模型的有效性。AUC 高的模型可以有效区分合法活动和欺诈活动,帮助将财务损失降到最低。了解人工智能在金融领域的其他应用

AUC 与其他指标的比较

虽然 AUC 是一个有价值的指标,但重要的是要将它与其他性能指标一起考虑。例如,精确度召回率能让人深入了解模型在特定类别上的表现,而F1 分数则能平衡精确度和召回率。与常用于对象检测的 平均精度(mAP)不同,AUC 主要用于二元分类问题。

结论

AUC 是评估分类模型性能的一个强大指标,尤其是在数据集不平衡的情况下。其阈值不变性、对类不平衡的鲁棒性以及概率解释使其成为评估和比较模型的重要工具。通过了解 ROC 曲线和 AUC 值的含义,从业人员可以更深入地了解其模型的性能,并就模型选择和优化做出明智的决策。您可以学习如何将Ultralytics YOLO 模型导出为各种格式,如 ONNX等多种格式,以便在不同平台上进行优化推理。

阅读全部