术语表

接收者工作特征曲线 (ROC)

了解 ROC 曲线和 AUC 如何评估 AI/ML 中分类器的性能,优化欺诈检测和医疗诊断等任务的 TPR 与 FPR。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

接收者工作特征曲线(ROC)是一种图形图像,用于说明二元分类器系统的诊断能力随其判别阈值的变化而变化。它有助于直观地显示机器学习模型区分两个类别(如正类与负类、垃圾邮件与非垃圾邮件)的能力。该曲线是通过绘制不同阈值设置下的真阳性率 (TPR) 与假阳性率 (FPR) 的对比图而形成的。了解 ROC 曲线对于评估和比较分类模型的性能至关重要,尤其是在医学图像分析和模式识别等领域。

了解 TPR 和 FPR

要解释 ROC 曲线,必须了解其坐标轴:

  • 真阳性率 (TPR):也称为灵敏度或召回率,TPR 衡量模型正确识别的实际阳性实例的比例。计算公式为真阳性/(真阳性+假阴性)。TPR 越高,表明模型越善于识别正例。
  • 假阳性率 (FPR):它衡量的是被错误识别为阳性的实际阴性实例的比例。计算公式为假阳性/(假阳性 + 真阴性)。FPR 越低,说明模型做出的错误正向预测越少。您可以通过维基百科灵敏度和特异性页面等资源进一步了解这些概念。

ROC 曲线显示了 TPR 和 FPR 之间的权衡。随着分类阈值的变化,模型可能会识别出更多的真阳性结果(增加 TPR),但可能会以识别出更多的假阳性结果(增加 FPR)为代价。

解读 ROC 曲线和 AUC

ROC 曲线的形状可帮助我们深入了解模型的性能:

  • 理想曲线:左上角的曲线代表完美的分类器,可实现高 TPR 和低 FPR。
  • 对角线:从(0,0)到(1,1)的对角线代表分类器没有分辨能力,基本上是随机猜测。
  • 低于对角线:曲线低于对角线表示性能比随机猜测差。

从 ROC 曲线得出的一个常用指标是曲线下面积(AUC)。AUC 提供了一个单一的标量值,概括了分类器在所有可能阈值下的性能。AUC 为 1.0 表示分类器完美,而 AUC 为 0.5 则表示模型性能随机。Scikit-learn等工具提供了计算 AUC 的函数

实际应用

ROC 曲线被广泛应用于各个领域:

  1. 医疗诊断:在开发人工智能系统以完成扫描中的肿瘤检测等任务时,ROC 曲线有助于评估模型在不同置信度阈值下区分恶性(阳性)和良性(阴性)病例的能力。这样,临床医生就可以选择一个阈值,在检测实际肿瘤(TPR)和尽量减少误报(FPR)之间取得平衡。
  2. 欺诈检测:金融机构使用模型检测欺诈交易。ROC 曲线可以评估模型识别欺诈(正)与合法交易(负)的能力。通过分析该曲线,银行可以选择一个操作点,使欺诈检测最大化,同时保持可接受的错误标记合法交易率。了解有关人工智能在金融领域应用的更多信息。

ROC 曲线与准确率、精确率和召回率的对比

虽然准确率精确度和召回率等指标能提供有价值的信息,但 ROC 曲线和 AUC 能提供更全面的信息,尤其是在不平衡数据集中,一个类别的数量明显多于另一个类别。在这种情况下,准确率可能会产生误导,因为只需预测多数类别就能获得高分。ROC 曲线以 TPR/FPR 权衡为重点,对模型区分类别的能力提供了与阈值无关的评估。有关评估Ultralytics YOLO 等模型的详细见解,请参阅我们的YOLO 性能指标指南。通常可以使用与Ultralytics HUB等平台或TensorBoard 等库集成的工具来实现这些指标的可视化。

阅读全部