术语表

接收者工作特征曲线 (ROC)

了解 ROC 曲线和 AUC 如何评估 AI/ML 中分类器的性能,优化欺诈检测和医疗诊断等任务的 TPR 与 FPR。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

在机器学习,尤其是二元分类任务中,接收者工作特征曲线(ROC)是一种重要的图形工具,用于评估分类模型在不同阈值设置下的性能。它说明了二元分类器系统的诊断能力随其判别阈值的变化而变化。ROC 曲线是真阳性率 (TPR) 与假阳性率 (FPR) 的对比图,其中 TPR 在 y 轴上,FPR 在 x 轴上。这使它成为了解正确识别阳性病例的好处与错误地将阴性病例归类为阳性病例的代价之间权衡的宝贵资产。

了解 ROC 曲线

ROC 曲线基于两个关键指标:真阳性率 (TPR) 和假阳性率 (FPR)。

  • 真阳性率 (TPR),也称为灵敏度或召回,衡量正确识别的实际阳性比例。高 TPR 意味着模型善于检测正例。
  • 假阳性率 (FPR) 也称为特异性,衡量的是实际阴性中被错误归类为阳性的比例。FPR 越低越好,表明模型发出的误报越少。

通过绘制这些比率在不同阈值设置下的对比图,ROC 曲线直观地显示了分类器的性能范围。曲线越接近左上角,表示模型越好,意味着在不同阈值下的 TPR 越高,FPR 越低。理想的分类器会在左上角(1,1)有一个点,代表 100% 的 TPR 和 0% 的 FPR。

曲线下面积 (AUC)

从 ROC 曲线得出的一个关键汇总指标是曲线下面积(AUC)。AUC 提供了一个单一的标量值,代表分类器的整体性能,与所选的阈值无关。AUC 为 1 代表完美的分类器,而 AUC 为 0.5 则表示分类器的性能不比随机猜测好。一般来说,AUC 越高,模型区分正类和负类的能力就越强。您可以在我们的 "曲线下面积(AUC)"词汇表页面了解更多有关AUC 及其在机器学习中的意义。

人工智能和 ML 的应用

ROC 曲线和 AUC 被广泛应用于各种人工智能和 ML 应用中,尤其是在真阳性和假阳性之间的平衡至关重要的情况下。下面是几个例子:

  • 医学诊断:在医学图像分析中,ROC 曲线对于评估癌症等疾病的诊断测试至关重要。例如,在医学成像中使用Ultralytics YOLO 进行肿瘤检测时,ROC 分析可帮助确定将图像分类为包含肿瘤(阳性)或不包含肿瘤(阴性)的最佳阈值。一个性能良好的模型(以高 AUC 表示)可确保正确识别实际肿瘤病例(高 TPR),同时最大限度地减少可能导致不必要治疗的误报(低 FPR)。
  • 欺诈检测:在金融安全系统中,ROC 曲线用于评估欺诈检测模型的有效性。在这里,阳性案例代表欺诈交易,阴性案例代表合法交易。ROC 曲线有助于对模型进行微调,以捕捉尽可能多的欺诈交易(高 TPR),同时又不过分地将合法交易标记为欺诈(低 FPR),以免给客户带来不便。

ROC 曲线与准确率、精确率和召回率的对比

虽然准确率精确度召回率等指标也可用于评估分类器,但 ROC 曲线能更细致地反映分类器的性能,尤其是在处理不平衡数据集时。准确率在不平衡的情况下会产生误导,而 ROC 曲线和 AUC 则不同,它们侧重于 TPR 和 FPR 之间的权衡,能更全面地了解模型在不同操作点上的判别能力。要深入了解模型评估,请参考我们的YOLO 性能指标指南。

要进一步了解 ROC 曲线,scikit-learn 有关 ROC 曲线的文档维基百科有关 ROC 曲线的文章等资源可以提供更多技术和理论背景信息。

阅读全部