了解什么是机器学习中的 Recall,为什么它很重要,以及它如何确保人工智能模型有效捕捉关键的积极实例。
召回率是机器学习(ML)和统计分类中的一个重要性能指标,用于衡量模型识别数据集中所有相关实例的能力。具体来说,它量化了被模型正确预测为阳性的实际阳性案例的比例。Recall 也称为灵敏度或真阳性率 (TPR),在未能检测到阳性实例(假阴性)会带来严重后果的情况下,Recall 尤为重要。它有助于回答以下问题"在所有实际的阳性实例中,模型正确识别了多少?对模型进行评估需要了解各种指标,而 Recall 则提供了一个关于完整性的重要视角。
Recall 的计算方法是用真阳性(TP)的数量除以真阴性和假阴性(FN)的总和。真阳性是指被正确识别为阳性的实例,而假阴性是指被模型错误地分类为阴性的阳性实例。高召回分数表明模型能有效地找到数据中的大部分正向实例。这一指标是评估模型性能的基础,尤其是在物体检测和图像分类等任务中。在模型评估过程中,Ultralytics HUB等工具和平台通常会同时显示 Recall 和其他指标。
要了解召回率,往往需要将其与其他常见的评价指标进行比较:
高召回率在一些应用中至关重要,因为在这些应用中,遗漏阳性实例的代价很高或很危险。重点是尽量减少误判。
在计算机视觉(CV)和诸如 Ultralytics YOLO等模型中,召回率是与精确度和平均精确度 (mAP)并列的关键指标,用于评估物体检测和实例分割等任务的性能。在召回率和精确率之间取得良好的平衡往往是实现强大的实际性能的关键。例如,在比较YOLOv8 和YOLO11 等模型时,召回率有助于了解每个模型识别所有目标对象的能力。用户可以使用以下框架训练自定义模型PyTorch或 TensorFlow等工具跟踪 Recall Weights & Biases或Ultralytics HUB 中的集成功能。了解 Recall 有助于针对特定用例优化模型,可能涉及超参数调整或探索不同的模型架构,如YOLOv10或最新的 YOLO11.Ultralytics 文档等资源提供了全面的培训和评估指南。