了解什么是机器学习中的 Recall,为什么它很重要,以及它如何确保人工智能模型有效捕捉关键的积极实例。
召回率是机器学习和统计学中的一个关键性能指标,在分类和信息检索任务中尤为重要。它衡量模型从数据集中正确识别所有相关实例的能力。Recall 也称为灵敏度或真阳性率 (TPR),它回答了一个问题:"在所有实际的正向实例中,模型正确预测为正向的实例有多少?在遗漏一个正向实例(假阴性)会造成严重后果的情况下,高召回率至关重要。
召回率侧重于数据集中的实际阳性案例,并量化模型成功捕捉到的阳性案例数量。其计算方法是真阳性(TP)--被正确识别为阳性的实例--与真阳性和假阴性(FN)--实际为阳性但被错误识别为阴性的实例之和的比率。高召回率模型能正确识别大多数正向实例。了解 Recall 对于评估模型性能至关重要,通常使用混淆矩阵来直观显示。
召回率通常与准确率一起讨论。召回率衡量的是正确识别的实际阳性比例,而精度衡量的是实际正确的预测阳性比例(TP / (TP + 假阳性))。精确度和召回率之间往往存在权衡;优化其中一个有时会对另一个产生负面影响:
F1 分数是兼顾精确度和召回率的单一指标。
在许多领域,召回率都是一个重要的评估指标:
在计算机视觉领域,Recall 对于评估物体检测和图像分割等任务至关重要。对于像 Ultralytics YOLO这样的物体检测模型,召回率表示该模型在图像中找到特定物体类别的所有实例的情况。高召回率意味着模型很少遗漏它应该检测的对象。它通常与精确度(Precision)和平均精确度(mean Average Precision,mAP)一起使用,对检测性能进行综合评估,详见YOLO 性能指标指南。Ultralytics HUB等平台中的工具可以帮助用户在模型训练和验证过程中跟踪这些指标。了解召回率有助于开发人员针对特定需求对模型进行微调,例如确保在安防报警系统中进行全面检测。评估性能通常需要分析混淆矩阵得出的指标,并考虑潜在不平衡数据集的背景。