在机器学习中,尤其是在分类和对象检测领域,召回率是一个关键指标,它能让我们深入了解模型识别数据集中所有相关实例的能力。它回答了一个问题:"在所有实际的阳性案例中,模型正确识别了多少?了解 Recall 对于评估人工智能模型的有效性至关重要,尤其是在一些应用中,如果不能检测到正向实例,就会造成严重后果。
召回率通常被称为灵敏度,是量化模型找到所有正向实例能力的指标。它的计算方法是真阳性(TP)与真阳性和假阴性(FN)之和的比率。简单地说,就是要尽量减少假阴性--模型错误地预测了负面结果,而实际结果却是正面的。高召回得分表明模型能有效捕捉大部分实际的正向实例,从而降低遗漏重要正向案例的风险。
例如,在使用诸如 Ultralytics YOLOv8等模型的物体检测任务中,高召回率意味着该模型善于发现图像中大多数感兴趣的物体,即使偶尔会将背景元素误认为物体(导致精度降低)。
在漏检阳性实例比误报阳性代价更大的情况下,召回显得尤为重要。考虑一下用于疾病检测的医学图像分析。例如,在癌症筛查中,高召回率至关重要。识别所有实际癌症病例(即使这意味着一些健康人被错误标记,需要进一步调查)比为了减少误报而漏掉癌症病例更为重要。漏检阳性病例(假阴性)可能会延误治疗并对健康造成严重影响。
Recall 在安全系统中的另一个重要应用领域是计算机视觉防盗应用。在零售安全领域,最大限度地提高召回率可确保系统检测到尽可能多的潜在盗窃事件。虽然可能会出现一些误报(假阳性),但如果检测不到实际的盗窃事件(假阴性),则可能会导致重大的经济损失。因此,优先考虑 "召回 "是有效实施安全的关键。
Recall 侧重于正面预测的完整性,而Precision则衡量正面预测的准确性。精确度的答案是"在模型预测为正结果的所有实例中,有多少是真正的正结果?高精确度得分意味着,当模型预测出积极结果时,它很有可能是正确的,从而将误报率降到最低。
另一方面,准确度是对正确性的整体衡量,同时考虑到真阳性、真阴性、假阳性和假阴性。准确率在类别平衡的情况下非常有用,但在处理不平衡的数据集时,如果一个类别的数量明显多于另一个类别,准确率就会产生误导。
在现实世界的许多应用场景中,精确度和召回率之间存在权衡。提高召回率可能会降低精确度,反之亦然。F1 分数是一个平衡精确度和召回率的指标,提供了两者的调和平均值。选择正确的指标取决于具体应用以及误报和误报的相对成本。要深入了解模型评估,YOLO 性能指标可以提供有价值的见解。
除了医疗和安全应用,Recall 在各种人工智能驱动的系统中也发挥着至关重要的作用:
总之,召回率是机器学习中的一个重要评估指标,尤其是当遗漏正实例的成本很高时。通过了解和优化 Recall,开发人员可以利用Ultralytics HUB 等工具和平台,在各种应用中构建更有效、更可靠的人工智能系统。