了解平均精度 (mAP) 在评估自动驾驶和医疗保健等人工智能应用的物体检测模型中的重要性。
平均精确度 (mAP) 是一种广泛使用的指标,用于评估物体检测模型的性能,如流行的 Ultralytics YOLO系列中的模型。它提供了一个单一的综合分数,总结了模型在不同类别和置信度下正确识别和定位物体的能力。与更简单的指标不同,mAP 能有效平衡找到所有相关对象(召回率)与确保找到的对象确实正确(精确度)之间的权衡,因此对于评估自主系统和医疗诊断等复杂应用中使用的模型至关重要。对于参与开发或部署计算机视觉(CV)模型的任何人来说,了解 mAP 都是至关重要的。
mAP 提供了一种方法来评估模型在不同权衡点上的表现,从而提供了一种更平衡的性能视图。您可以在维基百科上了解有关精确度和召回率基本原理的更多信息。
mAP 的计算涉及多个步骤,可对模型在不同物体类别和检测阈值下的性能进行稳健的评估:
通常情况下,mAP 是按照特定的 "交集大于联合"(IoU)阈值进行报告的。IoU 衡量的是预测边界框与地面实况(实际)边界框之间的重叠程度。常见的 mAP 变体包括
要详细了解这些指标如何具体应用于YOLO 模型,请参阅Ultralytics YOLO 性能指标指南。
平均精度之所以重要,是因为它能全面反映物体检测模型的性能。它同时考虑了训练数据中定义的所有类别的分类精度(对象类别是否正确?)和定位精度(边界框是否放置正确?这使得它比孤立地看精确度或召回率更有参考价值,尤其是在有多个对象类别或类别分布不平衡的数据集中。mAP 分数越高,通常表明物体检测模型越稳健可靠。谨慎的数据扩充、超参数调整以及选择合适的模型架构(如 YOLO11等技术是提高 mAP 的常用策略。
mAP 对于评估实际任务中的模型至关重要,因为在实际任务中,准确性和可靠性是最重要的:
其他应用包括安全监控、机器人技术(在机器人技术中集成计算机视觉)、零售分析(人工智能用于更智能的零售库存管理)和农业。
必须将 mAP 与机器学习 (ML) 中使用的相关评估指标区分开来:
了解这些差异对于根据具体任务和评估目标选择合适的指标至关重要。如需了解更多信息,请参阅《模型评估和微调指南》。
Ultralytics HUB等工具允许用户训练、跟踪和评估模型,并在模型训练和验证过程中将 mAP 作为关键性能指标。ML 框架,如 PyTorch和 TensorFlow等 ML 框架为构建和训练这些物体检测模型提供了基础组件。COCO和PASCAL VOC等标准化数据集在公共排行榜和研究论文中使用 mAP 作为比较物体检测模型的主要指标,推动了该领域的进步。您可以在Ultralytics 模型比较页面上探索和比较各种模型的性能,这些性能通常由 mAP 度量。