了解什么是 "交集大于联合"(IoU)、它是如何计算的,以及它在物体检测和人工智能模型评估中的关键作用。
交集大于联合(IoU)是计算机视觉中广泛使用的一个基本指标,尤其适用于物体检测和图像分割等任务。它量化了预测边界(如物体检测中的边界框)与物体实际、地面真实边界的匹配程度。从本质上讲,IoU 衡量的是预测区域与真实区域之间的重叠程度,为定位性能提供了一个简单而有效的分数。了解 IoU 对于评估和比较计算机视觉模型的有效性至关重要。
在评估以下模型的性能时,IoU 是一项重要的性能指标 Ultralytics YOLO等模型在图像中定位物体的效果时,IoU 是一个关键的性能指标。分类能告诉我们存在什么物体,而 IoU 则能告诉我们模型精确定位的程度。在现实世界的许多场景中,精确定位与正确分类同样重要,因此这种空间精确度至关重要。高 IoU 分数表明,模型的预测与实际物体的边界非常吻合。许多物体检测基准,如COCO 数据集评估和较早的PASCAL VOC 挑战赛,都在很大程度上依赖于 IoU 临界值。
计算方法是将预测边界框与地面实况边界框重叠的区域(交点)除以两个边界框合并覆盖的总区域(结合点)。1 表示完全匹配,即预测边界框与地面实况边界框完全重叠。0 分表示完全没有重叠。许多物体检测评估协议的常见做法是,如果 IoU 得分达到或超过某个阈值(通常为 0.5),则认为预测正确,但也可根据应用需要使用更严格的阈值。
IoU 能够测量定位精度,因此在各个领域都不可或缺:
虽然 IoU 专门用于衡量定位质量,但它通常与其他指标一起使用,以全面反映性能。平均精度 (mAP)是一种广泛使用的指标,它同时考虑了不同 IoU 阈值下的精度(正向预测的准确性)和召回率(找到所有相关实例的能力)。IoU 评估的是单个预测,而 mAP 则不同,它提供的是不同类别和阈值的综合得分,从而对模型质量进行更广泛的评估。您可以在我们的YOLO 性能指标指南中了解有关这些指标的更多信息。了解精确度和召回率之间的关系是解释 mAP 的关键。
IoU 不仅仅是一个评估指标,它也是训练过程本身不可或缺的一部分。例如,IoU 计算通常用于损失函数(如 GIoU、DIoU、CIoU 损失),以直接优化模型预测准确边界框的能力。在训练和超参数调整过程中监控 IoU 可以帮助开发人员完善模型,从而实现更好的定位。Ultralytics HUB等工具可以跟踪 IoU 和其他指标,从而简化模型改进周期。尽管 IoU 很有用,但它对物体比例和微小的位置误差很敏感,但它仍然是计算机视觉评估的基石。