术语表

边界框

了解边界框如何实现物体检测、人工智能和机器学习系统。探索边界框在计算机视觉应用中的作用!

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

边框是计算机视觉中用于识别图像或视频帧中物体位置和大小的矩形框。这些边框由其四角(通常是左上角和右下角)的坐标定义,可精确勾勒出物体的位置。边框是各种计算机视觉任务(如物体检测图像分割和物体跟踪)中必不可少的工具,可帮助算法准确识别和分类物体。这一基本概念在各行各业都有广泛的应用,是现代人工智能和机器学习(ML)系统的基石。

物体检测的重要性

边界框是训练机器学习模型的基础,尤其是在物体检测方面,其目标是让人工智能系统能够像人类一样 "看到 "和解释视觉数据。在Ultralytics YOLO 等物体检测模型中,边框有助于精确定位单张图像中多个物体的位置。通过在每个检测到的物体周围画一个矩形框,这些框提供了一个清晰的视觉标记,缩小了检测模型的焦点,提高了物体检测的准确性和效率。这一功能对于需要精确定位物体的应用(如自动驾驶汽车、安防系统和库存管理)至关重要。

与边框有关的关键概念

在机器学习领域,有几个重要的概念与边界框密切相关:

  • 交集大于联合(IoU)IoU 是用于评估物体检测模型准确性的指标。它衡量的是预测边界框与地面实况边界框之间的重叠程度,提供了一个比率来表示预测与实际物体位置的匹配程度。IoU 分数越高,表示预测越准确。
  • 非最大值抑制(NMS)NMS 是一种后处理技术,用于完善物体检测模型的输出。它可以消除重叠严重的冗余边界框,确保只保留最有把握和最准确的检测结果。
  • 平均精度 (mAP)mAP 是评估物体检测模型整体性能的综合指标。它考虑了多个类别和 IoU 阈值的精确度和召回率,为模型准确检测物体的有效性提供了一个可靠的衡量标准。

边界框与相关术语

虽然边界框用于定位物体,但它有别于语义分割实例分割等其他计算机视觉技术。语义分割涉及将图像中的每个像素归入一个特定类别,提供详细的轮廓,但无法区分同一类别中的单个物体。而实例分割则是识别并勾勒出每个不同的物体实例,通过为每个物体提供像素级掩码,提供比边界框更详细的信息。

在现实世界中的应用

边界框因其简单有效而被广泛应用于现实世界中。下面是两个突出的例子:

自动驾驶汽车

自动驾驶汽车的开发过程中,边界框在识别和跟踪路上的行人、其他车辆和障碍物方面发挥着至关重要的作用。使用边界框进行精确检测对于安全导航和避免碰撞至关重要。它能确保自动驾驶系统及时做出明智的决策,例如何时刹车或变道。进一步了解人工智能对自动驾驶技术的影响

零售和库存管理

在零售行业,装订箱用于监控库存水平和有效管理库存。通过检测和清点货架上的产品,物体检测系统可以实现库存跟踪自动化,优化库存补充,提高整体运营效率。这项技术不仅能简化流程,还能通过确保产品供应来提高客户满意度。了解 Vision AI 如何彻底改变零售业的库存管理

阅读全部