了解边界框如何实现物体检测、人工智能和机器学习系统。探索边界框在计算机视觉应用中的作用!
边界框是计算机视觉(CV)中用来指示图像或视频帧中物体位置和范围的矩形框。这些边框通常由其左上角和右下角的坐标来定义,提供了一种简单而有效的方法来指定物体的位置及其所占空间的大小。边框是各种 CV 任务(包括对象检测、对象跟踪和图像标注)的基本组成部分,是许多现代人工智能(AI)和机器学习(ML)系统的基石。
边界框对于训练和评估物体检测模型至关重要。在 Ultralytics YOLO等模型处理的任务中,边界框在训练过程中充当了地面实况,教会模型精确定位物体。在推理过程中,模型会预测检测到的物体周围的边界框。这种定位能力对于不仅需要识别物体,还需要精确定位物体的应用(如自动驾驶汽车或机器人系统)来说至关重要。这一过程通常始于仔细的数据标注,即人类或自动工具在训练图像中围绕物体绘制边框,通常使用CVAT 等工具。
有几种指标和技术与在 ML 模型中使用和评估边界框密切相关:
边界框可以用矩形定位物体,而其他计算机视觉技术则可以提供不同程度的细节:
边界框是众多人工智能实际应用中不可或缺的一部分:
在自动驾驶汽车的人工智能开发过程中,边界框对于检测和跟踪行人、骑车人、其他车辆和道路障碍物至关重要。利用边界框进行准确、实时的物体检测,可使汽车系统做出明智的决策,实现安全导航和避免碰撞,并遵守美国国家公路交通安全管理局(NHTSA)等组织制定的安全准则。进一步了解人工智能在自动驾驶汽车中的作用。
零售商利用带边界框的物体检测功能来自动监控货架和管理库存。配备人工智能模型的摄像头可以检测产品、计算库存水平、识别放错位置的物品,并跟踪顾客与商品的互动。这可以提高效率,减少人工操作,并为优化商店布局和库存补充提供宝贵的数据。对此类零售技术趋势的洞察凸显了人工智能在零售业中日益增长的重要性。您可以找到适用于不同行业的各种Ultralytics 解决方案。