术语表

锚式探测器

了解基于锚点的探测器如何通过精确定位、规模适应性和实际应用彻底改变物体检测。

基于锚点的检测器是计算机视觉中一类基本的物体检测模型。这些模型通过使用一组预定义的方框(称为锚点方框)来识别和定位图像中的物体。锚点框本质上是一个由不同尺寸和长宽比的模板组成的网格,这些模板被平铺在图像上。该模型会预测如何移动和缩放这些锚点,以匹配地面实况中的物体边界框,并给出表示物体存在的置信度分数。这种方法将寻找物体的问题简化为相对于这些固定锚点的回归和分类任务。

基于锚点架构的突出例子包括R-CNN 系列(如Faster R-CNN)、早期的单级检测器(如 SSD(单次多盒检测器))和许多 YOLO 模型,包括非常成功的Ultralytics YOLOv5

锚式探测器的工作原理

基于锚点的检测技术的核心理念是以一组预定义的参考盒为起点。在模型训练过程中,检测器会学习对每个锚点盒执行两项主要任务:

  1. 分类:确定锚点框是否包含感兴趣的对象,还是只是背景。
  2. 回归计算调整锚点框所需的精确偏移量(x、y、宽、高),使其紧密包围检测到的对象。

这些预测由模型的检测头在处理主干提取的图像特征后做出。由于一个物体可能会被多个锚点框检测到,因此需要使用一个名为 "非最大值抑制"(NMS)的后处理步骤来过滤多余的检测,只保留最合适的锚点框。这些模型的性能通常使用平均精度 (mAP)联合交叉 (IoU) 等指标进行评估。

有锚检测器与无锚检测器的比较

近年来,无锚检测器已成为一种流行的替代方案。与基于锚点的模型不同,无锚点方法可直接预测物体的位置和大小,通常是通过识别关键点(如物体中心或角落)或预测点到物体边界的距离,从而无需预定义的锚点形状。

主要区别包括

  • 复杂性:基于锚点的模型需要精心设计和调整锚点参数(大小、比例、尺度),这可能与数据集有关。无锚模型则简化了探测头的设计。
  • 灵活性:无锚方法可以更好地适应长宽比异常或固定锚点集不能很好反映形状的物体。
  • 效率:消除锚点可以减少模型需要预测的次数,从而加快推理速度,简化后期处理。

虽然像YOLOv4这样基于锚点的检测器非常成功,但包括Ultralytics YOLO11 在内的许多现代架构都采用了无锚点设计,以发挥其简洁高效的优势。您可以在 YOLO11 中探索无锚检测的优势,并查看不同 YOLO 模型之间的比较

实际应用

基于锚点的检测器广泛应用于物体具有相对标准形状和尺寸的各种应用中。

  • 自动驾驶:在汽车行业的解决方案中,这些探测器在识别车辆、行人和交通标志方面表现出色。这些物体的可预测形状与预定义的锚点非常吻合,为英伟达(NVIDIA)和特斯拉(Tesla)等公司实现了可靠的检测。
  • 零售分析:对于人工智能驱动的库存管理,基于锚点的模型可以高效地扫描货架以清点产品。包装商品的统一尺寸和形状使其成为这种方法的理想选择,有助于实现库存监控自动化。
  • 安全与监控:在固定监控摄像机镜头中识别人员或车辆是另一个强大的用例。这是Ultralytics 安全警报系统指南等应用的基础。

工具和培训

无论是基于锚点还是无锚点,开发和部署物体检测模型都需要使用PyTorchTensorFlow等框架和OpenCV 等库。Ultralytics HUB等平台为训练自定义模型、管理数据集和部署解决方案提供了简化的工作流程,并支持各种模型架构。为了进一步学习,Papers With Code等资源列出了最先进的模型,DeepLearning.AI等平台提供的课程涵盖了基础概念。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、合作和成长

立即加入
链接复制到剪贴板