基于锚点的检测器是一类广泛应用于计算机视觉领域的物体检测模型。这些模型使用被称为 "锚点 "的预定义框来预测图像中物体的位置和类别。锚点可作为参考点,帮助模型生成潜在物体的建议。它们对于检测各种尺寸和形状的物体特别有用,因此在许多物体检测架构中很受欢迎。
锚点探测器的工作原理是利用在图像上滑动的不同比例和长宽比的锚点盒网格。每个锚点框都经过策略性定位,以涵盖一系列潜在的物体尺寸和形状。在训练过程中,模型会学习将每个锚点框分类为包含物体或仅包含背景。它还会改进这些锚点框的位置,以准确检测物体。这种改进包括调整锚点框的尺寸和位置,以更好地匹配物体的真实边界框。最终输出是一组边界框,每个边界框都有相应的类别标签和置信度分数,表明物体存在的可能性。
基于锚点的检测器因其坚固耐用和适应性强而广泛应用于各行各业。在物体可能以不同比例和长宽比出现的情况下,它们尤其有效。
下面是两个实际应用的具体例子:
基于锚点的检测器还可用于医疗保健领域的医学图像分析、农业领域的作物和牲畜监测,以及制造业的质量控制和缺陷检测。
锚固式探测器具有多种优势,适合广泛的应用:
几种流行的物体检测模型都采用了基于锚点的方法。例如,早期版本的 Ultralytics YOLO系列的早期版本,如YOLOv4,就是著名的基于锚点的检测器。其他著名的模型包括 Faster R-CNN(该模型引入了区域建议网络(RPN)的概念,利用锚点生成区域建议)和 Single Shot MultiBox Detector (SSD)(来源),该模型使用不同尺度的多个特征图来检测物体。
基于锚的检测器虽然非常成功,但也有一些局限性。使用预定义的锚点框会带来额外的超参数和计算复杂性。另一方面,无锚检测器可以直接预测物体的位置,而无需依赖预定义的锚框。这种方法简化了检测过程,在某些情况下效率更高。不过,基于锚点的检测器仍是许多应用的首选,因为它们能够处理各种规模的物体,而且在准确性方面也有良好的记录。要进一步了解无锚检测的优势,您可以阅读这篇文章,了解 Ultralytics YOLO11 作为无锚检测器的优势。