绿色检查
链接复制到剪贴板

Ultralytics YOLO11 无锚探测器的优点

了解Ultralytics YOLO11 如何支持无锚对象检测,以及这种模型架构给各种应用带来的好处。

如果我们回顾一下视觉人工智能模型的历史,那么物体检测这一计算机视觉的核心任务(涉及在图像或视频中识别和定位物体)的概念早在 20 世纪 60 年代就已出现。然而,它之所以在当今的尖端创新中具有重要意义,关键在于物体检测技术和模型架构从那时起就不断进步并得到了迅速改进。 

在上一篇文章中,我们讨论了物体检测的演变以及通往Ultralytics YOLO 模型的道路。今天,我们将重点探讨这一历程中一个更为具体的里程碑:从基于锚点的检测器到无锚点检测器的跨越。 

基于锚点的检测器依靠被称为 "锚点 "的预定义方框来预测图像中的物体位置。相比之下,无锚检测器跳过了这些预定义的方框,而是直接预测物体的位置。

这种转变看似简单、合乎逻辑,但实际上却大大提高了物体检测的准确性和效率。在本文中,我们将了解无锚检测器是如何通过以下进步重塑计算机视觉的。 Ultralytics YOLO11.

什么是锚基探测器?

基于锚点的检测器使用预定义的方框(称为锚点)来帮助定位图像中的物体。可以把这些锚点想象成放置在图像上的不同大小和形状的方框网格。然后,模型会根据检测到的物体调整这些方框。例如,如果模型识别出一辆汽车,它就会修改锚点框,以便更准确地匹配汽车的位置和大小。

每个锚点都与图像中可能存在的物体相关联,在训练过程中,模型会学习如何调整锚点框,以更好地匹配物体的位置、大小和长宽比。这样,模型就能检测到不同比例和方向的物体。然而,选择一组正确的锚点框非常耗时,而且在微调过程中也容易出错。

图 1.什么是锚箱?

虽然基于锚点的检测器(如YOLOv4)在许多应用中效果良好,但它们也有一些缺点。例如,锚点框并不总是能很好地与不同形状或大小的物体对齐,这使得模型更难检测到小的或不规则形状的物体。选择和微调锚点框大小的过程也很耗时,需要大量的人工操作。除此以外,基于锚点的模型在检测遮挡或重叠的物体时往往会遇到困难,因为预定义的框可能无法很好地适应这些更复杂的情况。

向无锚点物体检测转变

无锚检测器在 2018 年开始受到关注,CornerNet 和 CenterNet 等模型通过消除对预定义锚框的需求,采取了一种全新的物体检测方法。与依靠不同大小和形状的锚框来预测物体位置的传统模型不同,无锚模型直接预测物体的位置。它们专注于物体的关键点或特征,如中心点,从而简化了检测过程,使其更快、更准确。

以下是无锚模型的一般工作原理:

  • 关键点检测:有些模型不使用预定义的方框,而是识别物体上的重要点,如中心或特定角落。这些关键点可以帮助模型确定物体的位置和大小。
  • 中心 预测:有些模型侧重于预测物体的中心。一旦找到中心点,模型就能据此预测整个物体的大小和位置。
  • 热图回归:许多无锚模型都使用热图,每个像素代表一个物体的可能位置。热图值越大,说明该点存在物体的可信度越高。
图 2.基于锚点的检测与无锚点的检测。

由于无锚模型不依赖于锚箱,因此设计更简单。这意味着它们的计算效率更高。由于无需处理多个锚点框,它们可以更快地检测到物体--这在自动驾驶和视频监控等实时应用中是一个重要优势。 

无锚点模型在处理小型、不规则或遮挡物体方面也更胜一筹。由于它们专注于检测关键点,而不是试图适应锚点框,因此更加灵活。这使它们能够在杂乱或复杂的环境中准确检测物体,而基于锚点的模型可能会在这些环境中失效。

Ultralytics YOLO11:无锚探测器

YOLO 模型最初是为了提高速度和效率而设计的,现在已逐渐从基于锚点的方法转向无锚点检测,使YOLO11 等模型更快、更灵活,更适合广泛的实时应用。

以下是YOLO 不同版本无锚设计的演变过程:

  • Ultralytics YOLOv5u:推出免锚点分割Ultralytics 头,不再需要预定义的锚点框。取而代之的是,该模型可直接预测图像中物体的位置,从而简化了处理过程,提高了灵活性和速度。
  • YOLOv6:采用了一种称为锚点辅助训练(AAT)的新方法,即只在训练时使用锚点。这使得模型在训练过程中受益于基于锚点的方法的结构,同时在运行时仍然使用无锚点检测,以获得更好的速度和适应性。
  • Ultralytics YOLOv8:通过使用无锚分体式Ultralytics 头,全面转向无锚检测。这使得模型更快、更准确,特别是对于那些与锚点盒不太匹配的小物体或奇形怪状的物体。
  • Ultralytics YOLO11:以YOLOv8的无锚点方法为基础,通过完全消除锚点框进一步优化检测。这使得动物行为监控和零售分析等实时应用的检测速度更快、更准确。
图 3.Ultralytics YOLOv8 和Ultralytics YOLO11 的比较。

真实世界的应用YOLO11

自动驾驶汽车中,使用YOLO11 进行无锚检测是一个很好的例子。在自动驾驶汽车中,快速准确地检测行人、其他车辆和障碍物对安全至关重要。YOLO11无锚检测方法通过直接预测物体的关键点(如行人的中心或其他车辆的边界),而不是依赖预定义的锚点框,从而简化了检测过程。 

图 4.YOLO11 中无锚点检测的优势(图片由作者提供)。

YOLO11 不需要为每个对象调整或匹配锚点网格,因为这样做的计算成本会很高,速度也会很慢。相反,它专注于关键特征,因此速度更快,效率更高。例如,当行人步入车辆路径时,YOLO11 可以通过精确定位关键点快速识别其位置,即使该人部分隐藏或正在移动。无需锚框即可适应不同形状和大小的能力使YOLO11 能够以更高的速度更可靠地检测物体,这对于自动驾驶系统的实时决策至关重要。

YOLO11的无锚功能在其他应用中也非常突出:

  • 零售和库存管理:YOLO11 可以更轻松地监控货架上的产品,即使是堆叠或部分堵塞的产品。这有助于更快、更准确地跟踪库存并减少错误。
  • 医学成像YOLO11 在医疗领域也很有效,它可以在医学扫描中检测出肿瘤或其他异常。它能够处理形状不规则的物体,有助于提高诊断复杂病症的准确性。
  • 野生动物监测:在野生动物研究中,YOLO11 可以在茂密的森林或恶劣的地形中追踪动物,帮助研究人员监测动物行为或保护濒危物种。
  • 体育分析YOLO11 ,可用于在体育赛事中实时跟踪球员、球的运动或其他元素,为球队、教练和转播商提供有价值的见解。

使用无锚模型时的注意事项

虽然像YOLO11 这样的无锚点模型有很多优点,但也有一定的局限性。其中一个主要的实际考虑因素是,即使是无锚点模型,在处理遮挡物或高度重叠的物体时也会遇到困难。这背后的原因是,计算机视觉 旨在复制人类视觉,就像我们有时难以识别遮挡物体一样,人工智能模型也会面临类似的挑战。

另一个有趣的因素与模型预测的处理有关。虽然无锚模型的结构比基于锚的模型简单,但在某些情况下仍有必要进行额外的改进。例如,可能需要非最大抑制(NMS)等后处理技术来清理重叠预测或提高拥挤场景中的预测精度。

与人工智能一起锚定人工智能的未来YOLO11

从基于锚点到无锚点检测的转变是物体检测领域的一大进步。有了无锚点模型(如YOLO11 ),检测过程得以简化,从而提高了精度和速度。

通过YOLO11 ,我们看到了无锚点物体检测在自动驾驶汽车、视频监控和医疗成像等实时应用中的出色表现,在这些应用中,快速和精确的检测至关重要。这种方法使YOLO11 能够更容易地适应不同的物体大小和复杂的场景,在各种环境中提供更好的性能。

随着计算机视觉的不断发展,物体检测只会变得更快、更灵活、更高效。

探索我们的GitHub 存储库,加入我们的社区,随时了解人工智能的最新动态。了解人工智能视觉如何影响制造业农业等领域。

Facebook 徽标Twitter 徽标LinkedIn 徽标复制链接符号

在此类别中阅读更多内容

让我们共同打造人工智能的未来

开始您的未来机器学习之旅