深圳Yolo 视觉
深圳
立即加入
词汇表

检测头

了解检测头如何实现实时目标检测。探索Ultralytics 中的作用,该系统能以高精度预测边界框和标签。

检测头作为目标检测神经网络架构中的最终决策层。虽然模型前端层负责理解图像中的形状、纹理和特征,但检测头是将这些信息转化为具体预测结果的关键组件——它能精确识别图像中存在的物体及其位置。 它将特征提取器生成的抽象高阶数据转化为可操作结果,通常输出包含已识别物体的边界框集合,并附带对应的类别标签与置信度评分

区分头部与脊柱及颈部

要充分理解检测头的功能,可将现代检测器视作由三个主要阶段构成,每个阶段在计算机视觉(CV)管道中都承担着独特的作用:

  • 骨干网络:这是网络的初始部分,通常采用卷积神经网络(CNN),如ResNet或CSPNet。它处理原始输入图像以生成特征图,这些特征图代表视觉模式。
  • 颈部:位于脊柱与头部之间,颈部融合并优化了不同尺度特征。诸如特征金字塔网络(FPN)等架构通过聚合上下文信息,确保模型能够detect 不同尺寸的detect 。
  • 头部:最终组件,它接收颈部处理后的特征,执行实际的分类任务(识别物体是什么)和回归任务(定位物体位置)。

进化:锚点式与无锚点式

检测头的设计已显著演进,以提升速度和准确性,尤其是在从传统方法向现代实时推理模型过渡的过程中。

  • 锚点式检测器:传统 单阶段目标检测器依赖 预定义锚框——即多种尺寸的固定参考形状。检测器会预测如何拉伸或移动这些锚点以适配目标。该方法在Faster R-CNN的基础研究中 有详细阐述。
  • 无锚点检测头:当前最先进的模型(包括最新的 YOLO26)均采用 无锚点检测器。这类检测头能直接从特征图像素中预测 目标中心与尺寸,无需人工调整锚点。这不仅简化了架构,还增强了模型对新型物体形状的泛化能力——该技术常与 全卷积单阶段目标检测(FCOS)相关。

实际应用

检测头的精度对于在安全关键型和工业环境中部署人工智能(AI)至关重要。用户Ultralytics 轻松标注数据并训练这些专用检测头。

  • 自动驾驶: 汽车人工智能领域,检测头负责 实时区分行人、交通信号灯及其他车辆。高度 优化的检测头确保 推理延迟保持在足够低的水平,使 车辆能够即时响应。
  • 医学诊断: 在医学影像分析中,检测头经过精细调校,用于定位磁共振成像扫描中的肿瘤等异常病灶。回归分支必须具备极高精度,以勾勒病变的精确边界,从而协助医生制定医疗方案

代码示例

以下示例演示了如何加载一个 YOLO26 模型并检查其检测头的输出。 当推理运行时,该头处理图像并返回最终结果。 boxes 包含坐标和 类ID。

from ultralytics import YOLO

# Load the YOLO26n model (nano version)
model = YOLO("yolo26n.pt")

# Run inference on an image to utilize the detection head
results = model("https://ultralytics.com/images/bus.jpg")

# The detection head outputs are stored in results[0].boxes
for box in results[0].boxes:
    # Print the bounding box coordinates and the predicted class
    print(f"Class: {int(box.cls)}, Coordinates: {box.xywh.numpy()}")

该交互过程突显了检测头如何将复杂的神经网络激活转化为可读数据, 开发者可利用这些数据执行物体追踪或计数等下游任务。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入