探索适用于高速实时人工智能的单阶段目标检测器。了解Ultralytics 如何为边缘人工智能和部署提供卓越的准确性和效率。
单阶段目标检测器是一类强大的深度学习架构,旨在以卓越的速度和效率执行目标检测任务。与传统两阶段目标检测器将检测过程分为区域提案和后续分类两个独立步骤不同,单阶段模型通过单次遍历即可分析整幅图像。 通过将检测问题转化为直接回归任务,这类网络能直接从输入像素中同时预测边界框坐标与类别概率。这种精简方法显著降低了计算开销,使单阶段检测器成为实时推理和资源受限边缘AI设备部署的首选方案。
单阶段检测器的架构通常以卷积神经网络(CNN)为核心,该网络作为特征提取的 骨干。当图像通过该网络时,模型会生成编码空间与语义信息的特征图网格。
早期实现方案(如单次射击多框检测器SSD)依赖于预定义的锚框在不同尺度上定位目标。然而,现代技术如 Ultralytics YOLO11 和顶尖的 YOLO26等技术已基本转向 无锚框设计。这些新型架构 直接预测物体中心位置与尺寸, 消除了与锚框相关的复杂超参数调优需求。 最终输出包含用于定位的坐标向量 以及代表模型对检测物体 置信度的置信度分数。
区分这两大类有助于为特定任务选择合适的工具:
单级探测器的效率使其在需要即时响应的关键领域得到广泛应用:
使用现代高级API实现单阶段检测器非常简单。为确保结果准确,模型通常会预测多个潜在边界框,随后通过基于交并比(IoU)阈值的非最大抑制(NMS)等技术进行过滤,不过像YOLO26这类新型端到端模型已原生支持此功能。
以下Python 如何加载先进的YOLO26模型并对图像进行推理:
from ultralytics import YOLO
# Load the YOLO26 model, the latest natively end-to-end one-stage detector
model = YOLO("yolo26n.pt")
# Run inference on an image URL to detect objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the first result with bounding boxes and labels
results[0].show()
单阶段检测器的演进重点在于突破"精度与速度"的权衡困境。 为解决训练过程中的类别不平衡问题,引入了焦点损失等技术,确保模型聚焦于classify 而非大量背景数据。此外,特征金字塔网络(FPN)的集成使这些模型能够高效detect 不同尺度的detect 。
如今,研究人员和开发者可借助Ultralytics 工具,轻松利用定制数据集训练这些先进架构,该Ultralytics 简化了从数据标注到模型部署的整个工作流程。无论是农业还是医疗领域,单阶段检测器的普及正让强大的计算机视觉能力惠及大众。