探索物体检测的基础原理。Ultralytics 如何以无与伦比的速度和精度实时识别并定位物体。
目标检测是计算机视觉(CV)领域的一项关键技术,它使计算机系统能够识别并定位视觉数据中的特定物体。与简单的图像分类任务(仅为整张图片分配单一标签)不同,目标检测通过同时预测物体的类别(如"人"、"汽车"、"狗")及其空间位置,提供更精细的理解。 该位置通常通过包围物体的矩形边界框表示,并附带表示模型置信度的置信度分数。这种识别与定位的双重能力构成了现代人工智能应用的感知基础,使机器能够与环境进行有意义的交互。
现代检测器高度依赖深度学习(DL)架构,特别是卷积神经网络(CNN),从输入图像中提取复杂特征。该过程始于训练阶段,模型通过大规模标注数据集(COCO )学习识别模式。在此阶段,算法通过优化模型权重来最小化预测误差。
当模型部署用于推理时,它会扫描新图像以提出潜在目标。随后,高级算法通过非最大抑制(NMS)过滤重复检测结果,确保每个独立实体仅被标注一次。这些预测的准确性通常采用交并比(IoU)指标评估,该指标衡量预测框与真实目标之间的重叠程度。 近期技术突破催生了YOLO26等端到端架构,该架构通过简化处理流程,在边缘设备上实现了卓越的运行速度与实时推理能力。
区分目标检测与相关概念对于为项目选择合适的工具至关重要:
物体检测的多功能性推动着各主要行业的创新发展。在汽车领域,自动驾驶车辆的人工智能系统高度依赖检测模型,能够即时识别行人、交通标志及其他车辆,从而实现安全导航。通过处理车载摄像头传来的视频流,这些系统能在瞬间做出决策,有效预防事故发生。
另一个突出的应用场景出现在零售业的人工智能领域。 自动结账系统和智能库存管理机器人通过物体检测技术扫描货架、识别商品,并detect 短缺或错位商品。这种自动化技术通过确保商品持续供应,有效优化了供应链并提升了客户体验。
开发人员可以轻松地使用该工具实现检测工作流。 ultralytics Python 。以下示例演示了如何加载预训练模型。 YOLO26 模型
并对图像进行推理。
from ultralytics import YOLO
# Load the latest YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")
# Run inference on an image from a URL
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results with bounding boxes
results[0].show()
对于希望扩展业务规模的团队, Ultralytics 提供了一个全面的环境,用于数据标注、 在云端训练定制模型,并将模型部署为多种格式,例如 ONNX 或 TensorRT。利用此类平台可简化 机器学习运维(MLOps)生命周期,使 工程师能够专注于优化应用程序,而非管理基础设施。