了解实例分割如何以像素级精度完善对象检测,为人工智能应用提供详细的对象掩码。
实例分割是一种复杂的计算机视觉技术,可识别图像中的物体,并在像素级精确划分每个实例的边界。与仅仅在物体周围画方框相比,这种方法能更详细地了解场景,从而实现对精确形状和分离至关重要的高级人工智能(AI)应用。
实例分割技术超越了简单的方法,它能为检测到的每个物体生成唯一的掩码,即使多个物体属于同一类别(如在交通照片中分别识别每辆汽车)。这种完美的像素轮廓使系统不仅能了解存在哪些物体,还能了解它们的确切形状、大小和位置,从而有效区分重叠的物体。这种能力对于需要精确空间感知和高准确度的任务来说至关重要。
必须将实例分割与相关的计算机视觉任务区分开来:
实例分割具体侧重于识别和勾勒不同的对象。
传统方法,如著名的掩码 R-CNN 通常采用两阶段流程:首先用边界框检测物体,然后在边界框内生成掩码。这种方法虽然精确,但计算量很大。更现代的单阶段方法,包括 Ultralytics YOLO等变体,同时预测边界框和遮罩,从而实现更快的性能,适合实时推理。这些模型在COCO 等大型数据集上进行训练,其中包括分割注释(COCO 分割数据集)。
实例分割的详细输出结果在许多领域都非常宝贵:
Ultralytics 提供能够进行高性能实例分割的先进模型。像 Ultralytics YOLOv8和较新的 Ultralytics YOLO11为分割任务提供预训练权重,并可在特定数据集上轻松进行自定义训练。您可以学习如何使用YOLO11 进行实例分割,或使用预先训练好的YOLOv8 模型探索分割方法。使用Ultralytics HUB 可以简化数据集、训练和部署管理。有关详细的性能比较,请参阅YOLO11 vsYOLOv8。分段任务文档提供了进一步的指导。