术语表

实例分割

了解实例分割如何以像素级精度完善对象检测,为人工智能应用提供详细的对象掩码。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

实例分割是一种复杂的计算机视觉技术,可识别图像中的物体,并在像素级精确划分每个实例的边界。与仅仅在物体周围画方框相比,这种方法能更详细地了解场景,从而实现对精确形状和分离至关重要的高级人工智能(AI)应用。

概述

实例分割技术超越了简单的方法,它能为检测到的每个物体生成唯一的掩码,即使多个物体属于同一类别(如在交通照片中分别识别每辆汽车)。这种完美的像素轮廓使系统不仅能了解存在哪些物体,还能了解它们的确切形状、大小和位置,从而有效区分重叠的物体。这种能力对于需要精确空间感知和高准确度的任务来说至关重要。

实例分割与相关任务

必须将实例分割与相关的计算机视觉任务区分开来:

  • 物体检测这项任务可以识别物体,并在每个物体周围绘制一个矩形边框。它能告诉你物体的位置,但不能告诉你物体的确切形状。
  • 语义分割它将图像中的每个像素归入一个类别(如 "汽车"、"道路"、"天空")。但是,它并不区分单个实例;如果不进行分离,所有汽车都会共享同一个 "汽车 "标签。您可以在实例分割与语义分割指南中了解更多信息。
  • 全景分割它结合了语义分割和实例分割,为每个像素同时分配一个类别标签和一个唯一的实例 ID。

实例分割具体侧重于识别和勾勒不同的对象。

实例分割的工作原理

传统方法,如著名的掩码 R-CNN 通常采用两阶段流程:首先用边界框检测物体,然后在边界框内生成掩码。这种方法虽然精确,但计算量很大。更现代的单阶段方法,包括 Ultralytics YOLO等变体,同时预测边界框和遮罩,从而实现更快的性能,适合实时推理。这些模型在COCO 等大型数据集上进行训练,其中包括分割注释(COCO 分割数据集)。

实例分割的应用

实例分割的详细输出结果在许多领域都非常宝贵:

  1. 自动驾驶对行人、车辆、骑车人和车道线进行精确分割,能让自动驾驶汽车更好地了解周围环境,安全地驾驭复杂的交通场景,并比仅用边界框更准确地预测行车动向。Waymo等机构的研究通常在很大程度上依赖于细分。
  2. 医学图像分析在放射学或病理学领域,实例分割可以准确勾勒出扫描图像(如 MRI 或 CT)中的肿瘤、器官甚至单个细胞。这有助于医生进行诊断、制定治疗计划(如放射治疗)和测量随时间发生的变化,从而推动人工智能在医疗保健领域的发展。请参阅使用YOLO11 进行肿瘤检测的指南。
  3. 机器人技术:机器人在执行拾取和放置物品等任务时,需要了解物体的确切形状,以便正确抓取,尤其是在杂乱无章的环境中。实例分割技术可提供这种关键的形状信息(机器人技术中的人工智能)。
  4. 卫星图像分析:从卫星或航空图像中识别并勾勒出单个建筑物、田地或水体,有助于城市规划、农业监测和环境评估(卫星图像分析技术)。

实例分割和Ultralytics YOLO

Ultralytics 提供能够进行高性能实例分割的先进模型。像 Ultralytics YOLOv8和较新的 Ultralytics YOLO11为分割任务提供预训练权重,并可在特定数据集上轻松进行自定义训练。您可以学习如何使用YOLO11 进行实例分割,或使用预先训练好的YOLOv8 模型探索分割方法。使用Ultralytics HUB 可以简化数据集、训练和部署管理。有关详细的性能比较,请参阅YOLO11 vsYOLOv8分段任务文档提供了进一步的指导。

阅读全部