术语表

实例分割

了解实例分割如何以像素级精度完善对象检测,为人工智能应用提供详细的对象掩码。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

实例分割是一种复杂的计算机视觉(CV)技术,可识别图像中的物体,并在像素级精确划分每个实例的边界。与只在物体周围放置方框的方法不同,实例分割通过为每个检测到的物体(即使它们属于同一类别)创建唯一的掩码,来提供对场景更详细的了解。这种功能对于高级人工智能(AI)应用至关重要,因为在这些应用中,了解不同物体的确切形状、大小和空间范围至关重要,尤其是当物体重叠时。

实例分割的工作原理

实例分割模型分析图像时,首先要定位潜在的对象,然后针对每个检测到的对象,预测哪些像素属于该特定实例。传统方法(如有影响力的掩码 R-CNN架构)通常采用两阶段流程:首先,进行对象检测以生成边界框建议;其次,在每个建议框内生成分割掩码。这些方法虽然有效,但对计算要求很高。

最近的方法,包括以下模型 Ultralytics YOLO等模型通常使用单级管道。这些模型通过神经网络 (NN) 一次就能同时预测边界框、类标签和实例掩码,从而显著提高了速度,使其适用于实时推理。训练这些模型需要具有像素级注释的大型数据集,例如广泛使用的COCO 数据集,特别是其分割注释。这一过程通常涉及深度学习(DL)技术,利用卷积神经网络(CNN)来学习复杂的视觉特征。

实例分割与相关任务

将实例分割与其他图像分割任务区分开来非常重要:

  • 物体检测使用边界框识别物体的存在和位置,但不提供形状信息。实例分割则更进一步,可以勾勒出每个对象的精确像素。
  • 语义分割为图像中的每个像素(如 "车"、"人"、"路")指定一个类别标签。然而,它并不能区分同一类别的不同实例。例如,所有汽车都属于同一个 "汽车 "片段。您可以在本指南中阅读更多关于实例分割与语义分割的内容。
  • 全景分割结合语义分割和实例分割。它为每个像素分配一个类别标签(如语义分割),同时也能唯一识别每个对象实例(如实例分割)。

实例分割特别侧重于检测和划分单个对象实例,从而提供高精度的对象边界和分离。

实例分割的应用

精确识别和隔离单个对象的能力使实例分割技术在众多领域发挥了重要作用:

  • 自动驾驶自动驾驶汽车依靠实例分割来准确感知周围环境。即使在杂乱或重叠的场景中,区分单个车辆、行人、骑车人和障碍物对于安全导航和决策也至关重要。Waymo等公司广泛使用此类技术。
  • 医学图像分析在放射学和病理学中,实例分割有助于在扫描(CT、核磁共振成像等)中勾勒出肿瘤、器官或细胞等特定结构。这种像素级精度有助于诊断、测量肿瘤大小、规划手术和跟踪疾病进展。例如,使用YOLO11 进行肿瘤检测展示了人工智能在医疗保健领域的广泛应用。
  • 机器人在非结构化环境中执行抓取或操纵等任务的机器人需要精确识别和定位单个物体。实例分割可以让机器人了解物品的确切形状和边界,从而实现成功的互动。
  • 卫星图像分析用于绘制详细的土地覆盖图,通过识别单个建筑物监测城市扩张情况,或跟踪船只或车辆等特定物体。这种详细程度支持环境监测、资源管理和情报收集。探索一般卫星图像分析技术
  • 农业监测有助于对单株植物或果实进行计数,评估每株作物的健康状况,或识别特定类型的杂草以进行有针对性的干预,为精准农业做出贡献。

使用Ultralytics YOLO进行实例分割

Ultralytics 提供能够执行高效实例分割的先进模型。这些模型包括 YOLOv8YOLO11等模型旨在为各种计算机视觉任务包括实例分割)提供高性能。Ultralytics HUB平台简化了从数据管理到模型部署 机器学习 (ML)工作流程。在实际应用方面,我们提供了使用预训练的Ultralytics YOLOv8 模型进行细分的教程或隔离细分对象的指南等资源。您还可以学习如何使用Ultralytics YOLO11 进行实例分割。流行的框架,如 PyTorchTensorFlow等流行框架常用于开发和部署这些模型。

阅读全部