了解实例分割如何以像素级精度完善对象检测,为人工智能应用提供详细的对象掩码。
实例分割是一种复杂的计算机视觉(CV)技术,可识别图像中的物体,并在像素级精确划分每个实例的边界。与只在物体周围放置方框的方法不同,实例分割通过为每个检测到的物体(即使它们属于同一类别)创建唯一的掩码,来提供对场景更详细的了解。这种功能对于高级人工智能(AI)应用至关重要,因为在这些应用中,了解不同物体的确切形状、大小和空间范围至关重要,尤其是当物体重叠时。
实例分割模型分析图像时,首先要定位潜在的对象,然后针对每个检测到的对象,预测哪些像素属于该特定实例。传统方法(如有影响力的掩码 R-CNN架构)通常采用两阶段流程:首先,进行对象检测以生成边界框建议;其次,在每个建议框内生成分割掩码。这些方法虽然有效,但对计算要求很高。
最近的方法,包括以下模型 Ultralytics YOLO等模型通常使用单级管道。这些模型通过神经网络 (NN) 一次就能同时预测边界框、类标签和实例掩码,从而显著提高了速度,使其适用于实时推理。训练这些模型需要具有像素级注释的大型数据集,例如广泛使用的COCO 数据集,特别是其分割注释。这一过程通常涉及深度学习(DL)技术,利用卷积神经网络(CNN)来学习复杂的视觉特征。
将实例分割与其他图像分割任务区分开来非常重要:
实例分割特别侧重于检测和划分单个对象实例,从而提供高精度的对象边界和分离。
精确识别和隔离单个对象的能力使实例分割技术在众多领域发挥了重要作用:
Ultralytics 提供能够执行高效实例分割的先进模型。这些模型包括 YOLOv8和 YOLO11等模型旨在为各种计算机视觉任务(包括实例分割)提供高性能。Ultralytics HUB平台简化了从数据管理到模型部署 的 机器学习 (ML)工作流程。在实际应用方面,我们提供了使用预训练的Ultralytics YOLOv8 模型进行细分的教程或隔离细分对象的指南等资源。您还可以学习如何使用Ultralytics YOLO11 进行实例分割。流行的框架,如 PyTorch和 TensorFlow等流行框架常用于开发和部署这些模型。