了解新的Ultralytics YOLO11 模型如何用于实例细分,从而在废物管理和火炬监测等应用中实现更高的精度。
计算机视觉是人工智能(AI)中的一个领域,它可以帮助机器解释和理解视觉信息,实现实例分割等任务。实例分割 可用于分析图像或视频帧,以准确标出图像中每个不同物体的边界,即使存在多个相同类型的物体也不例外。实例分割具有很高的精确度,应用范围非常广泛,从帮助自动驾驶汽车检测道路上的障碍物,到识别 医学扫描中的肿瘤,无所不能。
多年来,实例细分有了很大发展。在Ultralytics的年度混合活动 YOLO Vision 2024(YV24)上,介绍了最近的发展,其形式为 Ultralytics YOLO11模型。新模型支持的计算机视觉任务(包括实例分割)与旧模型相同。 Ultralytics YOLOv8模型,因此熟悉以前版本的用户可以无缝采用新模型。
在本文中,我们将探讨实例分割及其与语义分割等其他计算机视觉任务的不同之处,并讨论它的一些应用。我们还将介绍如何使用Ultralytics Python 软件包和Ultralytics HUB 平台来使用 YOLO11 实例分割模型。让我们开始吧!
实例分割可用于识别图像中的对象,并在像素级对其进行勾勒。这一过程通常包括首先检测对象并在其周围绘制边界框。然后,分割算法会对边界框内的每个像素进行分类,为每个对象创建精确的遮罩。
实例分割也不同于语义分割和全景分割等任务。语义分割是根据物体的一般类别来标记每个像素,而不区分单个实例。另一方面,全景分割结合了实例分割和语义分割,为每个像素标注类别和实例 ID,从而识别每个类别中的单个对象。
实例分割的功能可应用于各种场景,这些场景可能需要不同的模型。例如,轻量级模型可能非常适合移动应用中的实时处理,而更复杂的模型则可用于高精度任务,如制造业中的质量控制。
与以前的模型一样,实例分割模型 YOLO11实例分割模式也有几种变化,具体取决于您的需求。这些变体包括 YOLO11n-seg(纳米)、YOLO11s-seg(小型)、YOLO11m-seg(中型)、YOLO11l-seg(大型)和 YOLO11x-seg(超大型)。这些型号在尺寸、处理速度、精确度和所需计算能力方面各不相同。根据您的具体要求,您可以选择最适合您应用的型号。
YOLO11 先进的实例分割功能为各行各业开辟了一系列应用领域。让我们来详细了解其中的一些应用。
石油和天然气开采需要管理极高的压力波动。天然气燃烧等技术有助于烧掉石油开采过程中产生的天然气。为了安全起见,有必要这样做。例如,在原油开采过程中,压力突然或大幅飙升可能会导致爆炸。石油和天然气制造行业的工业事故虽然并不常见,但也会导致难以控制的大火。气体燃烧可以帮助操作员安全地为设备减压,并通过燃烧掉多余的气体来控制不可预测的巨大压力波动。
人工智能系统可以改善这一监测过程,使用基于实例分割的燃烧监测系统可以降低事故风险。出于环保原因,监测天然气燃烧也很重要,因为过多的燃烧会对环境造成负面影响。
Ultralytics YOLO11 实例分割模型可用于监测燃烧造成的火量和烟量。可以计算出检测和分割的火苗和烟雾的像素面积。利用这些信息,操作人员可以实时了解燃烧造成的火光和烟雾,帮助他们防止事故和对环境的负面影响。
废物管理和回收设施的工作人员可以使用基于YOLO11 实例分割的系统来识别塑料废料。YOLO11 可以与机器人分拣系统集成,以准确识别不同的废料,如纸板和塑料(分别处理)。考虑到在全球产生的 70 亿吨塑料垃圾中,只有约 10% 得到回收利用,这一点尤为重要。
与工人手工分拣物品的传统方法相比,自动识别和分拣塑料垃圾大大减少了所需时间。计算机视觉模型甚至可以分割软塑料,如包装纸和包装袋,因为它们经常会缠绕在一起,所以特别具有挑战性。YOLO11 模型还可以进行定制训练,以分割不同类型的塑料。我们将在下面的章节中详细介绍如何自定义训练 YOLO11 模型。
实例分割技术的另一个有趣应用案例是自动 驾驶 汽车。YOLO11 ,通过在像素级别准确识别物体,自动驾驶汽车能够提高乘客的安全和道路上其他人的安全。汽车的车载摄像系统可以捕捉周围环境的图像,并通过YOLO11 和实例分割对其进行分析。图像中的每个物体(行人、交通信号灯、其他车辆等)都会被分割,并被赋予一个标签。这样的精确度使自动驾驶汽车能够识别周围的每一个物体。
现在,我们已经探索了实例分割并讨论了它的一些应用,让我们看看如何使用Ultralytics YOLO11 模型来尝试它。
有两种方法:可以使用Ultralytics Python 软件包,也可以使用Ultralytics HUB。我们将从Python 软件包开始探讨这两种方法。
运行推理包括使用模型分析以前未见过的新数据。要通过代码使用YOLO11 实例分割模型运行推理,我们需要使用 pip、conda 或 docker 安装Ultralytics Python 软件包。如果您在安装过程中遇到任何问题,可以参考我们的《常见问题指南》来协助排除故障。安装软件包后,就可以运行下图所示的代码来加载YOLO11 实例分割模型,并在映像上运行预测。
通过相同的代码设置,您还可以训练一个自定义的YOLO11 模型。通过对 YOLO11 模型进行微调,您可以创建一个定制版本的模型,以更好地满足您的特定项目要求。例如,零售商可以使用自定义模型来准确划分客户的身体特征,从而推荐合适的服装。下面的代码片段展示了如何加载和训练用于实例细分的YOLO11 模型。您可以从YAML 配置或预训练模型开始,转移权重,并在COCO 等数据集上进行训练,以实现有效的细分。
完成后,您就可以使用自定义模型对具体应用进行推断。使用导出选项,您还可以将自定义模型导出为不同的格式。
既然我们已经探索了通过代码运行推论和自定义训练YOLO11 实例分割模型,那么让我们来看看一种无需代码的替代方法:Ultralytics HUB。Ultralytics HUB 是一个直观的 Vision AI 平台,可以简化YOLO 模型(包括YOLO11 实例分割模型)的训练和部署过程。
要对图像进行推理,您只需创建一个账户,进入 "模型 "部分,然后选择YOLO11 实例分割模型变体。您可以上传图像,并在预览部分查看预测结果,如下图所示。
YOLO11 提供可靠的实例分割功能,为各行各业带来了无限可能。从提高自动驾驶汽车的安全性、监控石油和天然气行业的天然气燃烧,到回收设施的垃圾自动分类,YOLO11的像素级精度使其成为复杂细分任务的理想选择。
通过Ultralytics Python 软件包的定制培训选项和Ultralytics HUB 的无代码设置选项,用户可以将YOLO11 无缝集成到他们的工作流程中。无论是工业应用、医疗保健、零售还是环境监测,YOLO11 都能带来灵活性和准确性,满足不同的细分需求。
要了解更多信息,请访问我们的GitHub 存储库,并与我们的社区互动。在我们的解决方案页面探索人工智能在自动驾驶汽车和农业中的应用。🚀