术语表

图像分割

通过Ultralytics YOLO 探索图像分割的强大功能。探索像素级精度、类型、应用和真实的人工智能使用案例。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

图像分割是计算机视觉(CV)中的一项基本技术,它将数字图像分割成多个不同的区域或片段。其主要目的是为图像中的每个像素分配一个类别标签,从本质上将图像表示简化为更有意义、更易于机器分析的图像。物体检测使用矩形边框来识别物体,而图像分割则不同,它提供了对图像内容更精细的像素级理解,勾勒出物体的确切形状。这种精确性对于需要详细空间感知的任务来说至关重要。

图像分割的工作原理

图像分割算法的工作原理是逐个像素检查图像,并将具有某些共同特征(如颜色、强度、纹理或空间位置)的像素组合成片段。早期的方法依赖于阈值处理、区域增长和聚类(K-MeansDBSCAN)等技术。然而,现代方法则大量采用深度学习(DL),特别是卷积神经网络(CNN)。这些神经网络直接从训练数据中学习复杂的分层特征,以执行像素分类。典型的输出是分割掩码,即每个像素的值对应其所属类别标签的图像,直观地突出对象或区域的精确边界。像 PyTorchTensorFlow等框架通常用于构建和训练这些模型。

图像分割类型

图像分割任务可根据处理对象和类别的方式而有所不同:

  • 语义分割:将每个像素归入一个预定义的类别(如 "汽车"、"道路"、"天空")。它不区分同一对象类别的不同实例。例如,所有汽车都会被贴上相同的标签。
  • 实例分割:比语义分割更进一步,它可以识别和划分图像中的每个单独对象实例。每辆独立的汽车都会有一个独特的标识符或掩码,即使它们属于同一类别。这在需要对单个物体进行计数或跟踪时特别有用。
  • 全景细分:结合语义分割和实例分割。它为每个像素分配一个类别标签(如语义分割),并唯一识别每个对象实例(如实例分割)。它提供了对场景的全面、统一的理解。

区分图像分割与相关术语

  • 图像分割与物体检测物体检测会在物体周围画出边界框,标明物体的位置和类别。图像分割提供了一个像素级的掩码,勾勒出每个对象或区域的确切形状,提供了比简单方框更多的细节。
  • 图像分割与图像分类图像分类为整幅图像指定一个标签(如 "包含一只猫")。图像分割则为图像中的每个像素分配一个标签,识别多个物体或区域及其形状。
  • 图像分割与图像识别图像识别是人工智能在图像中识别物体、人物、地点等任务的广义术语。图像分割是一种特定的图像识别类型,侧重于像素级分割。

实际应用

图像分割所提供的详细分析可实现多种应用:

图像分割和Ultralytics YOLO

Ultralytics YOLO模型,如 YOLOv8YOLO11为实例分割任务提供了最先进的性能,同时兼顾了实时推理的速度和准确性。Ultralytics 框架简化了在COCO等数据集或汽车零部件裂缝分割等专业数据集上训练自定义分割模型的过程。Ultralytics HUB等工具为管理数据集、训练模型(提供云训练)和部署模型提供了一个简化的平台。您可以查看细分任务文档,了解实施细节,也可以在Google Colab 上查看使用预训练YOLOv8 模型进行细分使用YOLO11 进行图像细分等指南。

阅读全部