术语表

语义分割

发现语义分割的强大功能--分类图像中的每个像素,精确理解场景。立即探索应用和工具!

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

语义分割是计算机视觉中的一项基本任务,涉及为图像中的每个像素分配特定的类别标签。与其他可能识别物体或对整个图像进行分类的视觉任务不同,语义分割提供了对场景内容的密集、像素级的理解。这意味着它不仅能检测出是否有汽车,还能精确勾勒出哪些像素属于汽车类别,将它们与属于道路、天空或行人的像素区分开来。

什么是语义分割?

语义分割的主要目的是将图像分割成与不同对象类别相对应的有意义的区域。例如,在一幅包含多辆汽车、行人和树木的图像中,语义分割模型会将组成任何一辆汽车的所有像素标记为 "汽车",将组成任何一个行人的所有像素标记为 "行人",将组成任何一棵树的所有像素标记为 "树"。它对同一对象类别的所有实例一视同仁。这与图像分类物体检测形成了鲜明对比,图像分类会给整个图像分配一个标签,而物体检测会在检测到的物体周围画出边界框,但不会勾勒出物体的确切形状。

语义分割模型通常使用监督学习技术进行训练,需要带有详细像素级注释的数据集。输出结果通常是分割图,即每个像素的值(或颜色)与其预测类别标签相对应的图像。

与其他细分任务的主要区别

将语义分割与相关任务区分开来非常重要:

  • 实例分割语义分割会将属于 "汽车 "类别的所有像素标记为相同,而实例分割则更进一步。它能单独识别和分割对象的每个实例。因此,图像中的三辆不同的汽车将分别获得一个独特的分割掩码,尽管它们都属于 "汽车 "类。您可以学习如何使用Ultralytics YOLO 进行实例分割
  • 全景分割这项任务结合了语义分割和实例分割。它为每个像素分配一个类别标签(如语义分割),同时也能唯一识别每个对象实例(如实例分割),从而提供统一的场景理解。

语义分割的应用

语义分割所提供的详细场景理解对现实世界的许多应用都至关重要:

  1. 自动驾驶自动驾驶汽车主要依靠语义分割来了解周围环境。通过将像素划分为 "道路"、"人行道"、"行人"、"车辆 "和 "障碍物 "等类别,自动驾驶系统可以做出有关导航和安全的明智决策。
  2. 医学图像分析在医疗保健领域,语义分割有助于分析核磁共振成像或 CT 等医学扫描图像。它可以精确地勾勒出器官、组织或肿瘤等异常部位的轮廓,帮助医生进行诊断、制定治疗计划和监测疾病进展。例如,Ultralytics YOLO 模型可用于肿瘤检测
  3. 卫星图像分析用于划分土地覆被类型(如森林、水域、城市区域)、监测森林砍伐、绘制城市扩张图或评估精准农业中的作物健康状况。视觉人工智能为农业带来了许多好处
  4. 机器人使机器人能够更细致地感知周围环境,这对于在复杂环境中执行物体操作和导航等任务是必不可少的。了解更多有关在机器人技术中集成计算机视觉的信息。

模型和工具

语义分割通常采用深度学习模型,尤其是卷积神经网络(CNN)。像全卷积网络(FCN)U-Net这样的架构是最受欢迎的选择。现代模型如 Ultralytics YOLOv8等现代模型也为细分任务提供了强大的功能。Ultralytics HUB等工具为训练、管理COCO 等数据集和高效部署细分模型提供了平台。

阅读全部