术语表

全景细分

了解全景分割如何在人工智能应用中统一语义分割和实例分割,以实现精确的像素级场景理解。

全景分割是一项先进的计算机视觉(CV)任务,可提供对整个场景的全面、像素级理解。它将语义分割实例分割这两项独立的任务统一起来。其目标是为图像中的每个像素分配一个类别标签(如汽车、人或天空),并为不同的物体分配一个唯一的实例 ID。这样就能产生比任何一种分割方法都更全面、更详细的输出结果,使机器能够以更接近人类视觉的详细程度感知视觉环境。该术语是由 FAIR 的研究人员在 2018 年发表的开创性论文"Panoptic Segmentation "中提出的。

全景与其他分段类型

要全面掌握全景细分技术,最好将其与各组成部分进行比较:

  • 语义分割这种技术将图像中的每个像素都归入一个特定的类别。例如,它会将属于汽车的所有像素标记为 "汽车",将道路的所有像素标记为 "道路"。但是,它不会区分同一对象类别的不同实例。相邻的两辆汽车都属于同一个 "汽车 "像素图。
  • 实例分割 这种方法可以检测和分割单个物体,这些物体通常被称为 "事物"(如汽车、行人、动物)。它为每个检测到的物体实例分配一个唯一的掩码,例如 car_1, car_2pedestrian_1.然而,实例分割通常会忽略无定形的背景区域或 "东西"(如天空、道路、草地、墙壁),这些区域缺乏明显的形状或数量。
  • 全景细分: 这结合了语义分割和实例分割的优势。它能分割图像中的每个像素,为 "事物 "和 "东西 "提供类别标签。最重要的是,它还能为每个 "事物 "分配一个唯一的实例 ID,从而提供完整统一的场景解释。例如,一个全景模型不仅能标注天空和道路,还能识别和划定 car_1, car_2pedestrian_1 作为单独的实体。这种综合方法对于先进的 人工智能应用.

泛光分色的应用

全景分割所提供的详细场景理解在各个领域都非常宝贵:

  • 自动驾驶汽车自动驾驶汽车需要全面了解周围环境才能安全行驶。全景细分技术使它们能够识别道路和人行道等无定形表面("物"),同时还能区分单个汽车、行人和骑自行车的人("事"),即使它们重叠在一起。正如Waymo 等公司的系统所展示的那样,这种细致的感知对于安全路径规划和决策至关重要。了解 Ultralytics 如何为汽车解决方案中的人工智能做出贡献。
  • 医学图像分析在分析核磁共振成像CT 扫描等医学扫描图像时,全景分割技术可以区分各种组织类型("物"),同时还能识别肿瘤或单个细胞等结构的具体实例("事")。这有助于进行更准确的诊断,帮助制定手术计划,并有助于监测疾病的进展。您可以阅读相关任务,如使用 YOLO11 进行肿瘤检测
  • 机器人学机器人要想与周围环境有效互动,就必须同时了解总体布局(墙壁、地板)和可操作的特定物体(工具、零件)。全景分割技术可提供这种统一的视图,从而改善在仓库和工厂等复杂环境中的导航和人机互动。进一步了解人工智能在机器人技术中的作用。
  • 增强现实(AR):增强现实应用使用全景分割技术将虚拟物体与现实世界无缝融合。通过了解背景表面和前景物体的位置,AR 系统可以逼真地放置虚拟内容,正确处理遮挡。这使得AR 技术取得了重大进展。
  • 卫星图像分析这项技术用于绘制详细的土地覆盖图,区分森林或水体等大面积类型("物")和建筑物或车辆等单个结构("物")。美国地质调查局等政府机构将这些数据用于环境监测和城市规划。

模式与实施

全景分割模型通常使用PyTorch深度学习框架构建,并在COCO-PanopticCityscapes 等大型数据集上进行训练。虽然像YOLO11这样的 Ultralytics 模型在物体检测实例分割等核心任务中提供了最先进的性能,这些都是必不可少的基础模块,但全景分割代表了综合场景理解的下一个层次。随着谷歌人工智能Meta AI等机构的研究不断深入,这些综合模型的能力也在不断提高,为更复杂、更具感知能力的人工智能系统铺平了道路。您可以使用Ultralytics HUB 等平台管理和训练相关任务的模型。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、合作和成长

立即加入
链接复制到剪贴板