通过Ultralytics YOLO 探索图像分割的强大功能。探索像素级精度、类型、应用和真实的人工智能使用案例。
图像分割是计算机视觉(CV)中的一项基本技术,它将数字图像分割成多个不同的区域或片段。其主要目的是为图像中的每个像素分配一个类别标签,从本质上将图像表示简化为更有意义、更易于机器分析的图像。物体检测使用矩形边框来识别物体,而图像分割则不同,它提供了对图像内容更精细的像素级理解,勾勒出物体的确切形状。这种精确性对于需要详细空间感知的任务来说至关重要。
图像分割算法的工作原理是逐个像素检查图像,并将具有某些共同特征(如颜色、强度、纹理或空间位置)的像素组合成片段。早期的方法依赖于阈值处理、区域增长和聚类(K-Means、DBSCAN)等技术。然而,现代方法则大量采用深度学习(DL),特别是卷积神经网络(CNN)。这些神经网络直接从训练数据中学习复杂的分层特征,以执行像素分类。典型的输出是分割掩码,即每个像素的值对应其所属类别标签的图像,直观地突出对象或区域的精确边界。像 PyTorch和 TensorFlow等框架通常用于构建和训练这些模型。
图像分割任务可根据处理对象和类别的方式而有所不同:
图像分割所提供的详细分析可实现多种应用:
Ultralytics YOLO模型,如 YOLOv8和 YOLO11为实例分割任务提供了最先进的性能,同时兼顾了实时推理的速度和准确性。Ultralytics 框架简化了在COCO等数据集或汽车零部件或裂缝分割等专业数据集上训练自定义分割模型的过程。Ultralytics HUB等工具为管理数据集、训练模型(提供云训练)和部署模型提供了一个简化的平台。您可以查看细分任务文档,了解实施细节,也可以在Google Colab 上查看使用预训练YOLOv8 模型进行细分或使用YOLO11 进行图像细分等指南。