Khám phá cách phân đoạn trường hợp tinh chỉnh khả năng phát hiện đối tượng với độ chính xác đến từng pixel, cho phép tạo mặt nạ đối tượng chi tiết cho các ứng dụng AI.
Phân đoạn thể hiện là một kỹ thuật thị giác máy tính tinh vi giúp tinh chỉnh việc phát hiện đối tượng bằng cách không chỉ xác định các đối tượng trong một hình ảnh mà còn phân định ranh giới chính xác của từng đối tượng ở cấp độ pixel. Không giống như các phương pháp đơn giản hơn, phân đoạn thể hiện phân biệt giữa các thể hiện riêng lẻ của cùng một lớp đối tượng, cung cấp mặt nạ chi tiết cho từng đối tượng trong cảnh. Mức độ hiểu biết chi tiết này khiến nó trở nên vô giá đối với các ứng dụng yêu cầu nhận dạng và tách biệt đối tượng chính xác.
Phân đoạn thể hiện vượt ra ngoài phạm vi phát hiện đối tượng cơ bản, tức là vẽ các hộp giới hạn xung quanh các đối tượng, và phân đoạn ngữ nghĩa , tức là dán nhãn cho từng pixel trong hình ảnh bằng một lớp nhưng không phân biệt giữa các đối tượng riêng lẻ của cùng một lớp. Thay vào đó, phân đoạn thể hiện xác định duy nhất từng thể hiện đối tượng, ngay cả khi chúng chồng chéo lên nhau. Ví dụ, trong một hình ảnh có nhiều ô tô, phân đoạn thể hiện không chỉ nhận dạng tất cả chúng là 'ô tô' mà còn tạo ra một mặt nạ riêng biệt, hoàn hảo đến từng pixel cho từng ô tô, phân biệt chúng với nhau và với nền. Khả năng này rất quan trọng trong các tình huống mà việc đếm từng đối tượng hoặc phân tích hình dạng cụ thể của chúng là quan trọng.
Mặc dù có liên quan, phân đoạn trường hợp lại khác đáng kể so với các tác vụ thị giác máy tính khác:
Độ chính xác của phân đoạn trường hợp làm cho nó trở nên cần thiết trong nhiều lĩnh vực:
Các mô hình Ultralytics YOLO đi đầu trong phân đoạn phiên bản thời gian thực, cung cấp các mô hình như Ultralytics YOLOv8 và Ultralytics YOLO11 có khả năng thực hiện phân đoạn phiên bản với độ chính xác và tốc độ cao. Các mô hình này có thể dễ dàng được đào tạo trên các tập dữ liệu tùy chỉnh và triển khai bằng Ultralytics HUB để quản lý và triển khai mô hình hợp lý. Để bắt đầu phân đoạn phiên bản, bạn có thể khám phá các tài nguyên như cách sử dụng Ultralytics YOLO11 để phân đoạn phiên bản và tìm hiểu về phân đoạn với các mô hình Ultralytics YOLOv8 được đào tạo trước trong Python .