Khám phá cách phân đoạn trường hợp tinh chỉnh khả năng phát hiện đối tượng với độ chính xác đến từng pixel, cho phép tạo mặt nạ đối tượng chi tiết cho các ứng dụng AI.
Phân đoạn thể hiện là một kỹ thuật thị giác máy tính tinh vi giúp xác định các đối tượng trong một hình ảnh và phân định ranh giới chính xác của từng thể hiện riêng lẻ ở cấp độ pixel. Điều này cung cấp sự hiểu biết chi tiết hơn nhiều về một cảnh so với việc chỉ vẽ các hộp xung quanh các đối tượng, cho phép các ứng dụng trí tuệ nhân tạo (AI) tiên tiến trong đó hình dạng và sự tách biệt chính xác là rất quan trọng.
Vượt xa các phương pháp đơn giản hơn, phân đoạn thể hiện tạo ra một mặt nạ duy nhất cho mọi đối tượng được phát hiện, ngay cả khi nhiều đối tượng thuộc cùng một danh mục (như xác định từng chiếc xe riêng biệt trong ảnh giao thông). Phác thảo hoàn hảo đến từng pixel này cho phép các hệ thống hiểu không chỉ những đối tượng nào hiện diện mà còn hiểu hình dạng, kích thước và vị trí chính xác của chúng, phân biệt các mục chồng chéo một cách hiệu quả. Khả năng này rất quan trọng đối với các nhiệm vụ đòi hỏi nhận thức không gian chính xác và độ chính xác cao.
Điều quan trọng là phải phân biệt phân đoạn trường hợp với các tác vụ thị giác máy tính liên quan:
Phân đoạn trường hợp tập trung cụ thể vào việc xác định và phác thảo các đối tượng riêng biệt .
Các phương pháp tiếp cận truyền thống, như Mask R-CNN nổi tiếng, thường sử dụng quy trình hai giai đoạn: đầu tiên phát hiện các đối tượng có hộp giới hạn, sau đó tạo mặt nạ bên trong các hộp đó. Mặc dù chính xác, nhưng điều này có thể tốn nhiều tài nguyên tính toán. Các phương pháp hiện đại hơn, một giai đoạn, bao gồm các biến thể của Ultralytics YOLO , dự đoán các hộp giới hạn và mặt nạ đồng thời, đạt được hiệu suất nhanh hơn phù hợp với suy luận thời gian thực . Các mô hình này được đào tạo trên các tập dữ liệu lớn như COCO , bao gồm chú thích phân đoạn ( COCO Segmentation Dataset ).
Kết quả chi tiết của phân đoạn trường hợp có giá trị vô cùng to lớn trong nhiều lĩnh vực:
Ultralytics cung cấp các mô hình tiên tiến có khả năng phân đoạn phiên bản hiệu suất cao. Các mô hình như Ultralytics YOLOv8 và Ultralytics YOLO11 mới hơn cung cấp các trọng số được đào tạo trước cho các tác vụ phân đoạn và có thể dễ dàng được đào tạo tùy chỉnh trên các tập dữ liệu cụ thể. Bạn có thể tìm hiểu cách sử dụng YOLO11 để phân đoạn phiên bản hoặc khám phá phân đoạn với các mô hình YOLOv8 được đào tạo trước . Quản lý tập dữ liệu, đào tạo và triển khai được hợp lý hóa bằng Ultralytics HUB . Để biết so sánh hiệu suất chi tiết, hãy xem YOLO11 so với YOLOv8 . Tài liệu về tác vụ phân đoạn cung cấp thêm hướng dẫn.