Khám phá sức mạnh của phân đoạn hình ảnh với Ultralytics YOLO . Khám phá độ chính xác ở cấp độ pixel, các loại, ứng dụng và trường hợp sử dụng AI trong thế giới thực.
Phân đoạn hình ảnh là một kỹ thuật cơ bản trong thị giác máy tính (CV) liên quan đến việc phân vùng một hình ảnh kỹ thuật số thành nhiều vùng hoặc phân đoạn riêng biệt. Mục tiêu chính là gán nhãn lớp cho mọi pixel trong hình ảnh, về cơ bản là đơn giản hóa biểu diễn hình ảnh thành thứ gì đó có ý nghĩa hơn và dễ phân tích hơn đối với máy móc. Không giống như phát hiện đối tượng , xác định đối tượng bằng hộp giới hạn hình chữ nhật, phân đoạn hình ảnh cung cấp sự hiểu biết chi tiết hơn nhiều ở cấp độ pixel về nội dung hình ảnh, phác thảo hình dạng chính xác của đối tượng. Độ chính xác này rất quan trọng đối với các tác vụ đòi hỏi nhận thức không gian chi tiết.
Thuật toán phân đoạn hình ảnh hoạt động bằng cách kiểm tra từng pixel của hình ảnh và nhóm các pixel có chung một số đặc điểm nhất định—chẳng hạn như màu sắc, cường độ, kết cấu hoặc vị trí không gian—thành các phân đoạn. Các phương pháp ban đầu dựa vào các kỹ thuật như ngưỡng, phát triển vùng và phân cụm ( K-Means , DBSCAN ). Tuy nhiên, các phương pháp tiếp cận hiện đại tận dụng rất nhiều học sâu (DL) , đặc biệt là Mạng nơ-ron tích chập (CNN) . Các mạng nơ-ron này học các tính năng phân cấp phức tạp trực tiếp từ dữ liệu đào tạo để thực hiện phân loại từng pixel. Đầu ra điển hình là mặt nạ phân đoạn, một hình ảnh trong đó giá trị của mỗi pixel tương ứng với nhãn lớp mà nó thuộc về, làm nổi bật trực quan các ranh giới chính xác của các đối tượng hoặc vùng. Các khung như PyTorch và TensorFlow thường được sử dụng để xây dựng và đào tạo các mô hình này.
Nhiệm vụ phân đoạn hình ảnh có thể khác nhau tùy thuộc vào cách xử lý các đối tượng và lớp:
Phân tích chi tiết do phân đoạn hình ảnh cung cấp cho phép nhiều ứng dụng:
Các mô hình YOLO Ultralytics , chẳng hạn như YOLOv8 và YOLO11 , cung cấp hiệu suất tiên tiến cho các tác vụ phân đoạn, cân bằng tốc độ và độ chính xác để suy luận theo thời gian thực . Ultralytics framework đơn giản hóa quá trình đào tạo các mô hình phân đoạn tùy chỉnh trên các tập dữ liệu như COCO hoặc các tập dữ liệu chuyên biệt như phân đoạn phụ tùng ô tô hoặc vết nứt . Các công cụ như Ultralytics HUB cung cấp một nền tảng hợp lý để quản lý các tập dữ liệu, đào tạo các mô hình ( có đào tạo đám mây ) và triển khai chúng. Bạn có thể khám phá tài liệu về tác vụ phân đoạn để biết chi tiết triển khai hoặc làm theo các hướng dẫn như phân đoạn với các mô hình YOLOv8 được đào tạo trước hoặc phân đoạn hình ảnh với YOLO11 trên Google Colab .