Thuật ngữ

Phân đoạn trường hợp

Khám phá cách phân đoạn trường hợp tinh chỉnh khả năng phát hiện đối tượng với độ chính xác đến từng pixel, cho phép tạo mặt nạ đối tượng chi tiết cho các ứng dụng AI.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Phân đoạn thể hiện là một kỹ thuật thị giác máy tính tinh vi giúp tinh chỉnh việc phát hiện đối tượng bằng cách không chỉ xác định các đối tượng trong một hình ảnh mà còn phân định ranh giới chính xác của từng đối tượng ở cấp độ pixel. Không giống như các phương pháp đơn giản hơn, phân đoạn thể hiện phân biệt giữa các thể hiện riêng lẻ của cùng một lớp đối tượng, cung cấp mặt nạ chi tiết cho từng đối tượng trong cảnh. Mức độ hiểu biết chi tiết này khiến nó trở nên vô giá đối với các ứng dụng yêu cầu nhận dạng và tách biệt đối tượng chính xác.

Phân đoạn phiên bản là gì?

Phân đoạn thể hiện vượt ra ngoài phạm vi phát hiện đối tượng cơ bản, tức là vẽ các hộp giới hạn xung quanh các đối tượng, và phân đoạn ngữ nghĩa , tức là dán nhãn cho từng pixel trong hình ảnh bằng một lớp nhưng không phân biệt giữa các đối tượng riêng lẻ của cùng một lớp. Thay vào đó, phân đoạn thể hiện xác định duy nhất từng thể hiện đối tượng, ngay cả khi chúng chồng chéo lên nhau. Ví dụ, trong một hình ảnh có nhiều ô tô, phân đoạn thể hiện không chỉ nhận dạng tất cả chúng là 'ô tô' mà còn tạo ra một mặt nạ riêng biệt, hoàn hảo đến từng pixel cho từng ô tô, phân biệt chúng với nhau và với nền. Khả năng này rất quan trọng trong các tình huống mà việc đếm từng đối tượng hoặc phân tích hình dạng cụ thể của chúng là quan trọng.

Phân đoạn trường hợp so với các tác vụ liên quan

Mặc dù có liên quan, phân đoạn trường hợp lại khác đáng kể so với các tác vụ thị giác máy tính khác:

  • Phát hiện đối tượng : Phát hiện đối tượng tập trung vào việc xác định và định vị các đối tượng trong một hình ảnh bằng cách vẽ các hộp giới hạn xung quanh chúng. Nó cho bạn biết đối tượng là ở đâu , nhưng không cho biết hình dạng hoặc ranh giới chính xác của chúng.
  • Phân đoạn ngữ nghĩa : Phân đoạn ngữ nghĩa phân loại từng pixel trong hình ảnh thành các lớp được xác định trước, chẳng hạn như 'bầu trời', 'đường' hoặc 'ô tô'. Nó cung cấp sự hiểu biết ở cấp độ pixel về cảnh nhưng không phân biệt giữa các trường hợp riêng biệt của cùng một lớp đối tượng. Ví dụ, tất cả ô tô được gắn nhãn là pixel 'ô tô', nhưng không được phân biệt là các đối tượng riêng lẻ.
  • Phân đoạn thể hiện : Phân đoạn thể hiện kết hợp thế mạnh của cả hai. Nó thực hiện phân loại cấp độ pixel như phân đoạn ngữ nghĩa, nhưng cũng phân biệt và phân đoạn từng thể hiện đối tượng riêng lẻ, giống như phát hiện đối tượng, cung cấp hiểu biết toàn diện và chi tiết về các đối tượng trong hình ảnh.

Ứng dụng của Phân đoạn trường hợp

Độ chính xác của phân đoạn trường hợp làm cho nó trở nên cần thiết trong nhiều lĩnh vực:

  • Lái xe tự động : Trong xe tự lái , phân đoạn trường hợp có thể giúp xe hiểu được môi trường xung quanh bằng cách xác định và theo dõi chính xác từng người đi bộ, xe cộ và chướng ngại vật trên đường. Nhận thức chi tiết này rất quan trọng để điều hướng an toàn và ra quyết định trong các tình huống giao thông phức tạp.
  • Phân tích hình ảnh y tế : Trong chăm sóc sức khỏe , phân đoạn trường hợp là vô giá đối với phân tích hình ảnh y tế. Nó có thể được sử dụng để phân đoạn chính xác từng tế bào, khối u hoặc cơ quan từ các lần quét y tế như MRI hoặc CT, hỗ trợ chẩn đoán, lập kế hoạch điều trị và theo dõi tiến triển của bệnh. Ví dụ, Ultralytics YOLOv8 có thể được sử dụng để phát hiện khối u trong hình ảnh y tế , tận dụng phân đoạn trường hợp để định vị và phân định chính xác khối u.
  • Robot : Đối với robot tương tác với thế giới thực, phân đoạn trường hợp cung cấp sự hiểu biết chi tiết về bối cảnh cần thiết cho các nhiệm vụ phức tạp. Cho dù đó là cánh tay robot nhặt đồ trong kho hay robot dịch vụ điều hướng trong môi trường động, việc biết hình dạng và vị trí chính xác của từng đối tượng là rất quan trọng để vận hành hiệu quả và an toàn.

Phân đoạn trường hợp và Ultralytics YOLO

Các mô hình Ultralytics YOLO đi đầu trong phân đoạn phiên bản thời gian thực, cung cấp các mô hình như Ultralytics YOLOv8Ultralytics YOLO11 có khả năng thực hiện phân đoạn phiên bản với độ chính xác và tốc độ cao. Các mô hình này có thể dễ dàng được đào tạo trên các tập dữ liệu tùy chỉnh và triển khai bằng Ultralytics HUB để quản lý và triển khai mô hình hợp lý. Để bắt đầu phân đoạn phiên bản, bạn có thể khám phá các tài nguyên như cách sử dụng Ultralytics YOLO11 để phân đoạn phiên bản và tìm hiểu về phân đoạn với các mô hình Ultralytics YOLOv8 được đào tạo trước trong Python .

Đọc tất cả