Phân đoạn hình ảnh là một kỹ thuật thị giác máy tính quan trọng giúp tinh chỉnh khả năng hiểu hình ảnh vượt ra ngoài phạm vi phát hiện đối tượng đơn giản. Thay vì chỉ vẽ các hộp giới hạn xung quanh đối tượng, phân đoạn hình ảnh liên quan đến việc gán nhãn cho từng pixel trong hình ảnh. Phân loại cấp độ pixel này cho phép hiểu chi tiết hình ảnh bằng cách phân biệt các đối tượng và vùng một cách chính xác, tạo thành cơ sở cho nhiều ứng dụng tiên tiến trong trí tuệ nhân tạo.
Các loại phân đoạn hình ảnh
Có một số loại phân đoạn hình ảnh, mỗi loại cung cấp một cách tiếp cận riêng để phân tích hình ảnh:
- Phân đoạn ngữ nghĩa : Kiểu này phân loại từng pixel trong ảnh thành các lớp ngữ nghĩa. Ví dụ, trong cảnh đường phố, tất cả các pixel thuộc về 'đường' được gắn nhãn cùng nhau, cũng như tất cả các pixel thuộc về 'ô tô', mà không phân biệt giữa các trường hợp ô tô riêng lẻ. Tìm hiểu thêm về phân đoạn ngữ nghĩa và các ứng dụng của nó.
- Phân đoạn thể hiện : Đi xa hơn một bước, phân đoạn thể hiện không chỉ phân loại pixel mà còn phân biệt giữa các thể hiện riêng lẻ của cùng một lớp đối tượng. Trong cùng một ví dụ về cảnh đường phố, mỗi chiếc xe sẽ được phân đoạn thành một thể hiện riêng biệt, ngay cả khi chúng thuộc cùng một lớp 'xe hơi'. Khám phá phân đoạn thể hiện để hiểu độ chính xác của nó trong việc phân biệt đối tượng.
- Phân đoạn toàn cảnh : Đây là dạng phân đoạn hình ảnh toàn diện nhất, kết hợp cả phân đoạn ngữ nghĩa và phân đoạn thể hiện. Nó nhận dạng và phân đoạn tất cả các đối tượng (vật) và vùng nền (đồ vật) trong một hình ảnh, cung cấp phân tích cảnh hoàn chỉnh và chi tiết. Khám phá phân đoạn toàn cảnh để có cái nhìn toàn diện về việc hiểu hình ảnh.
Ứng dụng của phân đoạn hình ảnh
Phân đoạn hình ảnh không chỉ là một khái niệm lý thuyết; nó được áp dụng trong nhiều tình huống thực tế, tác động đáng kể đến nhiều ngành công nghiệp khác nhau:
- Phân tích hình ảnh y tế : Trong chăm sóc sức khỏe, phân đoạn hình ảnh vô cùng có giá trị trong việc phân tích các hình ảnh quét y tế như hình ảnh MRI và CT. Nó giúp phân định khối u, cơ quan và các khu vực quan trọng khác, hỗ trợ chẩn đoán, lập kế hoạch điều trị và phân tích hình ảnh y tế . Ví dụ, Ultralytics YOLO có thể được sử dụng để phát hiện khối u trong hình ảnh y tế , nâng cao độ chính xác của chẩn đoán.
- Lái xe tự động : Xe tự lái phụ thuộc rất nhiều vào phân đoạn hình ảnh để hiểu môi trường xung quanh. Phân đoạn mặt đường, người đi bộ, phương tiện và biển báo giao thông cho phép xe tự hành điều hướng an toàn và đưa ra quyết định sáng suốt theo thời gian thực. Khám phá thêm về AI trong xe tự lái và cách phân đoạn góp phần vào an toàn giao thông.
- Nông nghiệp : Nông nghiệp chính xác được hưởng lợi rất nhiều từ phân đoạn hình ảnh. Nó có thể được sử dụng để phân tích hình ảnh vệ tinh hoặc máy bay không người lái của các cánh đồng để theo dõi sức khỏe cây trồng, phát hiện bệnh tật và tối ưu hóa tưới tiêu và bón phân, dẫn đến tăng năng suất và quản lý tài nguyên hiệu quả. Tìm hiểu về những lợi ích hàng đầu của việc sử dụng AI thị giác cho nông nghiệp và cách phân đoạn hình ảnh đóng vai trò quan trọng.
Phân đoạn hình ảnh và Ultralytics YOLO
Các mô hình YOLO Ultralytics đi đầu trong phân đoạn hình ảnh theo thời gian thực, mang lại hiệu suất và hiệu quả tiên tiến. Được biết đến với tốc độ và độ chính xác trong phát hiện đối tượng, Ultralytics YOLO các mô hình cũng vượt trội trong các nhiệm vụ phân đoạn, cung cấp các giải pháp mạnh mẽ cho cả ứng dụng nghiên cứu và công nghiệp. Nền tảng Ultralytics HUB đơn giản hóa quy trình đào tạo, triển khai và quản lý YOLO mô hình phân đoạn, giúp công nghệ thị giác máy tính tiên tiến có thể tiếp cận được với nhiều đối tượng hơn.
Đối với việc triển khai thực tế, các nguồn như bài đăng trên blog về phân đoạn với các mô hình Ultralytics YOLOv8 được đào tạo trước bằng Python và hướng dẫn về cách sử dụng Ultralytics YOLO cho phân đoạn ví dụ cung cấp thông tin chi tiết có giá trị và hướng dẫn từng bước để tận dụng Ultralytics YOLO cho các dự án phân đoạn hình ảnh.