Khám phá Non-Maximum Suppression (NMS) để phát hiện đối tượng. Tìm hiểu cách nó tinh chỉnh kết quả, tăng cường độ chính xác và hỗ trợ các ứng dụng AI như YOLO .
Non-Maximum Suppression (NMS) là một kỹ thuật hậu xử lý quan trọng được sử dụng trong thị giác máy tính , đặc biệt là trong các đường ống phát hiện đối tượng . Chức năng chính của nó là dọn dẹp đầu ra thô từ các mô hình phát hiện, thường xác định nhiều hộp giới hạn chồng chéo cho cùng một đối tượng. Bằng cách lọc thông minh các hộp dư thừa này, NMS đảm bảo rằng mỗi đối tượng riêng biệt trong một khung hình ảnh hoặc video được biểu diễn bằng một hộp giới hạn tối ưu duy nhất, cải thiện đáng kể độ rõ nét và độ chính xác của kết quả phát hiện.
Các mô hình phát hiện đối tượng thường tạo ra nhiều hộp giới hạn tiềm năng xung quanh các đối tượng, mỗi hộp có một điểm tin cậy liên quan cho biết khả năng hộp chứa một đối tượng và thuộc về một lớp cụ thể. NMS hoạt động bằng cách giảm một cách có hệ thống các đề xuất này dựa trên điểm tin cậy và chồng lấn không gian của chúng. Quá trình này thường bao gồm việc sắp xếp tất cả các hộp được phát hiện theo điểm tin cậy của chúng theo thứ tự giảm dần. Hộp có điểm tin cậy cao nhất được chọn làm phát hiện cuối cùng. Sau đó, tất cả các hộp khác chồng lấn đáng kể với hộp đã chọn này (trên ngưỡng Giao điểm trên Liên hợp (IoU) được xác định trước) sẽ bị loại bỏ hoặc triệt tiêu. Quy trình này lặp lại theo từng bước với các hộp còn lại cho đến khi tất cả các hộp đã được chọn hoặc triệt tiêu. Điều này đảm bảo chỉ còn lại các hộp không chồng lấn, tự tin nhất, cung cấp đầu ra sạch hơn như đã giải thích trong các tài nguyên như Tìm hiểu giải thích NMS của OpenCV .
Trong Trí tuệ nhân tạo ( AI ) và Học máy ( ML ), NMS rất quan trọng để đạt được hiệu suất phát hiện đối tượng đáng tin cậy, đặc biệt là với các mô hình như Ultralytics YOLO . Nếu không có NMS, đầu ra sẽ lộn xộn với nhiều hộp cho các đối tượng đơn lẻ, dẫn đến các lỗi tiềm ẩn trong các tác vụ hạ nguồn như theo dõi đối tượng hoặc hiểu cảnh. Bằng cách loại bỏ các phát hiện dư thừa này (thường được gọi là kết quả dương tính giả), NMS cải thiện đáng kể độ chính xác của các dự đoán của mô hình. Sự tinh chỉnh này rất quan trọng đối với các ứng dụng đòi hỏi độ tin cậy cao. Bạn có thể khám phá cách các số liệu như Độ chính xác trung bình trung bình (mAP) được tính toán sau NMS trong hướng dẫn Số liệu hiệu suất YOLO .
NMS đóng vai trò cơ bản trong nhiều ứng dụng AI thực tế:
NMS là bước xử lý hậu kỳ được áp dụng sau khi mô hình tạo ra các phát hiện ban đầu. Nó khác với cơ chế phát hiện, chẳng hạn như các cơ chế được sử dụng bởi các bộ phát hiện dựa trên neo hoặc các bộ phát hiện không có neo . Trong khi các kiến trúc này xác định cách các hộp ứng viên được đề xuất, NMS tinh chỉnh các đề xuất này. Điều thú vị là những tiến bộ gần đây đã dẫn đến các mô hình hướng đến phát hiện không có NMS, chẳng hạn như YOLOv10 , tích hợp các cơ chế để tránh các dự đoán trùng lặp trong quá trình đào tạo, có khả năng giảm độ trễ suy luận . Điều này trái ngược với các phương pháp tiếp cận truyền thống như YOLOv8 hoặc YOLOv5 , trong đó NMS là một phần tiêu chuẩn của quy trình suy luận. Bạn có thể tìm thêm các so sánh giữa các mô hình như YOLO11 so với YOLOv10 trong tài liệu của chúng tôi.
NMS được tích hợp liền mạch trong Ultralytics hệ sinh thái. Ultralytics YOLO Các mô hình áp dụng NMS theo mặc định trong các giai đoạn dự đoán và xác thực để đảm bảo đầu ra sạch và chính xác. Các công cụ như Ultralytics HUB đơn giản hóa quy trình hơn nữa, cho phép người dùng đào tạo và triển khai các mô hình trong đó NMS được xử lý tự động, giúp phát hiện đối tượng nâng cao có thể truy cập được ngay cả khi không có chuyên môn kỹ thuật sâu. Có thể khám phá các chi tiết triển khai cơ bản trong tài liệu tham khảo tiện ích Ultralytics . Sự tích hợp này đảm bảo người dùng được hưởng lợi từ các kết quả phát hiện được tối ưu hóa ngay khi xuất xưởng cho nhiều tác vụ thị giác máy tính khác nhau. Bạn cũng có thể khám phá các khái niệm AI khác trong Thuật ngữ Ultralytics .