Thuật ngữ

Sự ức chế không tối đa (NMS)

Khám phá Non-Maximum Suppression (NMS) để phát hiện đối tượng. Tìm hiểu cách nó tinh chỉnh kết quả, tăng cường độ chính xác và hỗ trợ các ứng dụng AI như YOLO.

Thuật toán Non-Maximum Suppression (NMS) là một thuật toán hậu xử lý cơ bản được sử dụng trong thị giác máy tính , đặc biệt là trong các tác vụ phát hiện đối tượng . Mục đích chính của nó là làm sạch đầu ra của mô hình phát hiện bằng cách lọc bỏ các hộp giới hạn dư thừa và chồng chéo để đảm bảo mỗi đối tượng chỉ được nhận dạng một lần. Khi một mô hình phát hiện đối tượng, chẳng hạn như Ultralytics YOLO , đưa ra dự đoán, nó thường tạo ra nhiều hộp ứng viên xung quanh cùng một đối tượng, mỗi hộp có một điểm tin cậy khác nhau. NMS sẽ thông minh chọn hộp giới hạn tốt nhất cho mỗi đối tượng và loại bỏ, hoặc loại bỏ, tất cả các hộp chồng chéo khác được coi là không tối đa.

Sự ức chế không tối đa hoạt động như thế nào

Thuật toán NMS hoạt động bằng cách lặp lại các hộp giới hạn dự đoán và đưa ra quyết định dựa trên hai chỉ số chính: điểm tin cậy và ngưỡng Giao trên Hợp (IoU) . Quá trình này có thể được tóm tắt trong các bước sau:

  1. Sắp xếp theo Độ tin cậy: Tất cả các hộp giới hạn dự đoán trước tiên được sắp xếp theo thứ tự giảm dần dựa trên điểm tin cậy của chúng. Hộp có điểm cao nhất được coi là có khả năng đúng cao nhất.
  2. Chọn hộp tốt nhất: Hộp giới hạn có điểm tin cậy cao nhất sẽ được chọn và tất cả các hộp khác có IoU cao với hộp được chọn này (tức là chúng chồng lên nhau đáng kể) sẽ bị xóa khỏi danh sách.
  3. Lặp lại: Quá trình được lặp lại với các hộp giới hạn còn lại cho đến khi tất cả các hộp được chọn hoặc ẩn.

Ngưỡng IoU là một siêu tham số quan trọng do người dùng định nghĩa. Ngưỡng IoU thấp sẽ dẫn đến ít phát hiện hơn, vì nó sẽ loại bỏ các hộp có sự chồng chéo dù chỉ nhỏ, trong khi ngưỡng cao có thể cho phép phát hiện nhiều lần cho cùng một đối tượng. Việc tinh chỉnh ngưỡng này thường là một phần của quá trình tối ưu hóa hiệu suất của mô hình trên một tập dữ liệu cụ thể.

Ứng dụng của sự ức chế không tối đa

NMS là thành phần quan trọng trong nhiều ứng dụng AI thực tế dựa trên khả năng phát hiện đối tượng chính xác.

  • Xe tự hành : Trong xe tự lái , hệ thống phát hiện vật thể phải nhận dạng chính xác người đi bộ, người đi xe đạp và các phương tiện khác từ nhiều nguồn dữ liệu đầu vào từ camera và LiDAR. NMS đảm bảo một người đi bộ không bị phát hiện là nhiều người, cung cấp dữ liệu đầu vào rõ ràng cho hệ thống lập kế hoạch đường đi và ra quyết định của xe. Điều này ngăn ngừa các hành vi bất thường như phanh không cần thiết do phát hiện dư thừa. Có thể tìm hiểu thêm chi tiết trong nghiên cứu về phát hiện vật thể 3D cho xe tự hành .
  • Chẩn đoán hình ảnh y tế : Trong phân tích hình ảnh y tế , NMS được sử dụng để tinh chỉnh việc phát hiện các bất thường như khối u hoặc tổn thương trên CT hoặc MRI. Ví dụ, khi sử dụng mô hình như YOLO11 để phát hiện khối u , NMS giúp đảm bảo một khối u duy nhất được xác định chính xác bằng một khung giới hạn, cải thiện độ chính xác của chẩn đoán và lập kế hoạch điều trị như đã được nghiên cứu trong nghiên cứu chẩn đoán hình ảnh y tế .

So sánh với các kỹ thuật liên quan

NMS cụ thể là một bước xử lý hậu kỳ được áp dụng sau khi mô hình phát hiện đối tượng đã tạo ra tập hợp ban đầu các hộp giới hạn ứng viên. Không nên nhầm lẫn nó với chính kiến trúc phát hiện, chẳng hạn như sự khác biệt giữa các bộ dò dựa trên neocác bộ dò không có neo . Các kiến trúc này xác định cách các hộp tiềm năng được đề xuất, trong khi NMS tinh chỉnh các đề xuất này.

Điều thú vị là chi phí tính toán và các nút thắt tiềm ẩn liên quan đến NMS đã thúc đẩy nghiên cứu về các bộ phát hiện đối tượng không cần NMS. Các mô hình như YOLOv10 tích hợp các cơ chế trong quá trình huấn luyện để tránh dự đoán các hộp trùng lặp, nhằm giảm độ trễ suy luận và cho phép phát hiện thực sự từ đầu đến cuối. Điều này trái ngược với các phương pháp truyền thống như Ultralytics YOLOv8 hoặc YOLOv5 , trong đó NMS vẫn là một phần tiêu chuẩn và thiết yếu của quy trình suy luận . Bạn có thể tìm hiểu các so sánh kỹ thuật, chẳng hạn như YOLOv10 so với YOLOv8 , trong tài liệu của chúng tôi. Các biến thể như Soft-NMS cung cấp các phương pháp thay thế giúp phân rã điểm số của các hộp chồng chéo thay vì loại bỏ chúng hoàn toàn.

Tích hợp với các công cụ Ultralytics

NMS được tích hợp liền mạch trong hệ sinh thái Ultralytics. Các mô hình YOLO của Ultralytics tự động áp dụng NMS trong dự đoán (predict)xác thực (val) chế độ, đảm bảo người dùng nhận được đầu ra phát hiện sạch và chính xác theo mặc định. Các tham số kiểm soát hành vi NMS (như ngưỡng IoU và ngưỡng tin cậy) thường có thể được điều chỉnh cho các nhu cầu ứng dụng cụ thể.

Các nền tảng như Ultralytics HUB trừu tượng hóa hơn nữa những chi tiết này, cho phép người dùng huấn luyện mô hìnhtriển khai chúng trong đó NMS được xử lý tự động như một phần của quy trình được tối ưu hóa. Sự tích hợp này đảm bảo rằng người dùng, bất kể trình độ chuyên môn sâu về MLOps , đều có thể hưởng lợi từ kết quả phát hiện đối tượng tiên tiến cho nhiều tác vụ thị giác máy tính khác nhau. Chi tiết triển khai cụ thể trong khuôn khổ Ultralytics có thể được tìm hiểu trong tài liệu tham khảo tiện ích Ultralytics . Để biết thêm định nghĩa, hãy xem Thuật ngữ chính của Ultralytics .

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, cộng tác và phát triển với những nhà đổi mới toàn cầu

Tham gia ngay
Liên kết đã được sao chép vào clipboard