Khám phá tầm quan trọng của Độ chính xác trung bình (mAP) trong việc đánh giá các mô hình phát hiện đối tượng cho các ứng dụng AI như xe tự lái và chăm sóc sức khỏe.
Độ chính xác trung bình trung bình (mAP) là một số liệu được sử dụng rộng rãi để đánh giá hiệu suất của các mô hình phát hiện đối tượng , chẳng hạn như các mô hình trong họ YOLO Ultralytics phổ biến. Nó cung cấp một điểm số toàn diện, duy nhất tóm tắt khả năng của mô hình trong việc xác định và định vị chính xác các đối tượng trên nhiều lớp và mức độ tin cậy khác nhau. Không giống như các số liệu đơn giản hơn, mAP cân bằng hiệu quả sự đánh đổi giữa việc tìm tất cả các đối tượng có liên quan ( thu hồi ) và đảm bảo các đối tượng được tìm thấy thực sự chính xác ( độ chính xác ), khiến nó trở nên quan trọng để đánh giá các mô hình được sử dụng trong các ứng dụng phức tạp như hệ thống tự động và chẩn đoán y tế. Hiểu mAP là điều cần thiết đối với bất kỳ ai tham gia vào việc phát triển hoặc triển khai các mô hình thị giác máy tính (CV) .
Để hiểu mAP, trước tiên cần nắm được Precision và Recall . Trong bối cảnh phát hiện đối tượng:
Hai số liệu này thường có mối quan hệ nghịch đảo; cải thiện số liệu này đôi khi có thể làm giảm số liệu kia. mAP cung cấp một cách để đánh giá mô hình trên các điểm khác nhau của sự đánh đổi này, mang lại góc nhìn cân bằng hơn về hiệu suất. Bạn có thể tìm hiểu thêm về các nguyên tắc cơ bản của Độ chính xác và Thu hồi trên Wikipedia .
Việc tính toán mAP bao gồm một số bước, cung cấp đánh giá mạnh mẽ về hiệu suất của mô hình trên các lớp đối tượng và ngưỡng phát hiện khác nhau:
Thông thường, mAP được báo cáo ở ngưỡng Giao điểm trên Liên hợp (IoU) cụ thể. IoU đo lường sự chồng chéo giữa hộp giới hạn dự đoán và hộp giới hạn thực tế (thực tế). Các biến thể mAP phổ biến bao gồm:
Để có cái nhìn chi tiết về cách các số liệu này áp dụng cụ thể cho YOLO mô hình, hãy xem hướng dẫn Đo lường hiệu suất YOLO Ultralytics .
Độ chính xác trung bình trung bình rất quan trọng vì nó cung cấp góc nhìn toàn diện về hiệu suất của mô hình phát hiện đối tượng. Nó đồng thời tính đến cả độ chính xác phân loại (lớp đối tượng có đúng không?) và độ chính xác định vị (hộp giới hạn có được đặt đúng không?) trên tất cả các lớp được xác định trong dữ liệu đào tạo . Điều này làm cho nó cung cấp nhiều thông tin hơn là xem xét độ chính xác hoặc khả năng thu hồi riêng lẻ, đặc biệt là trong các tập dữ liệu có nhiều loại đối tượng hoặc phân phối lớp không cân bằng . Điểm mAP cao hơn thường chỉ ra mô hình phát hiện đối tượng mạnh mẽ và đáng tin cậy hơn. Các kỹ thuật như tăng cường dữ liệu cẩn thận, điều chỉnh siêu tham số và chọn kiến trúc mô hình phù hợp (như YOLO11 ) là các chiến lược phổ biến để cải thiện mAP.
mAP rất quan trọng trong việc đánh giá các mô hình cho các nhiệm vụ thực tế, trong đó độ chính xác và độ tin cậy là tối quan trọng:
Các ứng dụng khác bao gồm giám sát an ninh , robot ( tích hợp thị giác máy tính vào robot ), phân tích bán lẻ ( AI để quản lý hàng tồn kho bán lẻ thông minh hơn ) và nông nghiệp .
Điều quan trọng là phải phân biệt mAP với các số liệu đánh giá liên quan được sử dụng trong học máy (ML) :
Hiểu được những khác biệt này là rất quan trọng để lựa chọn số liệu phù hợp dựa trên nhiệm vụ cụ thể và mục tiêu đánh giá. Để biết thêm thông tin chi tiết, hãy tham khảo hướng dẫn Đánh giá và tinh chỉnh mô hình .
Các công cụ như Ultralytics HUB cho phép người dùng đào tạo, theo dõi và đánh giá các mô hình, đặc biệt là mAP như một chỉ số hiệu suất chính trong quá trình đào tạo và xác thực mô hình. Các khuôn khổ ML như PyTorch và TensorFlow cung cấp các thành phần nền tảng để xây dựng và đào tạo các mô hình phát hiện đối tượng này. Các tập dữ liệu chuẩn hóa như COCO và PASCAL VOC sử dụng mAP làm số liệu chính để so sánh các mô hình phát hiện đối tượng trong bảng xếp hạng công khai và các bài báo nghiên cứu, thúc đẩy tiến trình trong lĩnh vực này. Bạn có thể khám phá và so sánh các hiệu suất mô hình khác nhau, thường được đo bằng mAP, trên các trang So sánh mô hình Ultralytics .