Thuật ngữ

Độ chính xác trung bình trung bình (mAP)

Khám phá tầm quan trọng của Độ chính xác trung bình (mAP) trong việc đánh giá các mô hình phát hiện đối tượng cho các ứng dụng AI như xe tự lái và chăm sóc sức khỏe.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Độ chính xác trung bình trung bình (mAP) là một số liệu được sử dụng rộng rãi để đánh giá hiệu suất của các mô hình phát hiện đối tượng , chẳng hạn như các mô hình trong họ YOLO Ultralytics phổ biến. Nó cung cấp một điểm số toàn diện, duy nhất tóm tắt khả năng của mô hình trong việc xác định và định vị chính xác các đối tượng trên nhiều lớp và mức độ tin cậy khác nhau. Không giống như các số liệu đơn giản hơn, mAP cân bằng hiệu quả sự đánh đổi giữa việc tìm tất cả các đối tượng có liên quan ( thu hồi ) và đảm bảo các đối tượng được tìm thấy thực sự chính xác ( độ chính xác ), khiến nó trở nên quan trọng để đánh giá các mô hình được sử dụng trong các ứng dụng phức tạp như hệ thống tự động và chẩn đoán y tế. Hiểu mAP là điều cần thiết đối với bất kỳ ai tham gia vào việc phát triển hoặc triển khai các mô hình thị giác máy tính (CV) .

Hiểu những điều cơ bản: Độ chính xác và khả năng nhớ lại

Để hiểu mAP, trước tiên cần nắm được PrecisionRecall . Trong bối cảnh phát hiện đối tượng:

  • Độ chính xác : Đo lường số lượng đối tượng được xác định thực sự chính xác. Độ chính xác cao có nghĩa là mô hình đưa ra ít dự đoán dương tính giả.
  • Thu hồi : Đo lường số lượng đối tượng thực tế có mặt được mô hình xác định chính xác. Thu hồi cao có nghĩa là mô hình tìm thấy hầu hết các đối tượng có liên quan (ít kết quả âm tính giả).

Hai số liệu này thường có mối quan hệ nghịch đảo; cải thiện số liệu này đôi khi có thể làm giảm số liệu kia. mAP cung cấp một cách để đánh giá mô hình trên các điểm khác nhau của sự đánh đổi này, mang lại góc nhìn cân bằng hơn về hiệu suất. Bạn có thể tìm hiểu thêm về các nguyên tắc cơ bản của Độ chính xác và Thu hồi trên Wikipedia .

Cách tính mAP

Việc tính toán mAP bao gồm một số bước, cung cấp đánh giá mạnh mẽ về hiệu suất của mô hình trên các lớp đối tượng và ngưỡng phát hiện khác nhau:

  1. Sắp xếp theo độ tin cậy : Đối với mỗi lớp đối tượng, các dự đoán của mô hình ( các hộp giới hạn được phát hiện) được sắp xếp dựa trên điểm số độ tin cậy của chúng, từ cao nhất đến thấp nhất.
  2. Đường cong Precision-Recall : Đường cong Precision-Recall được tạo cho mỗi lớp. Đường cong này biểu diễn độ chính xác so với các giá trị recall được tính toán ở nhiều ngưỡng tin cậy khác nhau. Khi ngưỡng giảm, độ thu hồi thường tăng (phát hiện được nhiều đối tượng hơn), trong khi độ chính xác có thể giảm (có thể bao gồm nhiều kết quả dương tính giả hơn).
  3. Độ chính xác trung bình (AP) : Độ chính xác trung bình (AP) cho một lớp duy nhất được tính là diện tích bên dưới đường cong Độ chính xác-Thu hồi của lớp đó. Điều này cung cấp một con số duy nhất tóm tắt hiệu suất của mô hình cho lớp cụ thể đó trên tất cả các mức thu hồi. Có nhiều phương pháp khác nhau để ước tính diện tích này .
  4. Độ chính xác trung bình trung bình (mAP) : Cuối cùng, mAP được tính bằng cách lấy trung bình các giá trị AP trên tất cả các lớp đối tượng trong tập dữ liệu. Điều này cung cấp điểm hiệu suất chung cho mô hình trên toàn bộ tập dữ liệu.

Thông thường, mAP được báo cáo ở ngưỡng Giao điểm trên Liên hợp (IoU) cụ thể. IoU đo lường sự chồng chéo giữa hộp giới hạn dự đoán và hộp giới hạn thực tế (thực tế). Các biến thể mAP phổ biến bao gồm:

  • mAP@0.5 (hoặc mAP50) : Được tính toán bằng ngưỡng IoU cố định là 0.5. Đây là số liệu chuẩn được sử dụng trong các chuẩn mực như thử thách PASCAL VOC . Phát hiện chỉ được coi là chính xác nếu IoU của nó với giá trị thực tế là 0.5 hoặc lớn hơn.
  • mAP@.5:.95 (hoặc mAP[.5:.95]) : Được tính bằng cách tính trung bình mAP trên nhiều ngưỡng IoU, thường từ 0,5 đến 0,95 với bước là 0,05. Chỉ số này, thường được sử dụng trong đánh giá tập dữ liệu COCO , cung cấp đánh giá toàn diện hơn bằng cách xem xét hiệu suất theo các yêu cầu về độ chính xác định vị khác nhau.

Để có cái nhìn chi tiết về cách các số liệu này áp dụng cụ thể cho YOLO mô hình, hãy xem hướng dẫn Đo lường hiệu suất YOLO Ultralytics .

Tại sao mAP lại quan trọng

Độ chính xác trung bình trung bình rất quan trọng vì nó cung cấp góc nhìn toàn diện về hiệu suất của mô hình phát hiện đối tượng. Nó đồng thời tính đến cả độ chính xác phân loại (lớp đối tượng có đúng không?) và độ chính xác định vị (hộp giới hạn có được đặt đúng không?) trên tất cả các lớp được xác định trong dữ liệu đào tạo . Điều này làm cho nó cung cấp nhiều thông tin hơn là xem xét độ chính xác hoặc khả năng thu hồi riêng lẻ, đặc biệt là trong các tập dữ liệu có nhiều loại đối tượng hoặc phân phối lớp không cân bằng . Điểm mAP cao hơn thường chỉ ra mô hình phát hiện đối tượng mạnh mẽ và đáng tin cậy hơn. Các kỹ thuật như tăng cường dữ liệu cẩn thận, điều chỉnh siêu tham số và chọn kiến trúc mô hình phù hợp (như YOLO11 ) là các chiến lược phổ biến để cải thiện mAP.

Ứng dụng trong thế giới thực

mAP rất quan trọng trong việc đánh giá các mô hình cho các nhiệm vụ thực tế, trong đó độ chính xác và độ tin cậy là tối quan trọng:

  • Xe tự hành : Trong AI dành cho các giải pháp tự lái , các mô hình phát hiện vật thể phải phát hiện chính xác người đi bộ, phương tiện, đèn giao thông và chướng ngại vật. mAP cung cấp một cách chuẩn để đo lường và so sánh hiệu suất của các mô hình phát hiện khác nhau (ví dụ: so sánh YOLOv8 với YOLOv11 ), đảm bảo độ tin cậy cao cho các quyết định quan trọng về an toàn.
  • Chụp ảnh y khoa : Đối với AI trong các ứng dụng chăm sóc sức khỏe , chẳng hạn như phát hiện khối u trong các lần quét y khoa , mAP giúp đánh giá mức độ các mô hình có thể xác định và phân định các bất thường tốt như thế nào. mAP cao đảm bảo rằng các bác sĩ lâm sàng nhận được sự hỗ trợ chính xác từ các công cụ AI, hỗ trợ chẩn đoán và lập kế hoạch điều trị. Điều này thường liên quan đến việc đào tạo về các tập dữ liệu chuyên biệt như tập dữ liệu phát hiện khối u não .

Các ứng dụng khác bao gồm giám sát an ninh , robot ( tích hợp thị giác máy tính vào robot ), phân tích bán lẻ ( AI để quản lý hàng tồn kho bán lẻ thông minh hơn ) và nông nghiệp .

mAP so với các số liệu khác

Điều quan trọng là phải phân biệt mAP với các số liệu đánh giá liên quan được sử dụng trong học máy (ML) :

  • Độ chính xác : Chủ yếu được sử dụng trong các tác vụ phân loại, độ chính xác đo lường tỷ lệ chung của các dự đoán đúng (cả dương tính thực và âm tính thực) trong tổng số trường hợp. Nó không trực tiếp đánh giá chất lượng bản địa hóa và có thể gây hiểu lầm trong việc phát hiện đối tượng, đặc biệt là với các tập dữ liệu mất cân bằng trong đó lớp nền chiếm ưu thế.
  • Giao điểm trên hợp nhất (IoU) : Đo lường sự chồng lấn không gian giữa hộp giới hạn dự đoán và hộp giới hạn thực tế. Trong khi IoU đánh giá chất lượng định vị cho từng phát hiện, mAP kết hợp ngưỡng IoU (như 0,5 hoặc phạm vi 0,5:0,95) để xác định xem phát hiện có được coi là dương tính thực sự hay không, sau đó tổng hợp hiệu suất trên các lớp và mức độ tin cậy. Bản thân IoU là một thành phần được sử dụng trong phép tính mAP, không phải là thành phần thay thế cho nó.

Hiểu được những khác biệt này là rất quan trọng để lựa chọn số liệu phù hợp dựa trên nhiệm vụ cụ thể và mục tiêu đánh giá. Để biết thêm thông tin chi tiết, hãy tham khảo hướng dẫn Đánh giá và tinh chỉnh mô hình .

Công cụ và chuẩn mực

Các công cụ như Ultralytics HUB cho phép người dùng đào tạo, theo dõi và đánh giá các mô hình, đặc biệt là mAP như một chỉ số hiệu suất chính trong quá trình đào tạoxác thực mô hình. Các khuôn khổ ML như PyTorchTensorFlow cung cấp các thành phần nền tảng để xây dựng và đào tạo các mô hình phát hiện đối tượng này. Các tập dữ liệu chuẩn hóa như COCOPASCAL VOC sử dụng mAP làm số liệu chính để so sánh các mô hình phát hiện đối tượng trong bảng xếp hạng công khai và các bài báo nghiên cứu, thúc đẩy tiến trình trong lĩnh vực này. Bạn có thể khám phá và so sánh các hiệu suất mô hình khác nhau, thường được đo bằng mAP, trên các trang So sánh mô hình Ultralytics .

Đọc tất cả