Hiểu hiệu suất mô hình với ma trận nhầm lẫn. Khám phá số liệu, cách sử dụng trong thế giới thực và các công cụ để tinh chỉnh độ chính xác phân loại AI.
Ma trận nhầm lẫn là một công cụ cơ bản được sử dụng trong Học máy (ML) , đặc biệt là để đánh giá hiệu suất của các mô hình phân loại. Ma trận này cung cấp bản tóm tắt rõ ràng và súc tích về mức độ phù hợp giữa các dự đoán của mô hình với các nhãn thực tế trên các lớp khác nhau. Bằng cách trực quan hóa số lượng dự đoán đúng và sai cho mỗi lớp, nó cung cấp những hiểu biết sâu sắc hơn so với độ chính xác đơn thuần, giúp các học viên hiểu được các loại lỗi cụ thể mà mô hình của họ đang mắc phải.
Ma trận nhầm lẫn so sánh các nhãn lớp dự đoán với các nhãn lớp thực tế cho một tập dữ liệu thử nghiệm . Đối với vấn đề phân loại nhị phân (hai lớp, ví dụ: Dương/Âm), ma trận thường chứa bốn giá trị khóa:
Bốn thành phần này tạo thành cơ sở để tính toán các số liệu hiệu suất khác nhau. Đối với các vấn đề phân loại nhiều lớp, ma trận mở rộng, cho thấy sự tương tác giữa tất cả các lớp.
Mặc dù độ chính xác tổng thể mang lại cảm nhận chung về hiệu suất, nhưng nó có thể gây hiểu lầm, đặc biệt là với các tập dữ liệu mất cân bằng khi một lớp vượt trội hơn đáng kể so với các lớp khác. Ma trận nhầm lẫn cung cấp góc nhìn chi tiết hơn:
Ma trận nhầm lẫn được sử dụng rộng rãi trong nhiều lĩnh vực ứng dụng Trí tuệ nhân tạo (AI) :
Điều quan trọng là phải phân biệt ma trận nhầm lẫn với các công cụ đánh giá liên quan:
Khi đào tạo các mô hình như Ultralytics YOLO cho các tác vụ như phát hiện đối tượng hoặc phân loại hình ảnh , các ma trận nhầm lẫn được tự động tạo ra trong giai đoạn xác thực ( chế độ Val ). Các ma trận này giúp người dùng hình dung mô hình hoạt động tốt như thế nào trên các lớp khác nhau trong các tập dữ liệu như COCO hoặc các tập dữ liệu tùy chỉnh. Các công cụ như Ultralytics HUB cung cấp môi trường để đào tạo các mô hình và phân tích kết quả, bao gồm các ma trận nhầm lẫn, để có được những hiểu biết toàn diện về đánh giá mô hình . Để tìm hiểu sâu hơn về các ma trận nhầm lẫn trong thực tế, các nguồn như tài liệu Scikit-learn cung cấp thêm các ví dụ.