Tìm hiểu cách ma trận nhầm lẫn đánh giá hiệu suất phân loại. Khám phá TP, FP, TN và FN để tối ưu hóa... Ultralytics Mô hình YOLO26 cho độ chính xác tốt hơn.
Ma trận nhầm lẫn là một công cụ đo lường hiệu suất cho các bài toán phân loại máy học, trong đó đầu ra có thể là hai hoặc nhiều lớp. Nó là một bảng với bốn tổ hợp khác nhau của các giá trị dự đoán và giá trị thực tế, đóng vai trò là yếu tố nền tảng cho việc trực quan hóa dữ liệu trong đánh giá mô hình. Không giống như độ chính xác đơn giản, có thể gây hiểu nhầm nếu tập dữ liệu không cân bằng, ma trận nhầm lẫn cung cấp sự phân tích chi tiết về nơi mô hình thị giác máy tính (CV) đang mắc lỗi. Bằng cách so sánh các dự đoán với nhãn thực tế , các nhà phát triển có thể xác định xem hệ thống có đang nhầm lẫn hai lớp cụ thể hay không hoặc có đang thất bại trong việc phân loại chính xác các lớp hay không. detect một vật thể hoàn toàn.
Ma trận này thường được chia thành bốn phần tư cho phân loại nhị phân, mặc dù nó được mở rộng cho các bài toán đa lớp như những bài toán được xử lý bởi Ultralytics YOLO26 . Bốn thành phần này thể hiện sự giao nhau giữa những gì mô hình dự đoán và những gì thực sự tồn tại trong hình ảnh.
Các số liệu thô trong ma trận nhầm lẫn được sử dụng để tính toán các chỉ số nâng cao hơn mô tả hiệu suất của mô hình . Hiểu rõ các đạo hàm này là điều cần thiết để tối ưu hóa mạng nơ-ron.
Chi phí cụ thể của các lỗi được xác định bởi ma trận nhầm lẫn sẽ quyết định cách điều chỉnh mô hình cho các ngành công nghiệp khác nhau.
Trong lĩnh vực trí tuệ nhân tạo ứng dụng trong chăm sóc sức khỏe , ma trận nhầm lẫn là vấn đề liên quan đến an toàn. Khi huấn luyện một mô hình phân tích hình ảnh y tế để detect Đối với các khối u, kết quả âm tính giả (bỏ sót khối u) còn tệ hơn nhiều so với kết quả dương tính giả (đánh dấu một vị trí lành tính để bác sĩ xem xét). Do đó, các kỹ sư ưu tiên Độ thu hồi hơn Độ chính xác trong các ma trận này để đảm bảo không bỏ sót bất kỳ rủi ro sức khỏe tiềm ẩn nào.
Ngược lại, trong kiểm soát chất lượng sản xuất , hiệu quả là yếu tố then chốt. Nếu một hệ thống phân loại các bộ phận trên dây chuyền lắp ráp tạo ra quá nhiều kết quả sai (đánh dấu các bộ phận tốt là bị lỗi), nó sẽ gây ra lãng phí không cần thiết và làm chậm quá trình sản xuất. Ở đây, ma trận nhầm lẫn giúp các kỹ sư tinh chỉnh mô hình để tối đa hóa độ chính xác, đảm bảo rằng những gì bị loại bỏ thực sự là bị lỗi, từ đó tối ưu hóa quy trình làm việc của máy học tự động .
Khi sử dụng các framework hiện đại, việc tạo ma trận này thường là một phần của quy trình kiểm định tiêu chuẩn. Ví dụ dưới đây minh họa cách kiểm định một ma trận.
Mô hình YOLO26 và truy cập dữ liệu ma trận nhầm lẫn bằng cách sử dụng ultralytics bưu kiện.
from ultralytics import YOLO
# Load a pre-trained YOLO26 model
model = YOLO("yolo26n.pt")
# Validate the model on the COCO8 dataset
# This automatically generates and plots the confusion matrix
metrics = model.val(data="coco8.yaml")
# Access the confusion matrix object directly
print(metrics.confusion_matrix.matrix)
Điều quan trọng là phải phân biệt ma trận nhầm lẫn với các thuật ngữ đánh giá tương tự.