Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Ma trận nhầm lẫn

Tìm hiểu cách ma trận nhầm lẫn đánh giá hiệu suất phân loại. Khám phá TP, FP, TN và FN để tối ưu hóa... Ultralytics Mô hình YOLO26 cho độ chính xác tốt hơn.

Ma trận nhầm lẫn là một công cụ đo lường hiệu suất cho các bài toán phân loại máy học, trong đó đầu ra có thể là hai hoặc nhiều lớp. Nó là một bảng với bốn tổ hợp khác nhau của các giá trị dự đoán và giá trị thực tế, đóng vai trò là yếu tố nền tảng cho việc trực quan hóa dữ liệu trong đánh giá mô hình. Không giống như độ chính xác đơn giản, có thể gây hiểu nhầm nếu tập dữ liệu không cân bằng, ma trận nhầm lẫn cung cấp sự phân tích chi tiết về nơi mô hình thị giác máy tính (CV) đang mắc lỗi. Bằng cách so sánh các dự đoán với nhãn thực tế , các nhà phát triển có thể xác định xem hệ thống có đang nhầm lẫn hai lớp cụ thể hay không hoặc có đang thất bại trong việc phân loại chính xác các lớp hay không. detect một vật thể hoàn toàn.

Các thành phần cốt lõi của Ma trận

Ma trận này thường được chia thành bốn phần tư cho phân loại nhị phân, mặc dù nó được mở rộng cho các bài toán đa lớp như những bài toán được xử lý bởi Ultralytics YOLO26 . Bốn thành phần này thể hiện sự giao nhau giữa những gì mô hình dự đoán và những gì thực sự tồn tại trong hình ảnh.

  • Kết quả đúng (True Positives - TP) : Mô hình dự đoán chính xác lớp tích cực. Ví dụ, trong nhiệm vụ phát hiện đối tượng , mô hình vẽ thành công một khung bao quanh một người thực sự có mặt trong khung hình.
  • Kết quả âm tính đúng (TN) : Mô hình dự đoán chính xác lớp âm tính. Điều này rất quan trọng trong các trường hợp như phát hiện bất thường , nơi hệ thống xác định chính xác rằng một bộ phận được sản xuất không có khuyết tật.
  • Kết quả dương tính giả (FP) : Mô hình dự đoán sai lớp tích cực. Thường được gọi là "lỗi loại I", điều này xảy ra khi hệ thống phát hiện một đối tượng không tồn tại, chẳng hạn như camera an ninh báo cáo một cái bóng là kẻ đột nhập.
  • Sai sót âm tính (False Negatives - FN) : Mô hình dự đoán sai lớp âm tính. Được gọi là "lỗi loại II", điều này xảy ra khi mô hình không thể... detect Một vật thể hiện diện nhưng về cơ bản "không" đến mục tiêu.

Các chỉ số dẫn xuất và ý nghĩa

Các số liệu thô trong ma trận nhầm lẫn được sử dụng để tính toán các chỉ số nâng cao hơn mô tả hiệu suất của mô hình . Hiểu rõ các đạo hàm này là điều cần thiết để tối ưu hóa mạng nơ-ron.

  • Độ chính xác : Được tính bằng TP / (TP + FP), chỉ số này cho thấy mức độ chính xác của các dự đoán tích cực. Độ chính xác cao nghĩa là ít cảnh báo sai hơn.
  • Độ nhạy (Recall) : Được tính bằng TP / (TP + FN), chỉ số này đo lường khả năng của mô hình trong việc tìm ra tất cả các trường hợp tích cực. Độ nhạy cao rất quan trọng khi việc bỏ sót một đối tượng có thể dẫn đến hậu quả nghiêm trọng.
  • Điểm F1 : Là trung bình điều hòa của độ chính xác và độ thu hồi. Nó cung cấp một điểm số duy nhất cân bằng sự đánh đổi giữa hai yếu tố này, hữu ích cho việc so sánh các mô hình YOLO26 khác nhau.

Các Ứng dụng Thực tế

Chi phí cụ thể của các lỗi được xác định bởi ma trận nhầm lẫn sẽ quyết định cách điều chỉnh mô hình cho các ngành công nghiệp khác nhau.

Trong lĩnh vực trí tuệ nhân tạo ứng dụng trong chăm sóc sức khỏe , ma trận nhầm lẫn là vấn đề liên quan đến an toàn. Khi huấn luyện một mô hình phân tích hình ảnh y tế để detect Đối với các khối u, kết quả âm tính giả (bỏ sót khối u) còn tệ hơn nhiều so với kết quả dương tính giả (đánh dấu một vị trí lành tính để bác sĩ xem xét). Do đó, các kỹ sư ưu tiên Độ thu hồi hơn Độ chính xác trong các ma trận này để đảm bảo không bỏ sót bất kỳ rủi ro sức khỏe tiềm ẩn nào.

Ngược lại, trong kiểm soát chất lượng sản xuất , hiệu quả là yếu tố then chốt. Nếu một hệ thống phân loại các bộ phận trên dây chuyền lắp ráp tạo ra quá nhiều kết quả sai (đánh dấu các bộ phận tốt là bị lỗi), nó sẽ gây ra lãng phí không cần thiết và làm chậm quá trình sản xuất. Ở đây, ma trận nhầm lẫn giúp các kỹ sư tinh chỉnh mô hình để tối đa hóa độ chính xác, đảm bảo rằng những gì bị loại bỏ thực sự là bị lỗi, từ đó tối ưu hóa quy trình làm việc của máy học tự động .

Tạo ma trận nhầm lẫn bằng YOLO26

Khi sử dụng các framework hiện đại, việc tạo ma trận này thường là một phần của quy trình kiểm định tiêu chuẩn. Ví dụ dưới đây minh họa cách kiểm định một ma trận. Mô hình YOLO26 và truy cập dữ liệu ma trận nhầm lẫn bằng cách sử dụng ultralytics bưu kiện.

from ultralytics import YOLO

# Load a pre-trained YOLO26 model
model = YOLO("yolo26n.pt")

# Validate the model on the COCO8 dataset
# This automatically generates and plots the confusion matrix
metrics = model.val(data="coco8.yaml")

# Access the confusion matrix object directly
print(metrics.confusion_matrix.matrix)

Phân biệt các khái niệm liên quan

Điều quan trọng là phải phân biệt ma trận nhầm lẫn với các thuật ngữ đánh giá tương tự.

  • So với Độ chính xác : Độ chính xác đơn giản là tỷ lệ giữa số dự đoán đúng và tổng số dự đoán. Mặc dù hữu ích, độ chính xác có thể gây hiểu lầm nghiêm trọng trong các tập dữ liệu không cân bằng . Ví dụ, nếu 95% email không phải là thư rác, một mô hình dự đoán "không phải thư rác" cho mọi email sẽ có độ chính xác 95% nhưng lại vô dụng. Ma trận nhầm lẫn cho thấy điểm yếu này bằng cách hiển thị số lượng True Positive bằng 0 cho lớp thư rác.
  • So sánh với đường cong ROC : Ma trận nhầm lẫn cung cấp một cái nhìn tổng quan về hiệu suất tại một ngưỡng độ tin cậy cụ thể. Ngược lại, đường cong đặc tính hoạt động của bộ thu (ROC) trực quan hóa sự thay đổi của Tỷ lệ dương tính thực (True Positive Rate) và Tỷ lệ dương tính giả (False Positive Rate) khi ngưỡng đó thay đổi. Các công cụ như Nền tảng Ultralytics cho phép người dùng khám phá cả hai hình ảnh trực quan để chọn điểm hoạt động tối ưu cho việc triển khai của họ.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay