Tìm hiểu cách Đường cong ROC và AUC đánh giá hiệu suất phân loại trong AI/ML, tối ưu hóa TPR so với FPR cho các nhiệm vụ như phát hiện gian lận và chẩn đoán y tế.
Đường cong Đặc tính hoạt động của máy thu (ROC) là một đồ thị được sử dụng để minh họa khả năng chẩn đoán của hệ thống phân loại nhị phân khi ngưỡng phân biệt của nó thay đổi. Nó giúp hình dung mức độ phân biệt giữa hai lớp của một mô hình học máy (ví dụ: tích cực so với tiêu cực, thư rác so với không phải thư rác). Đường cong được tạo ra bằng cách vẽ Tỷ lệ dương tính thực (TPR) so với Tỷ lệ dương tính giả (FPR) ở các cài đặt ngưỡng khác nhau. Việc hiểu các đường cong ROC rất quan trọng để đánh giá và so sánh hiệu suất của các mô hình phân loại, đặc biệt là trong các lĩnh vực như phân tích hình ảnh y tế và nhận dạng mẫu.
Để diễn giải đường cong ROC, điều cần thiết là phải hiểu các trục của nó:
Đường cong ROC cho thấy sự đánh đổi giữa TPR và FPR. Khi ngưỡng phân loại thay đổi, mô hình có thể xác định nhiều kết quả dương tính thực hơn (tăng TPR) nhưng có khả năng phải trả giá bằng việc xác định nhiều kết quả dương tính giả hơn (tăng FPR).
Hình dạng của đường cong ROC cung cấp cái nhìn sâu sắc về hiệu suất của mô hình:
Một số liệu phổ biến có nguồn gốc từ đường cong ROC là Diện tích dưới đường cong (AUC) . AUC cung cấp một giá trị vô hướng duy nhất tóm tắt hiệu suất của bộ phân loại trên tất cả các ngưỡng có thể. AUC bằng 1,0 biểu thị một bộ phân loại hoàn hảo, trong khi AUC bằng 0,5 biểu thị một mô hình có hiệu suất ngẫu nhiên. Các công cụ như Scikit-learn cung cấp các hàm để tính AUC.
Đường cong ROC được sử dụng rộng rãi trong nhiều lĩnh vực khác nhau:
Trong khi các số liệu như Độ chính xác , Độ chính xác và Độ thu hồi cung cấp thông tin có giá trị, đường cong ROC và AUC cung cấp góc nhìn toàn diện hơn, đặc biệt là với các tập dữ liệu mất cân bằng, trong đó một lớp có số lượng lớn hơn đáng kể so với lớp kia. Độ chính xác có thể gây hiểu lầm trong các tình huống như vậy vì điểm số cao có thể đạt được chỉ bằng cách dự đoán lớp đa số. Đường cong ROC, tập trung vào sự đánh đổi TPR/FPR, cung cấp đánh giá độc lập ngưỡng về khả năng phân biệt giữa các lớp của mô hình. Để biết thông tin chi tiết về việc đánh giá các mô hình như Ultralytics YOLO , hãy xem hướng dẫn của chúng tôi về YOLO Performance Metrics . Việc trực quan hóa các số liệu này thường có thể được thực hiện bằng các công cụ tích hợp với các nền tảng như Ultralytics HUB hoặc các thư viện như TensorBoard .