Tìm hiểu Recall là gì trong học máy, tại sao nó lại quan trọng và cách nó đảm bảo các mô hình AI nắm bắt các trường hợp tích cực quan trọng một cách hiệu quả.
Recall là một số liệu hiệu suất quan trọng trong học máy và thống kê, đặc biệt quan trọng trong các nhiệm vụ phân loại và truy xuất thông tin. Nó đo lường khả năng của một mô hình trong việc xác định chính xác tất cả các trường hợp có liên quan từ một tập dữ liệu. Còn được gọi là Độ nhạy hoặc Tỷ lệ dương tính thực (TPR), Recall trả lời câu hỏi: "Trong tất cả các trường hợp dương tính thực tế, có bao nhiêu trường hợp được mô hình dự đoán chính xác là dương tính?" Recall cao rất quan trọng trong các tình huống mà việc thiếu một trường hợp dương tính (Âm tính giả) có hậu quả đáng kể.
Recall tập trung vào các trường hợp dương tính thực tế trong một tập dữ liệu và định lượng số lượng trong số đó đã được mô hình nắm bắt thành công. Nó được tính là tỷ lệ True Positives (TP) – các trường hợp được xác định chính xác là dương tính – với tổng True Positives và False Negatives (FN) – các trường hợp thực sự là dương tính nhưng được xác định không chính xác là âm tính. Một mô hình có Recall cao sẽ xác định chính xác hầu hết các trường hợp dương tính. Hiểu Recall là điều cần thiết để đánh giá hiệu suất của mô hình, thường được hình dung bằng Ma trận nhầm lẫn .
Recall thường được thảo luận cùng với Precision . Trong khi Recall đo lường tỷ lệ các kết quả dương tính thực tế được xác định chính xác, Precision đo lường tỷ lệ các kết quả dương tính được dự đoán thực sự chính xác (TP / (TP + False Positives)). Thường có sự đánh đổi giữa Precision và Recall ; việc tối ưu hóa cho một trong hai yếu tố này đôi khi có thể tác động tiêu cực đến yếu tố kia. Lựa chọn giữa việc ưu tiên Recall hay Precision phụ thuộc vào ứng dụng cụ thể:
Điểm F1 cung cấp một số liệu duy nhất cân bằng cả Độ chính xác và Độ nhớ lại.
Khả năng nhớ lại là một thước đo đánh giá quan trọng trong nhiều lĩnh vực:
Trong thị giác máy tính , Recall là yếu tố cần thiết để đánh giá các tác vụ như phát hiện đối tượng và phân đoạn hình ảnh . Đối với mô hình phát hiện đối tượng như Ultralytics YOLO , Recall cho biết mức độ mô hình tìm thấy tất cả các trường hợp của một lớp đối tượng cụ thể trong một hình ảnh tốt như thế nào. Recall cao có nghĩa là mô hình hiếm khi bỏ sót các đối tượng mà nó được cho là phát hiện. Nó thường được sử dụng cùng với Precision và Mean Average Precision (mAP) để cung cấp đánh giá toàn diện về hiệu suất phát hiện, như được trình bày chi tiết trong hướng dẫn về YOLO Performance Metrics . Các công cụ trong nền tảng như Ultralytics HUB giúp người dùng theo dõi các số liệu này trong quá trình đào tạo và xác thực mô hình . Hiểu Recall giúp các nhà phát triển tinh chỉnh các mô hình cho các nhu cầu cụ thể, chẳng hạn như đảm bảo phát hiện toàn diện trong hệ thống báo động an ninh . Đánh giá hiệu suất thường liên quan đến việc phân tích các số liệu thu được từ ma trận nhầm lẫn và xem xét bối cảnh của các tập dữ liệu có khả năng mất cân bằng .