Thuật ngữ

Nhớ lại

Tìm hiểu Recall là gì trong học máy, tại sao nó lại quan trọng và cách nó đảm bảo các mô hình AI nắm bắt các trường hợp tích cực quan trọng một cách hiệu quả.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Recall là một số liệu hiệu suất quan trọng trong học máy và thống kê, đặc biệt quan trọng trong các nhiệm vụ phân loại và truy xuất thông tin. Nó đo lường khả năng của một mô hình trong việc xác định chính xác tất cả các trường hợp có liên quan từ một tập dữ liệu. Còn được gọi là Độ nhạy hoặc Tỷ lệ dương tính thực (TPR), Recall trả lời câu hỏi: "Trong tất cả các trường hợp dương tính thực tế, có bao nhiêu trường hợp được mô hình dự đoán chính xác là dương tính?" Recall cao rất quan trọng trong các tình huống mà việc thiếu một trường hợp dương tính (Âm tính giả) có hậu quả đáng kể.

Khái niệm cốt lõi

Recall tập trung vào các trường hợp dương tính thực tế trong một tập dữ liệu và định lượng số lượng trong số đó đã được mô hình nắm bắt thành công. Nó được tính là tỷ lệ True Positives (TP) – các trường hợp được xác định chính xác là dương tính – với tổng True Positives và False Negatives (FN) – các trường hợp thực sự là dương tính nhưng được xác định không chính xác là âm tính. Một mô hình có Recall cao sẽ xác định chính xác hầu hết các trường hợp dương tính. Hiểu Recall là điều cần thiết để đánh giá hiệu suất của mô hình, thường được hình dung bằng Ma trận nhầm lẫn .

Thu hồi so với độ chính xác

Recall thường được thảo luận cùng với Precision . Trong khi Recall đo lường tỷ lệ các kết quả dương tính thực tế được xác định chính xác, Precision đo lường tỷ lệ các kết quả dương tính được dự đoán thực sự chính xác (TP / (TP + False Positives)). Thường có sự đánh đổi giữa Precision và Recall ; việc tối ưu hóa cho một trong hai yếu tố này đôi khi có thể tác động tiêu cực đến yếu tố kia. Lựa chọn giữa việc ưu tiên Recall hay Precision phụ thuộc vào ứng dụng cụ thể:

  • High Recall được ưu tiên khi chi phí bỏ lỡ một trường hợp dương tính (Âm tính giả) là cao.
  • Độ chính xác cao được ưu tiên khi chi phí xác định sai trường hợp âm tính thành dương tính (Dương tính giả) là cao.

Điểm F1 cung cấp một số liệu duy nhất cân bằng cả Độ chính xác và Độ nhớ lại.

Ứng dụng trong thế giới thực

Khả năng nhớ lại là một thước đo đánh giá quan trọng trong nhiều lĩnh vực:

  • Phân tích hình ảnh y tế : Trong các nhiệm vụ như phát hiện khối u bằng AI , Recall cao là rất quan trọng. Việc bỏ sót khối u ác tính (âm tính giả) có thể làm chậm trễ quá trình điều trị với hậu quả nghiêm trọng. Do đó, các hệ thống chẩn đoán thường được tối ưu hóa cho Độ nhạy cao (Recall), ngay cả khi điều đó có nghĩa là đánh dấu một số trường hợp lành tính để xem xét thêm (Độ chính xác thấp hơn). Đảm bảo phát hiện toàn diện là tối quan trọng trong AI trong chăm sóc sức khỏe .
  • Phát hiện gian lận : Khi xây dựng hệ thống để phát hiện các giao dịch tài chính gian lận, việc tối đa hóa Thu hồi là rất quan trọng. Không xác định được giao dịch gian lận (False Negative) có thể dẫn đến tổn thất tài chính đáng kể. Mặc dù việc giảm thiểu báo động sai (False Positive) cũng là điều mong muốn, nhưng việc đảm bảo rằng hầu hết các hoạt động gian lận đều bị phát hiện thường được ưu tiên hơn.

Sự liên quan trong tầm nhìn máy tính

Trong thị giác máy tính , Recall là yếu tố cần thiết để đánh giá các tác vụ như phát hiện đối tượngphân đoạn hình ảnh . Đối với mô hình phát hiện đối tượng như Ultralytics YOLO , Recall cho biết mức độ mô hình tìm thấy tất cả các trường hợp của một lớp đối tượng cụ thể trong một hình ảnh tốt như thế nào. Recall cao có nghĩa là mô hình hiếm khi bỏ sót các đối tượng mà nó được cho là phát hiện. Nó thường được sử dụng cùng với Precision và Mean Average Precision (mAP) để cung cấp đánh giá toàn diện về hiệu suất phát hiện, như được trình bày chi tiết trong hướng dẫn về YOLO Performance Metrics . Các công cụ trong nền tảng như Ultralytics HUB giúp người dùng theo dõi các số liệu này trong quá trình đào tạo và xác thực mô hình . Hiểu Recall giúp các nhà phát triển tinh chỉnh các mô hình cho các nhu cầu cụ thể, chẳng hạn như đảm bảo phát hiện toàn diện trong hệ thống báo động an ninh . Đánh giá hiệu suất thường liên quan đến việc phân tích các số liệu thu được từ ma trận nhầm lẫn và xem xét bối cảnh của các tập dữ liệu có khả năng mất cân bằng .

Đọc tất cả