Thuật ngữ

Nhớ lại

Tìm hiểu Recall là gì trong học máy, tại sao nó lại quan trọng và cách nó đảm bảo các mô hình AI nắm bắt các trường hợp tích cực quan trọng một cách hiệu quả.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Trong học máy, đặc biệt là trong lĩnh vực phân loại và phát hiện đối tượng, Recall là một số liệu quan trọng cung cấp thông tin chi tiết về khả năng của mô hình trong việc xác định tất cả các trường hợp có liên quan từ một tập dữ liệu. Nó trả lời câu hỏi: "Trong số tất cả các trường hợp dương tính thực tế, có bao nhiêu trường hợp mà mô hình đã xác định chính xác?". Hiểu Recall là điều cần thiết để đánh giá hiệu quả của các mô hình AI, đặc biệt là trong các ứng dụng mà việc không phát hiện ra các trường hợp dương tính có thể gây ra hậu quả đáng kể.

Hiểu về việc thu hồi

Recall, thường được gọi là Độ nhạy, là một số liệu định lượng khả năng của một mô hình trong việc tìm ra tất cả các trường hợp dương tính. Nó được tính bằng tỷ lệ giữa True Positives (TP) với tổng True Positives và False Negatives (FN). Nói một cách đơn giản hơn, nó liên quan đến việc giảm thiểu False Negatives – các trường hợp mà mô hình dự đoán sai kết quả âm tính khi kết quả thực tế là dương tính. Điểm Recall cao cho biết mô hình có hiệu quả trong việc nắm bắt tỷ lệ lớn các trường hợp dương tính thực tế, giảm nguy cơ bỏ sót các trường hợp dương tính quan trọng.

Ví dụ, trong các tác vụ phát hiện đối tượng sử dụng các mô hình như Ultralytics YOLOv8 , khả năng thu hồi cao có nghĩa là mô hình có khả năng tìm thấy hầu hết các đối tượng quan tâm trong hình ảnh, ngay cả khi đôi khi nó xác định nhầm các thành phần nền là đối tượng (dẫn đến độ chính xác thấp hơn).

Sự liên quan và ý nghĩa của việc thu hồi

Việc thu hồi đặc biệt quan trọng trong các tình huống mà việc bỏ sót các trường hợp dương tính tốn kém hơn so với việc có kết quả dương tính giả. Hãy xem xét phân tích hình ảnh y tế để phát hiện bệnh. Ví dụ, trong sàng lọc ung thư, việc thu hồi cao là tối quan trọng. Việc xác định tất cả các trường hợp ung thư thực tế (kể cả khi điều đó có nghĩa là một số cá nhân khỏe mạnh bị gắn cờ sai, cần phải điều tra thêm) quan trọng hơn là bỏ sót các trường hợp ung thư để cố gắng giảm báo động giả. Việc bỏ sót một trường hợp dương tính (Âm tính giả) có thể làm chậm trễ việc điều trị và gây ra những hậu quả nghiêm trọng cho sức khỏe.

Một lĩnh vực khác mà Recall đóng vai trò quan trọng là trong các hệ thống an ninh, chẳng hạn như các ứng dụng thị giác máy tính để phòng chống trộm cắp. Trong an ninh bán lẻ , việc tối đa hóa Recall đảm bảo rằng hệ thống phát hiện càng nhiều trường hợp trộm cắp tiềm ẩn càng tốt. Mặc dù một số báo động giả có thể xảy ra (False Positives), nhưng việc không phát hiện ra các sự cố trộm cắp thực tế (False Negatives) có thể dẫn đến tổn thất tài chính đáng kể. Do đó, việc ưu tiên Recall là chìa khóa để triển khai an ninh hiệu quả.

Thu hồi so với Độ chính xác và Độ chính xác

Trong khi Recall tập trung vào tính đầy đủ của các dự đoán tích cực, Precision đo lường độ chính xác của các dự đoán tích cực. Precision trả lời: "Trong tất cả các trường hợp mà mô hình dự đoán là tích cực, có bao nhiêu trường hợp thực sự là tích cực?". Điểm Precision cao có nghĩa là khi mô hình dự đoán một kết quả tích cực, thì rất có thể là đúng, giảm thiểu các Kết quả dương tính giả.

Mặt khác, độ chính xác cung cấp thước đo tổng thể về độ chính xác, xem xét cả True Positives, True Negatives, False Positives và False Negatives. Độ chính xác hữu ích khi các lớp được cân bằng, nhưng nó có thể gây hiểu lầm khi xử lý các tập dữ liệu mất cân bằng, trong đó một lớp vượt trội hơn đáng kể so với lớp kia.

Trong nhiều tình huống thực tế, có sự đánh đổi giữa Độ chính xác và Độ thu hồi. Tăng Độ thu hồi có thể làm giảm Độ chính xác và ngược lại. Điểm F1 là số liệu cân bằng Độ chính xác và Độ thu hồi, cung cấp giá trị trung bình hài hòa của cả hai. Việc lựa chọn số liệu phù hợp phụ thuộc vào ứng dụng cụ thể và chi phí tương đối của Kết quả dương tính giả và Kết quả âm tính giả. Để tìm hiểu sâu hơn về đánh giá mô hình, việc khám phá số liệu hiệu suất YOLO có thể cung cấp những hiểu biết có giá trị.

Ứng dụng thực tế của Recall

Ngoài các ứng dụng y tế và an ninh, Recall đóng vai trò quan trọng trong nhiều hệ thống do AI điều khiển:

  • Phát hiện gian lận: Trong các ứng dụng AI tài chính, việc tối đa hóa Thu hồi là điều cần thiết để phát hiện càng nhiều giao dịch gian lận càng tốt, ngay cả khi điều đó có nghĩa là phải đánh dấu một số giao dịch hợp pháp là đáng ngờ để xem xét thêm.
  • Phát hiện bất thường: Trong kiểm soát chất lượng công nghiệp, việc thu hồi cao khi phát hiện bất thường đảm bảo rằng hầu hết các sản phẩm lỗi đều được xác định, duy trì các tiêu chuẩn chất lượng và ngăn chặn các mặt hàng lỗi đến tay khách hàng.
  • Tìm kiếm và truy xuất thông tin: Trong hệ thống tìm kiếm ngữ nghĩa và truy xuất thông tin, Recall đo lường khả năng của hệ thống trong việc truy xuất tất cả các tài liệu hoặc kết quả có liên quan cho một truy vấn, đảm bảo kết quả tìm kiếm toàn diện.

Tóm lại, Recall là một thước đo đánh giá quan trọng trong học máy, đặc biệt là khi chi phí bỏ lỡ các trường hợp tích cực là cao. Bằng cách hiểu và tối ưu hóa Recall, các nhà phát triển có thể xây dựng các hệ thống AI hiệu quả và đáng tin cậy hơn trên nhiều ứng dụng khác nhau bằng các công cụ và nền tảng như Ultralytics HUB .

Đọc tất cả