Thuật ngữ

Nhớ lại

Tìm hiểu Recall là gì trong học máy, tại sao nó lại quan trọng và cách nó đảm bảo các mô hình AI nắm bắt các trường hợp tích cực quan trọng một cách hiệu quả.

Recall, còn được gọi là độ nhạy hoặc tỷ lệ dương tính thật, là một thước đo đánh giá cơ bản trong học máy (ML) và thống kê. Nó đo lường khả năng của mô hình trong việc xác định chính xác tất cả các trường hợp liên quan trong một tập dữ liệu. Nói một cách đơn giản, Recall trả lời câu hỏi: "Trong số tất cả các trường hợp dương tính thực tế, có bao nhiêu trường hợp được mô hình dự đoán chính xác là dương tính?". Điểm Recall cao cho thấy mô hình hiệu quả trong việc tìm ra những gì nó cần tìm, giảm thiểu số trường hợp dương tính bị bỏ sót (âm tính giả). Thước đo này đặc biệt quan trọng trong các ứng dụng mà việc không phát hiện được trường hợp dương tính sẽ gây ra hậu quả đáng kể.

Tầm quan trọng của việc ghi nhớ cao

Trong nhiều tình huống thực tế, chi phí cho một kết quả âm tính giả (bỏ sót phát hiện) cao hơn nhiều so với chi phí cho một kết quả dương tính giả (báo động giả). Đây chính là lúc việc ưu tiên Recall cao trở nên thiết yếu. Ví dụ, trong các tác vụ như phân tích hình ảnh y tế hoặc phát hiện gian lận, mô hình Recall cao đảm bảo ghi lại càng nhiều trường hợp thực tế càng tốt để xem xét lại, ngay cả khi điều đó có nghĩa là một số trường hợp không phải trường hợp được đánh dấu sai.

  • Chẩn đoán Y khoa: Trong một hệ thống AI hỗ trợ phát hiện ung thư từ hình ảnh chụp cắt lớp , mô hình High-Recall đóng vai trò then chốt. Việc hệ thống đánh dấu một bệnh nhân khỏe mạnh để bác sĩ X-quang xem xét (kết quả dương tính giả) sẽ tốt hơn nhiều so với việc bỏ sót khối u ung thư (kết quả âm tính giả), điều này có thể làm chậm trễ việc điều trị cứu sống bệnh nhân. Nhiều giải pháp AI trong chăm sóc sức khỏe được tối ưu hóa để đạt độ nhạy cao.
  • An ninh và Giám sát: Đối với một hệ thống báo động an ninh được thiết kế để phát hiện kẻ xâm nhập, khả năng thu hồi tín hiệu cao (High Recall) là tối quan trọng. Hệ thống phải nhận diện được mọi mối đe dọa tiềm ẩn, ngay cả khi đôi khi nhầm lẫn một con vật hoang với kẻ xâm nhập. Việc bỏ sót một vi phạm an ninh thực sự sẽ khiến hệ thống trở nên kém hiệu quả.

Thu hồi trong các mô hình YOLO của Ultralytics

Trong bối cảnh của thị giác máy tính (CV) và các mô hình như Ultralytics YOLO , Recall là một số liệu quan trọng được sử dụng cùng với Precision và mean Average Precision (mAP) để đánh giá hiệu suất trên các tác vụ như phát hiện đối tượngphân đoạn phiên bản . Đạt được sự cân bằng tốt giữa Recall và Precision thường là điều cần thiết để có hiệu suất thực tế mạnh mẽ. Ví dụ: khi so sánh các mô hình như YOLOv8 với YOLO11 , Recall giúp hiểu được mức độ mỗi mô hình xác định tất cả các đối tượng mục tiêu tốt như thế nào. Người dùng có thể đào tạo các mô hình tùy chỉnh bằng các khuôn khổ như PyTorch hoặc TensorFlow và theo dõi Recall bằng các công cụ như Weights & Biases hoặc các tính năng tích hợp trong Ultralytics HUB . Hiểu về Recall giúp tối ưu hóa các mô hình cho các trường hợp sử dụng cụ thể, có khả năng liên quan đến việc điều chỉnh siêu tham số hoặc khám phá các kiến trúc mô hình khác nhau như YOLOv10 hoặc YOLO11 mới nhất. Các tài nguyên như tài liệu Ultralytics cung cấp hướng dẫn toàn diện về đào tạo và đánh giá.

Thu hồi so với các số liệu khác

Điều quan trọng là phải phân biệt Recall với các chỉ số đánh giá thông thường khác.

  • Độ chính xác : Trong khi Độ thu hồi tập trung vào việc tìm kiếm tất cả các mẫu dương tính, Độ chính xác đo lường độ chính xác của các dự đoán dương tính được đưa ra. Nó trả lời câu hỏi: "Trong số tất cả các trường hợp mà mô hình dự đoán là dương tính, có bao nhiêu trường hợp thực sự là dương tính?" Thường có sự đánh đổi giữa Độ chính xác và Độ thu hồi; tăng một trong hai có thể làm giảm cái còn lại. Khái niệm này được gọi là sự đánh đổi Độ chính xác-Độ thu hồi .
  • Độ chính xác : Đo lường tỷ lệ phần trăm tổng thể của các dự đoán chính xác (cả tích cực và tiêu cực). Độ chính xác có thể là một thước đo gây hiểu lầm đối với các tập dữ liệu mất cân bằng , trong đó một lớp vượt trội hơn hẳn lớp còn lại. Ví dụ: trong một tập dữ liệu có 99% mẫu tiêu cực, một mô hình dự đoán mọi thứ là tiêu cực đạt độ chính xác 99% nhưng lại có Độ thu hồi bằng 0 đối với lớp tích cực.
  • Điểm F1 : Đây là giá trị trung bình hài hòa của Độ chính xác (Precision) và Độ thu hồi (Recall). Điểm F1 cung cấp một giá trị duy nhất cân bằng cả hai chỉ số, khiến nó trở thành một thước đo hữu ích khi bạn cần xem xét cả kết quả dương tính giả và kết quả âm tính giả. Chỉ số này thường được sử dụng khi phân phối lớp không đồng đều.
  • Diện tích dưới đường cong (AUC) : Cụ thể đối với phân loại nhị phân, đường cong Đặc tính Hoạt động của Máy thu (ROC) biểu diễn tỷ lệ dương tính thật (Recall) so với tỷ lệ dương tính giả. AUC cung cấp một điểm số duy nhất tóm tắt hiệu suất của mô hình trên tất cả các ngưỡng phân loại. Diện tích dưới đường cong Độ chính xác-Triệu hồi (AUC-PR) thường cung cấp nhiều thông tin hơn cho các tác vụ phân loại mất cân bằng.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, cộng tác và phát triển với những nhà đổi mới toàn cầu

Tham gia ngay
Liên kết đã được sao chép vào clipboard