Thuật ngữ

Điểm F1

Khám phá tầm quan trọng của điểm F1 trong học máy! Tìm hiểu cách cân bằng độ chính xác và khả năng thu hồi để đánh giá mô hình tối ưu.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Điểm F1 là một số liệu được sử dụng rộng rãi trong học máy (ML) và phân tích thống kê để đánh giá hiệu suất của các mô hình phân loại nhị phân hoặc đa lớp. Nó cung cấp một cách để kết hợp Độ chính xácĐộ thu hồi của mô hình thành một phép đo duy nhất, cung cấp đánh giá mạnh mẽ hơn so với Độ chính xác riêng lẻ, đặc biệt là khi xử lý các tập dữ liệu mất cân bằng hoặc khi chi phí liên quan đến kết quả dương tính giả và kết quả âm tính giả khác nhau đáng kể.

Hiểu về độ chính xác và thu hồi

Trước khi tìm hiểu sâu hơn về Điểm F1, điều quan trọng là phải hiểu các thành phần của nó:

  • Độ chính xác : Chỉ số này trả lời câu hỏi: "Trong tất cả các trường hợp mà mô hình dự đoán là dương tính, có bao nhiêu trường hợp thực sự là dương tính?" Chỉ số này tập trung vào tính chính xác của các dự đoán dương tính, giảm thiểu các trường hợp dương tính giả (lỗi loại I). Độ chính xác cao rất quan trọng khi chi phí cho một trường hợp dương tính giả cao.
  • Thu hồi (Độ nhạy hoặc Tỷ lệ dương tính thực): Số liệu này trả lời câu hỏi: "Trong tất cả các trường hợp dương tính thực tế, mô hình đã xác định chính xác bao nhiêu trường hợp?" Số liệu này tập trung vào việc tìm tất cả các trường hợp có liên quan, giảm thiểu các trường hợp âm tính giả (lỗi loại II). Thu hồi cao là rất quan trọng khi việc bỏ lỡ một trường hợp dương tính sẽ tốn kém.

Các số liệu này được tính toán bằng cách sử dụng số lượng Kết quả dương tính thật (TP), Kết quả dương tính giả (FP) và Kết quả âm tính giả (FN) thu được từ ma trận nhầm lẫn .

Tại sao Điểm F1 lại quan trọng

Chỉ riêng độ chính xác có thể gây hiểu lầm, đặc biệt là với các tập dữ liệu mất cân bằng. Ví dụ, nếu một tập dữ liệu có 95% trường hợp tiêu cực và 5% trường hợp tích cực, một mô hình luôn dự đoán "tiêu cực" sẽ đạt được độ chính xác 95% nhưng sẽ vô dụng trong việc xác định các trường hợp tích cực (không thu hồi).

Điểm F1 giải quyết vấn đề này bằng cách tính toán trung bình hài hòa của Độ chính xác và Độ thu hồi. Trung bình hài hòa phạt các giá trị cực trị nhiều hơn trung bình số học đơn giản. Do đó, Điểm F1 cao đòi hỏi cả độ chính xác cao và độ thu hồi cao, đảm bảo sự cân bằng giữa hai yếu tố này. Nó dao động từ 0 (tệ nhất) đến 1 (tốt nhất).

Ứng dụng của F1-Score

Điểm F1 là một chỉ số đánh giá tiêu chuẩn trong nhiều lĩnh vực AI và ML:

Điểm F1 so với các số liệu liên quan

  • Độ chính xác : Đo độ chính xác tổng thể. Phù hợp với các tập dữ liệu cân bằng nhưng gây hiểu lầm cho các tập dữ liệu mất cân bằng.
  • Độ chính xác : Tập trung vào chất lượng của các dự đoán tích cực (giảm thiểu FP).
  • Nhắc lại : Tập trung vào số lượng kết quả dương tính thực tế được tìm thấy (giảm thiểu FN).
  • Độ chính xác trung bình trung bình (mAP) : Một số liệu phổ biến trong các vấn đề phát hiện và xếp hạng đối tượng, tính độ chính xác trung bình trên nhiều ngưỡng thu hồi và/hoặc lớp khác nhau. Nó cung cấp góc nhìn rộng hơn về hiệu suất trên các điểm vận hành khác nhau, không giống như Điểm F1 thường đánh giá một điểm duy nhất.
  • Diện tích dưới đường cong (AUC) : Thường đề cập đến diện tích dưới đường cong ROC , tóm tắt hiệu suất của mô hình trên tất cả các ngưỡng phân loại.

Việc lựa chọn số liệu phù hợp phụ thuộc vào vấn đề cụ thể và tầm quan trọng tương đối của việc giảm thiểu kết quả dương tính giả so với kết quả âm tính giả. Các công cụ như Ultralytics HUB cho phép theo dõi nhiều số liệu, bao gồm Điểm F1, trong quá trình đào tạo và đánh giá mô hình để giúp người dùng đưa ra quyết định sáng suốt. Khám phá hướng dẫn Ultralytics để biết hướng dẫn thực tế về đánh giá mô hình.

Đọc tất cả