F1 점수는 머신 러닝에서 특히 분류 모델의 성능을 평가할 때 중요한 지표입니다. 모델의 정밀도와 정확도에 대한 균형 잡힌 측정치를 제공하므로 불균형한 데이터 세트를 다룰 때 특히 유용합니다. F1-Score는 정확도보다 모델 성능에 대한 미묘한 관점을 제공하기 때문에 인공 지능 및 머신 러닝을 다루는 모든 사람에게 필수적입니다.
F1-Score는 정확도와 회상률의 조화 평균입니다. F1-Score를 이해하려면 먼저 정확도와 회수율의 개념을 파악하는 것이 중요합니다. 정확도는 양성 예측의 정확도를 측정하여 양성으로 예측된 인스턴스 중 실제로 양성인 비율이 얼마나 되는지를 나타냅니다. 정확도가 높다는 것은 모델이 긍정적인 결과를 예측할 때 그 예측이 맞을 가능성이 높다는 것을 의미합니다. 반면에 회수율은 양성 예측의 완전성을 측정하여 모델이 실제 양성 사례 중 몇 퍼센트를 정확하게 식별했는지를 보여줍니다. 회상률이 높다는 것은 모델이 대부분의 긍정적인 사례를 효과적으로 식별한다는 것을 의미합니다.
F1-Score는 이 두 가지 메트릭을 단일 점수로 결합하여 분류기의 성능을 균형 잡힌 시각에서 볼 수 있도록 하며, 특히 클래스 분포가 고르지 않은 경우에 유용합니다. F1-Score가 높으면 모델이 높은 정확도와 높은 재인식을 모두 가지고 있음을 나타냅니다. 특히 Ultralytics YOLO 모델을 사용한 객체 감지와 같이 객체를 정확하게 감지(정밀도)하고 이미지에 존재하는 객체의 모든 인스턴스를 찾는 것(재현율)이 중요한 시나리오에서 유용합니다.
F1-Score는 AI 및 ML의 다양한 애플리케이션에서 널리 사용되며, 특히 데이터 세트가 불균형하거나 오탐과 오탐 모두 상당한 비용이 발생하는 시나리오에서 널리 사용됩니다. 다음은 몇 가지 실제 사례입니다:
정확도는 일반적인 지표이지만, 한 클래스가 다른 클래스보다 훨씬 많은 불균형한 데이터 세트에서는 오해의 소지가 있을 수 있습니다. 예를 들어, 사기 거래가 드문 사기 탐지 시스템에서 모델은 대부분의 경우 '사기 없음'을 예측하여 높은 정확도를 달성할 수 있습니다. 하지만 이 모델은 리콜률과 F1 점수가 낮아 실제 사기 사례를 탐지하지 못할 가능성이 높습니다.
이러한 시나리오에서 F1-Score는 정확도와 재현율을 모두 고려함으로써 보다 유익한 평가를 제공합니다. 모델의 정확도는 높지만 F1-Score가 낮으면 정밀도와 회수율의 불균형을 의미하며, 모델이 소수 클래스를 효과적으로 처리하지 못하고 있음을 나타내는 경우가 많습니다. 따라서 모델을 평가할 때, 특히 Ultralytics YOLO 또는 이미지 분류와 같은 작업에서 F1-Score를 평균 평균 정밀도(mAP) 및 교집합에 대한 교차(IoU) 같은 다른 메트릭과 함께 고려하면 모델 성능을 보다 포괄적으로 이해할 수 있습니다. Ultralytics 에서는 이러한 YOLO 성능 메트릭을 평가하여 최적의 모델을 선택하고 조정할 수 있는 도구와 안내서를 제공합니다. 관련 메트릭에 대해 더 자세히 알아보려면 F1-Score에 대한 scikit-learn 문서와 같은 리소스에서 자세한 인사이트를 얻을 수 있습니다.