곡선 아래 면적(AUC)은 머신 러닝, 특히 이진 분류 문제에서 모델의 성능을 평가하기 위해 널리 사용되는 지표입니다. 이는 분리 가능성의 정도 또는 척도를 나타내며, 클래스를 구분하는 모델의 능력을 나타냅니다. AUC의 범위는 0에서 1 사이이며, 값이 높을수록 모델 성능이 우수하다는 것을 의미합니다. AUC가 1인 모델은 완벽한 분류를 의미하며, AUC가 0.5인 모델은 무작위 추측보다 나은 모델이 아님을 나타냅니다.
AUC는 본질적으로 수신기 작동 특성(ROC) 곡선과 연결되어 있습니다. ROC 곡선은 모델의 성능을 그래픽으로 표현한 것으로, 다양한 임계값 설정에서 실제 양성률(TPR)과 오탐률(FPR)을 비교하여 그래프로 표시합니다. 리콜이라고도 하는 TPR은 정확하게 식별된 실제 긍정의 비율을 측정하는 반면, FPR은 긍정으로 잘못 분류된 실제 부정의 비율을 측정합니다. 이름에서 알 수 있듯이 AUC는 이 ROC 곡선 아래의 영역으로, 가능한 모든 임계값에 걸쳐 모델의 성능을 요약하는 단일 스칼라 값을 제공합니다.
AUC는 여러 가지 이유로 중요한 지표입니다. 첫째, 임계값 불변성이므로 어떤 분류 임계값을 선택하든 관계없이 모델 예측의 품질을 측정합니다. 이는 오탐과 오탐의 비용이 다양하거나 불균형한 데이터 세트를 다룰 때 특히 유용합니다. 둘째, AUC는 가능한 모든 분류 임계값에 걸쳐 모델의 성능을 종합적으로 파악할 수 있어 불균형한 시나리오에서 오해의 소지가 있는 정확도와 같은 지표보다 더 미묘한 차이를 파악할 수 있습니다.
AUC는 다양한 실제 애플리케이션에서 다양한 머신러닝 모델의 성능을 평가하고 비교하는 데 사용됩니다. 다음은 두 가지 구체적인 예입니다:
AUC는 중요한 지표이기는 하지만 다른 평가 지표와 어떻게 다른지 이해하는 것이 중요합니다:
AUC는 특히 데이터 세트가 불균형하거나 오분류로 인한 비용이 다양한 시나리오에서 분류 모델의 성능을 평가하는 데 강력한 지표입니다. 임계값 불변의 특성과 가능한 모든 임계값에 대한 포괄적인 뷰를 제공하므로 머신 러닝 실무자의 툴킷에서 매우 유용한 도구입니다. AUC와 ROC 곡선과의 관계, 그리고 그 응용을 이해하면 효과적인 머신 러닝 모델을 개발하고 평가하는 능력을 크게 향상시킬 수 있습니다. 고급 컴퓨터 비전 작업을 하는 사람들에게는 다음과 같은 프레임워크가 유용합니다. Ultralytics YOLO 와 같은 프레임워크는 모델 개발 및 평가를 위한 강력한 도구를 제공하며, 여기에는 AUC와 같은 메트릭도 포함됩니다. AI와 컴퓨터 비전에 대해 자세히 알아보려면 Ultralytics 용어집을 참조하세요. 또한 Ultralytics 에서 커리어를 탐색하여 최첨단 AI 개발에 참여할 수도 있습니다.