용어집

곡선 아래 영역(AUC)

ML 모델 평가에서 곡선 아래 면적(AUC)의 중요성에 대해 알아보세요. 이점, ROC 곡선 인사이트 및 실제 적용 사례에 대해 알아보세요.

곡선 아래 면적(AUC)은 주로 머신 러닝(ML) 에서 이진 분류 모델을 평가하는 데 사용되는 기본적인 성능 지표입니다. 이는 가능한 모든 분류 임계값에 걸쳐 긍정적인 분류와 부정적인 분류를 구별하는 모델의 능력을 정량화합니다. AUC 점수는 0에서 1 사이의 범위이며, 값이 높을수록 모델 성능이 우수함을 나타냅니다. 0.5점인 모델은 무작위 확률보다 성능이 좋지 않은 반면, 클래스를 완벽하게 구분하는 완벽한 모델은 1.0의 AUC를 달성합니다. 이 메트릭은 특정 임계값 선택과 무관하게 분류 성능에 대한 단일의 종합적인 측정값을 제공합니다.

ROC 곡선 이해하기

AUC 값은 수신기 작동 특성(ROC) 곡선에서 직접 도출됩니다. ROC 곡선은 판별 임계값이 달라질 때 이진 분류기의 진단 능력을 보여주는 그래픽 플롯입니다. 이 그래프는 다양한 임계값 설정에서 민감도 또는 리콜이라고도 하는 진양성률(TPR)을 Y축에, 오탐률(FPR)을 X축에 그래프로 표시합니다. AUC는 이 ROC 곡선 아래의 전체 2차원 영역을 나타냅니다. ROC 곡선에 대한 포괄적인 개요는 Wikipedia에서 확인할 수 있습니다.

AUC의 해석

AUC는 모델이 무작위로 선택된 긍정적인 사례를 무작위로 선택된 부정적인 사례보다 더 높은 순위를 매길 확률로 해석됩니다. 따라서 모델의 전반적인 변별력을 측정하는 척도가 됩니다. AUC의 주요 장점 중 하나는 정확도와 같은 메트릭에 비해 클래스 불균형에 상대적으로 민감하지 않다는 것입니다. 한 클래스가 다른 클래스보다 훨씬 많은 데이터 세트(실제 문제에서 흔히 볼 수 있는 시나리오)에서는 정확도가 오해의 소지가 있는 반면, AUC는 모델이 클래스를 얼마나 잘 구분하는지를 보다 강력하게 측정할 수 있는 척도를 제공합니다. AUC가 1에 가까울수록 분리 능력이 뛰어난 모델이고, 0.5에 가까울수록 무작위 추측과 유사하게 변별력이 떨어진다는 것을 나타냅니다. 효과적인 모델 평가를 위해서는 이러한 해석을 이해하는 것이 중요합니다.

AI 및 ML 분야의 애플리케이션

AUC는 이진 분류 작업이 중요한 다양한 영역에서 널리 사용되고 있습니다. 다음은 두 가지 예입니다:

의료 진단: 의료 이미지 분석에서 모델은 종종 질병(예: 종양, 당뇨병성 망막증)의 유무를 감지하도록 훈련됩니다. AUC는 의료 분야에서 이러한 AI 모델이 다양한 진단 임계값에 걸쳐 이미지를 기반으로 건강한 환자와 질병에 걸린 환자를 얼마나 잘 구분할 수 있는지 평가하는 데 사용됩니다. 의료 연구에서 AUC의 중요성은 잘 알려져 있습니다.
사기 탐지: 금융 기관은 사기 거래를 식별하기 위해 머신러닝 모델을 사용합니다. 이는 전형적인 이분법적 분류 문제(사기 대 비사기)입니다. AUC는 잠재적 사기 활동을 플래그 지정하는 모델의 전반적인 효율성을 평가하는 동시에 금융 분야 AI에 필수적인 오경보를 최소화하는 데 도움이 됩니다.

다음을 포함한 많은 딥 러닝(DL) 프레임워크 및 라이브러리 PyTorch 와 TensorFlow를 포함한 많은 딥 러닝 프레임워크와 라이브러리가 이러한 분류기를 구축하는 데 사용됩니다. Scikit-learn과 같은 도구는 ROC AUC 점수를 계산하는 편리한 기능을 제공하여 평가 프로세스를 간소화합니다. 또한 Ultralytics HUB와 같은 플랫폼은 이러한 메트릭과 관련된 모델의 훈련 및 평가를 용이하게 해줍니다.

AUC와 다른 지표 비교

AUC는 중요한 지표이지만, 컴퓨터 비전(CV) 및 머신러닝에서 사용되는 다른 평가 지표와 어떻게 다른지 이해하는 것이 중요합니다:

AUC 대 정확도: 정확도는 예측의 전반적인 정확도를 측정하지만 불균형한 데이터 세트에서는 오해를 불러일으킬 수 있습니다. AUC는 임계값에 독립적인 분리 가능성 측정값을 제공하므로 이러한 경우 더 신뢰할 수 있습니다.
AUC 대 정밀도-재콜: 양성 클래스가 드물고 주요 관심사인 불균형 데이터 세트의 경우(예: 희귀 질환 탐지), 정밀도-재콜 곡선과 해당 영역(AUC-PR)이 ROC AUC보다 더 많은 정보를 제공할 수 있습니다. 정확도 및 회수율과 같은 메트릭은 특히 양성 클래스와 관련된 성능에 중점을 둡니다. F1 점수도 정확도와 회수율의 균형을 맞춥니다.
AUC와 mAP/IoU 비교: AUC는 주로 이진 분류 작업에 사용됩니다. 다음과 같은 모델에서 일반적으로 사용되는 객체 감지 작업의 경우 Ultralytics YOLO와 같은 모델의 경우 평균 평균 정밀도(mAP) 및 교집합 (IoU) 과 같은 메트릭이 표준입니다. 이러한 메트릭은 경계 상자를 사용하여 감지된 객체의 분류 정확도와 위치 정확도를 모두 평가합니다. YOLO 성능 메트릭에 대한 자세한 내용은 여기에서 확인할 수 있습니다. 서로 다른 모델을 비교하는 데는 종종 이러한 특정 메트릭을 분석하는 것이 포함됩니다( Ultralytics 모델 비교에서 볼 수 있듯이).

올바른 메트릭을 선택하는 것은 특정 문제, 데이터 세트의 특성(예: 클래스 균형), AI 프로젝트의 목표에 따라 달라집니다. AUC는 견고성과 해석 가능성으로 인해 이진 분류 성능을 평가하는 초석으로 남아 있습니다.

곡선 아래 영역(AUC)

YOLO 모델을 Ultralytics HUB로 간단히
훈련

혁신을 지원하는 유연한 엔터프라이즈 라이선싱 솔루션

다음을 사용하여 몇 초 만에 AI 모델을 훈련하세요. Ultralytics YOLO

Ultralytics HUB로 간단히 YOLO 모델 교육

ROC 곡선 이해하기

AUC의 해석

AI 및 ML 분야의 애플리케이션

AUC와 다른 지표 비교

블로그 더 보기

Ultralytics 커뮤니티 가입하기

곡선 아래 영역(AUC)

YOLO 모델을 Ultralytics HUB로 간단히훈련

혁신을 지원하는 유연한 엔터프라이즈 라이선싱 솔루션

다음을 사용하여 몇 초 만에 AI 모델을 훈련하세요. Ultralytics YOLO

Ultralytics HUB로 간단히 YOLO 모델 교육

ROC 곡선 이해하기

AUC의 해석

AI 및 ML 분야의 애플리케이션

AUC와 다른 지표 비교

블로그 더 보기

Ultralytics 커뮤니티 가입하기

YOLO 모델을 Ultralytics HUB로 간단히
훈련