혼동 행렬로 모델 성능을 이해하세요. AI 분류 정확도를 개선하기 위한 메트릭, 실제 사용 사례 및 도구를 살펴보세요.
혼동 행렬은 머신 러닝(ML)에서 특히 분류 모델의 성능을 평가하는 데 사용되는 기본 도구입니다. 혼동 행렬은 모델의 예측이 여러 클래스에 걸쳐 실제 기준값 레이블과 얼마나 잘 일치하는지를 명확하고 간결하게 요약해줍니다. 각 클래스에 대한 올바른 예측과 잘못된 예측의 수를 시각화하여 단순한 정확도보다 더 심층적인 인사이트를 제공하므로 실무자가 모델의 특정 오류 유형을 이해하는 데 도움이 됩니다.
혼동 행렬은 테스트 데이터 세트에 대해 예측된 클래스 레이블과 실제 클래스 레이블을 비교합니다. 이진 분류 문제(예: 긍정/부정 등 두 개의 클래스)의 경우, 행렬에는 일반적으로 네 개의 키 값이 포함됩니다:
이 네 가지 구성 요소는 다양한 성능 지표를 계산하기 위한 기초를 형성합니다. 다중 클래스 분류 문제의 경우 행렬이 확장되어 모든 클래스 간의 상호 작용을 보여줍니다.
전반적인 정확도는 성능을 전반적으로 파악할 수 있지만, 특히 한 클래스가 다른 클래스보다 훨씬 많은 불균형 데이터 세트의 경우 오해의 소지가 있을 수 있습니다. 혼동 매트릭스는 보다 세분화된 시각을 제공합니다:
혼동 행렬은 인공지능(AI)을 적용하는 다양한 도메인에서 널리 사용됩니다:
혼동 매트릭스를 관련 평가 도구와 구별하는 것이 중요합니다:
다음과 같은 모델을 학습할 때 Ultralytics YOLO 와 같은 모델을 객체 감지나 이미지 분류와 같은 작업을 위해 훈련할 때, 혼동 행렬은 검증 단계(Val 모드)에서 자동으로 생성됩니다. 이러한 매트릭스를 통해 사용자는 COCO 또는 사용자 정의 데이터 세트와 같은 데이터 세트 내의 다양한 클래스에서 모델이 얼마나 잘 수행되는지 시각화할 수 있습니다. Ultralytics HUB와 같은 도구는 모델을 훈련하고 혼동 행렬을 포함한 결과를 분석할 수 있는 환경을 제공하여 모델 평가에 대한 포괄적인 인사이트를 얻을 수 있게 해줍니다. 실제로 혼동 행렬에 대해 더 자세히 알아보려면 Scikit-learn 설명서와 같은 리소스에서 더 많은 예제를 확인할 수 있습니다.