용어집

평균 평균 정밀도(mAP)

자율 주행 및 헬스케어와 같은 AI 애플리케이션의 객체 감지 모델을 평가할 때 평균 정밀도(mAP)의 중요성에 대해 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

평균 평균 정밀도(mAP)는 널리 사용되는 객체 감지 모델의 성능을 평가하는 데 널리 사용되는 지표입니다. Ultralytics YOLO 제품군에서 사용되는 지표입니다. 이 지표는 다양한 클래스와 신뢰도 수준에서 객체를 정확하게 식별하고 위치를 파악하는 모델의 능력을 요약한 단일의 종합적인 점수를 제공합니다. 단순한 메트릭과 달리, mAP는 모든 관련 객체를 찾는 것(리콜)과 찾은 객체가 실제로 정확한지 확인하는 것(정확도) 사이의 균형을 효과적으로 맞추기 때문에 자율 시스템이나 의료 진단과 같은 복잡한 애플리케이션에서 사용되는 모델을 평가하는 데 매우 중요합니다. 컴퓨터 비전(CV) 모델을 개발하거나 배포하는 모든 사람에게 mAP에 대한 이해는 필수적입니다.

기본 사항 이해하기: 정확도 및 리콜

mAP를 이해하려면 먼저 정밀도와 리콜을 파악하는 것이 중요합니다. 객체 감지의 맥락에서:

  • 정확도: 식별된 객체 중 실제로 얼마나 많은 객체가 정확한지 측정합니다. 정확도가 높다는 것은 모델이 오탐을 거의 예측하지 않는다는 것을 의미합니다.
  • 리콜: 실제 존재하는 객체 중 모델이 얼마나 많은 객체를 정확하게 식별했는지 측정합니다. 회상률이 높다는 것은 모델이 대부분의 관련 객체를 찾아낸다는 의미입니다(오탐이 적음).

이 두 지표는 종종 반비례 관계를 가지며, 한 지표를 개선하면 다른 지표가 저하될 수 있습니다. mAP는 이러한 상충 관계의 여러 지점에서 모델을 평가하는 방법을 제공하여 성능에 대한 보다 균형 잡힌 시각을 제공합니다. 정확도 및 회상률의 기본 사항에 대한 자세한 내용은 Wikipedia에서 확인할 수 있습니다.

mAP 계산 방법

mAP 계산에는 여러 단계가 포함되며, 다양한 객체 클래스와 탐지 임계값에 대한 모델의 성능을 강력하게 평가합니다:

  1. 신뢰도 정렬: 각 개체 클래스에 대해 모델의 예측(감지된 경계 상자)은 신뢰도 점수에 따라 가장 높은 것부터 가장 낮은 것까지 정렬됩니다.
  2. 정밀도-리콜 커브: 각 클래스에 대해 정밀도-재콜 곡선이 생성됩니다. 이 곡선은 다양한 신뢰 임계값에서 계산된 정확도 값에 대한 정확도를 표시합니다. 임계값이 낮아질수록 일반적으로 정확도는 높아지지만(더 많은 개체가 감지됨), 정밀도는 낮아질 수 있습니다(더 많은 오탐이 포함될 수 있음).
  3. 평균 정밀도(AP): 단일 클래스의 평균 정밀도(AP)는 해당 정밀도-재콜 곡선 아래의 영역으로 계산됩니다. 이는 모든 리콜 수준에서 특정 클래스에 대한 모델의 성능을 요약한 단일 수치를 제공합니다. 이 영역을 근사화하는 데는 여러 가지 방법이 있습니다.
  4. 평균 평균 정밀도(mAP): 마지막으로, mAP는 데이터 세트의 모든 개체 클래스에서 AP 값의 평균을 구하여 계산됩니다. 이는 전체 데이터 세트에 대한 모델의 전반적인 성능 점수를 제공합니다.

종종 mAP는 특정 IoU(Intersection over Union) 임계값에서 보고됩니다. IoU는 예측된 바운딩 박스와 실측(실제) 바운딩 박스 사이의 중첩을 측정합니다. 일반적인 mAP 변형은 다음과 같습니다:

  • mAP@0.5 (또는 mAP50): 0.5의 고정 IoU 임계값을 사용하여 계산됩니다. 이는 PASCAL VOC 챌린지와 같은 벤치마크에서 사용되는 표준 지표입니다. 기준 진실과의 IoU가 0.5 이상인 경우에만 탐지가 올바른 것으로 간주됩니다.
  • mAP@.5:.95 (또는 mAP[.5:.95]): 일반적으로 0.5에서 0.95 사이의 여러 IoU 임계값에 걸쳐 mAP를 평균하여 계산되며 0.05의 단계로 계산됩니다. COCO 데이터 세트 평가에 일반적으로 사용되는 이 메트릭은 다양한 로컬라이제이션 정확도 요구 사항에서 성능을 고려함으로써 보다 포괄적인 평가를 제공합니다.

이러한 메트릭이 YOLO 모델에 구체적으로 어떻게 적용되는지 자세히 알아보려면 Ultralytics YOLO 성능 메트릭 가이드를 참조하세요.

mAP가 중요한 이유

평균 평균 정밀도는 객체 감지 모델의 성능을 전체적으로 파악할 수 있기 때문에 매우 중요합니다. 이는 학습 데이터에 정의된 모든 클래스에 걸쳐 분류 정확도(객체 클래스가 올바른가?)와 위치 정확도(경계 상자가 올바르게 배치되었는가?)를 동시에 설명합니다. 따라서 특히 객체 카테고리가 여러 개이거나 클래스 분포가 불균형한 데이터 세트에서 정확도나 리콜을 따로따로 보는 것보다 더 많은 정보를 얻을 수 있습니다. 일반적으로 mAP 점수가 높을수록 더 강력하고 신뢰할 수 있는 객체 감지 모델임을 나타냅니다. 신중한 데이터 증강, 하이퍼파라미터 튜닝, 적절한 모델 아키텍처 선택(예 YOLO11)와 같은 기술은 mAP를 개선하기 위한 일반적인 전략입니다.

실제 애플리케이션

mAP는 정확성과 신뢰성이 가장 중요한 실제 작업의 모델을 평가하는 데 매우 중요합니다:

  • 자율주행 차량: 자율주행 솔루션용 AI에서 객체 감지 모델은 보행자, 차량, 신호등, 장애물을 정확하게 감지해야 합니다. mAP은 다양한 감지 모델의 성능을 측정하고 비교할 수 있는 표준 방법을 제공하여(예: YOLOv8 YOLOv11 비교) 안전에 중요한 결정을 위한 높은 신뢰성을 보장합니다.
  • 의료 이미징: 의료 스캔에서 종양 탐지와 같은 의료 분야의 AI 애플리케이션에서 mAP는 모델이 이상 징후를 얼마나 잘 식별하고 묘사할 수 있는지 평가하는 데 도움이 됩니다. mAP가 높으면 임상의는 AI 도구의 정확한 지원을 받아 진단 및 치료 계획을 세우는 데 도움을 받을 수 있습니다. 여기에는 종종 뇌종양 탐지 데이터 세트와 같은 특수 데이터 세트에 대한 학습이 포함됩니다.

다른 애플리케이션으로는 보안 감시, 로봇 공학(로봇 공학에 컴퓨터 비전 통합), 소매 분석(더 스마트한 소매점 재고 관리를 위한 AI), 농업 등이 있습니다.

mAP와 다른 지표 비교

머신러닝(ML)에서 사용되는 관련 평가 지표와 mAP를 구별하는 것이 중요합니다:

  • 정확도: 주로 분류 작업에 사용되는 정확도는 전체 인스턴스 수 중 정확한 예측(정탐과 정탐 모두)의 전체 비율을 측정합니다. 정확도는 로컬라이제이션 품질을 직접 평가하지 않으며, 특히 배경 클래스가 우세한 불균형 데이터 세트의 경우 객체 감지에서 오해의 소지가 있을 수 있습니다.
  • 유니온을 통한 교차점(IoU): 예측된 경계 상자와 기준 실측 경계 상자 사이의 공간적 중첩을 측정합니다. IoU는 개별 탐지에 대한 로컬라이제이션 품질을 평가하는 반면, mAP는 IoU 임계값(예: 0.5 또는 0.5:0.95 범위)을 통합하여 탐지가 진정한 양성으로 간주되는지 확인한 다음 클래스 및 신뢰 수준 전반에 걸쳐 성능을 집계합니다. IoU 자체는 mAP 계산 내에서 사용되는 구성 요소이지 이를 대체하는 것이 아닙니다.

이러한 차이점을 이해하는 것은 특정 작업 및 평가 목표에 따라 적절한 지표를 선택하는 데 매우 중요합니다. 자세한 내용은 모델 평가 및 미세 조정 가이드를 참조하세요.

도구 및 벤치마크

사용자는 모델 훈련, 추적 및 평가를 위해 Ultralytics HUB와 같은 도구를 사용할 수 있으며, 모델 훈련검증 프로세스 중 핵심 성과 지표로 mAP가 두드러지게 사용됩니다. 다음과 같은 ML 프레임워크 PyTorchTensorFlow 와 같은 ML 프레임워크는 이러한 객체 감지 모델을 구축하고 훈련하기 위한 기본 구성 요소를 제공합니다. COCOPASCAL VOC와 같은 표준화된 데이터 세트는 공개 리더보드와 연구 논문에서 객체 감지 모델을 비교하기 위한 주요 지표로 mAP를 사용하여 해당 분야의 발전을 주도하고 있습니다. Ultralytics 모델 비교 페이지에서 mAP로 측정되는 다양한 모델 성능을 탐색하고 비교할 수 있습니다.

모두 보기