자율 주행 및 헬스케어와 같은 AI 애플리케이션의 객체 감지 모델을 평가할 때 평균 정밀도(mAP)의 중요성에 대해 알아보세요.
평균 평균 정밀도(mAP)는 컴퓨터 비전, 특히 객체 감지 작업에서 광범위하게 사용되는 중요한 평가 지표입니다. 모든 객체 범주에서 예측의 정확도를 측정하여 모델의 성능을 요약하는 단일의 종합적인 점수를 제공합니다. mAP 점수는 분류의 정확성(모델이 말하는 물체가 맞는가?)과 로컬라이제이션의 품질(예측된 경계 상자가 실제 물체의 위치와 얼마나 잘 일치하는가?)을 모두 고려합니다. 균형 잡힌 평가를 제공하기 때문에 mAP는 Ultralytics YOLO와 같은 다양한 물체 감지 모델의 성능을 비교하는 표준 지표가 되었습니다.
mAP를 이해하려면 먼저 핵심 구성 요소를 파악하는 것이 도움이 됩니다: 정밀도, 리콜, IoU(Intersection over Union)입니다.
mAP 계산은 이러한 개념을 종합합니다. 각 객체 클래스에 대해 다양한 신뢰도 점수 임계값에서 정확도 대비 정확도를 플롯하여 정확도-재콜 곡선을 생성합니다. 해당 클래스의 평균 정밀도(AP)는 이 곡선 아래의 영역으로, 특정 클래스에 대한 모델의 성능을 나타내는 단일 숫자를 제공합니다. 마지막으로, 모든 객체 클래스에 대한 AP 점수의 평균을 구하여 mAP를 계산합니다. 널리 사용되는 COCO 데이터 세트의 평가 방식과 같은 일부 평가 방식은 한 단계 더 나아가 여러 IoU 임계값에 걸쳐 mAP를 평균화하여 더욱 강력한 평가를 제공합니다.
다른 평가 지표와 관련이 있지만 mAP는 뚜렷한 목적을 가지고 있습니다.
표준화된 벤치마크 데이터 세트는 객체 감지 분야를 발전시키는 데 매우 중요합니다. PASCAL VOC 및 COCO와 같은 데이터 세트는 공개 리더보드에서 제출물의 순위를 매기는 기본 메트릭으로 mAP를 사용합니다. 이를 통해 연구자와 실무자는 YOLOv8 및 YOLO11과 같은 다양한 모델을 객관적으로 비교할 수 있습니다.
Ultralytics HUB와 같은 플랫폼은 사용자가 모델 훈련 및 검증 중에 성능을 추적할 수 있도록 도와주는 mAP 기능을 두드러지게 제공합니다. 이러한 모델을 구동하는 기본 딥 러닝 프레임워크(예: PyTorch 및 TensorFlow)는 mAP를 사용하여 궁극적으로 평가되는 모델 구축 및 훈련에 필요한 도구를 제공합니다.
mAP 메트릭은 신뢰할 수 있는 AI 시스템을 개발하는 데 있어 기본이 됩니다.