용어집

평균 평균 정밀도(mAP)

자율 주행 및 헬스케어와 같은 AI 애플리케이션의 객체 감지 모델을 평가할 때 평균 정밀도(mAP)의 중요성에 대해 알아보세요.

평균 평균 정밀도(mAP)는 컴퓨터 비전, 특히 객체 감지 작업에서 광범위하게 사용되는 중요한 평가 지표입니다. 모든 객체 범주에서 예측의 정확도를 측정하여 모델의 성능을 요약하는 단일의 종합적인 점수를 제공합니다. mAP 점수는 분류의 정확성(모델이 말하는 물체가 맞는가?)과 로컬라이제이션의 품질(예측된 경계 상자가 실제 물체의 위치와 얼마나 잘 일치하는가?)을 모두 고려합니다. 균형 잡힌 평가를 제공하기 때문에 mAP는 Ultralytics YOLO와 같은 다양한 물체 감지 모델의 성능을 비교하는 표준 지표가 되었습니다.

mAP 작동 방식

mAP를 이해하려면 먼저 핵심 구성 요소를 파악하는 것이 도움이 됩니다: 정밀도, 리콜, IoU(Intersection over Union)입니다.

  • 정확도: 정확도: 모델의 예측이 얼마나 정확한지 측정합니다. 다음과 같은 질문에 대한 답을 제공합니다: "모델이 감지한 모든 객체 중 몇 퍼센트가 맞았나요?"라는 질문에 답합니다.
  • 리콜: 모델이 모든 실제 객체를 얼마나 잘 찾는지 측정합니다. 다음과 같은 질문에 답합니다: "이미지에 존재하는 모든 실제 물체 중에서 모델이 성공적으로 감지한 비율은 몇 퍼센트입니까?"라는 질문에 답합니다.
  • 유니온에 대한 교차(IoU): 예측된 바운딩 박스가 실측값(수동으로 레이블이 지정된) 바운딩 박스와 얼마나 겹치는지를 정량화하는 메트릭입니다. 일반적으로 IoU가 특정 임계값(예: 0.5) 이상인 경우 감지를 정탐으로 간주합니다.

mAP 계산은 이러한 개념을 종합합니다. 각 객체 클래스에 대해 다양한 신뢰도 점수 임계값에서 정확도 대비 정확도를 플롯하여 정확도-재콜 곡선을 생성합니다. 해당 클래스의 평균 정밀도(AP)는 이 곡선 아래의 영역으로, 특정 클래스에 대한 모델의 성능을 나타내는 단일 숫자를 제공합니다. 마지막으로, 모든 객체 클래스에 대한 AP 점수의 평균을 구하여 mAP를 계산합니다. 널리 사용되는 COCO 데이터 세트의 평가 방식과 같은 일부 평가 방식은 한 단계 더 나아가 여러 IoU 임계값에 걸쳐 mAP를 평균화하여 더욱 강력한 평가를 제공합니다.

mAP와 다른 지표의 구별

다른 평가 지표와 관련이 있지만 mAP는 뚜렷한 목적을 가지고 있습니다.

  • 정확도: 정확도: 정확도는 총 예측 수에 대한 올바른 예측의 비율을 측정합니다. 일반적으로 분류 작업에 사용되며 예측이 정확하게 분류되고 위치가 파악되어야 하는 물체 감지에는 적합하지 않습니다.
  • F1-점수: F1-점수는 정확도와 회수율의 조화 평균입니다. 유용하지만 일반적으로 단일 신뢰 임계값에서 계산됩니다. 반면, mAP는 모든 임계값에 걸쳐 성능을 평균화하여 보다 포괄적인 평가를 제공합니다.
  • 신뢰도: 신뢰도: 모델 전체에 대한 평가 지표가 아니라 각 개별 예측에 할당된 점수로, 모델이 해당 탐지 항목에 대해 얼마나 확신하는지를 나타냅니다. mAP 계산은 이러한 신뢰도 점수를 사용하여 정확도-재콜 곡선을 만듭니다.

도구 및 벤치마크

표준화된 벤치마크 데이터 세트는 객체 감지 분야를 발전시키는 데 매우 중요합니다. PASCAL VOCCOCO와 같은 데이터 세트는 공개 리더보드에서 제출물의 순위를 매기는 기본 메트릭으로 mAP를 사용합니다. 이를 통해 연구자와 실무자는 YOLOv8YOLO11과 같은 다양한 모델을 객관적으로 비교할 수 있습니다.

Ultralytics HUB와 같은 플랫폼은 사용자가 모델 훈련검증 중에 성능을 추적할 수 있도록 도와주는 mAP 기능을 두드러지게 제공합니다. 이러한 모델을 구동하는 기본 딥 러닝 프레임워크(예: PyTorchTensorFlow)는 mAP를 사용하여 궁극적으로 평가되는 모델 구축 및 훈련에 필요한 도구를 제공합니다.

실제 애플리케이션

mAP 메트릭은 신뢰할 수 있는 AI 시스템을 개발하는 데 있어 기본이 됩니다.

  1. 자율주행 차량: 자율 주행 차량용 AI에서 인식 모델은 자동차, 보행자, 자전거, 교통 표지판 등 다양한 물체를 정확하게 감지해야 합니다. Argoverse와 같은 까다로운 데이터 세트에서 높은 맵 점수는 모델이 모든 중요 클래스에서 견고하고 신뢰할 수 있다는 것을 의미하며, 이는 안전성을 보장하는 데 필수적입니다. Waymo와 같은 이 분야의 선도적인 기업은 mAP와 같은 지표를 사용한 엄격한 평가에 크게 의존하고 있습니다.
  2. 의료 이미지 분석: 뇌종양 데이터 세트와 같은 데이터 세트를 사용하여 스캔에서 종양이나 병변과 같은 이상을 감지하도록 모델을 훈련할 때, mAP는 전반적인 진단 정확도를 평가하는 데 사용됩니다. mAP가 높을수록 모델이 가장 일반적인 유형의 이상 징후를 잘 감지할 뿐만 아니라 드물지만 똑같이 중요한 상태를 식별하는 데도 효과적이라는 것을 보장합니다. 이 종합적인 평가는 의료 환경에 모델을 배포하기 전에 반드시 거쳐야 하는 핵심 단계입니다.

울트라 애널리틱스 커뮤니티 가입

AI의 미래와 함께하세요. 글로벌 혁신가들과 연결, 협업, 성장하기

지금 가입하기
링크가 클립보드에 복사됨