용어집

리콜

머신 러닝에서 리콜이 무엇인지, 왜 중요한지, AI 모델이 중요한 긍정적 사례를 효과적으로 포착하는 방법을 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

리콜은 머신 러닝 및 통계의 핵심 성능 지표로, 분류 및 정보 검색 작업에서 특히 중요합니다. 이는 모델이 데이터 세트에서 모든 관련 인스턴스를 정확하게 식별하는 능력을 측정합니다. 민감도 또는 진양성률(TPR)이라고도 하는 Recall은 다음과 같은 질문에 대한 답을 제공합니다: "모든 실제 양성 사례 중에서 모델이 양성으로 정확하게 예측한 사례는 몇 개입니까?"라는 질문에 답합니다. 높은 회상률은 양성 사례(오탐)를 놓칠 경우 심각한 결과를 초래하는 시나리오에서 매우 중요합니다.

핵심 개념

Recall은 데이터 세트 내의 실제 양성 사례에 초점을 맞추고 모델이 성공적으로 포착한 사례의 수를 정량화합니다. 이 수치는 실제 양성으로 정확하게 식별된 사례인 정양성(TP)과 실제 양성이지만 음성으로 잘못 식별된 사례인 오탐(FN)의 합에 대한 비율로 계산됩니다. 재인식이 높은 모델은 대부분의 긍정적인 사례를 정확하게 식별합니다. 모델 성능을 평가하려면 회상도를 이해하는 것이 필수적이며, 종종 혼동 매트릭스를 사용하여 시각화합니다.

리콜 대 정밀도

정확도는 종종 정확도와 함께 논의됩니다. 정확도는 실제로 정확하게 식별된 양성 반응의 비율을 측정하는 반면, 정밀도는 예측된 양성 반응 중 실제로 정확한 비율(TP / (TP + 오탐)의 비율)을 측정합니다. 정확도와 회수율 사이에는 종종 상충 관계가 있으며, 어느 한 쪽을 최적화하면 다른 쪽에 부정적인 영향을 미칠 수 있으며, 회수율과 정확도 중 우선순위를 정하는 것은 특정 애플리케이션에 따라 달라집니다:

  • 높은 리콜은 양성 인스턴스를 놓치는 비용(오탐)이 높을 때 선호됩니다.
  • 부정 인스턴스를 긍정으로 잘못 식별하는 비용(오탐)이 높을 경우 고정밀도가 선호됩니다.

F1 점수는 정확도와 회수율의 균형을 맞추는 단일 지표를 제공합니다.

실제 애플리케이션

리콜은 많은 분야에서 중요한 평가 지표입니다:

  • 의료 이미지 분석: AI를 이용한 종양 검출과 같은 작업에서는 높은 회상률이 필수적입니다. 악성 종양을 놓치면(위음성) 치료가 지연되어 심각한 결과를 초래할 수 있습니다. 따라서 진단 시스템은 추가 검토를 위해 일부 양성 사례를 플래그(낮은 정밀도)로 지정하더라도 높은 민감도(Recall)를 위해 최적화되는 경우가 많습니다. 의료 분야의 AI에서는 포괄적인 탐지를 보장하는 것이 가장 중요합니다.
  • 사기 탐지: 사기성 금융 거래를 탐지하는 시스템을 구축할 때는 리콜을 극대화하는 것이 중요합니다. 사기 거래를 식별하지 못하면(오탐) 상당한 금전적 손실로 이어질 수 있습니다. 오경보(오탐)를 최소화하는 것도 바람직하지만, 대부분의 사기 행위를 포착하는 것이 더 우선시되어야 합니다.

컴퓨터 비전과의 관련성

컴퓨터 비전에서 리콜은 객체 감지이미지 분할과 같은 작업을 평가하는 데 필수적입니다. 다음과 같은 객체 감지 모델의 경우 Ultralytics YOLO와 같은 객체 감지 모델의 경우, Recall은 모델이 이미지 내에서 특정 객체 클래스의 모든 인스턴스를 얼마나 잘 찾아내는지를 나타냅니다. Recall이 높다는 것은 모델이 감지해야 하는 객체를 거의 놓치지 않는다는 것을 의미합니다. 일반적으로 정밀도 및 평균 정밀도(mAP) 와 함께 사용되어 탐지 성능에 대한 종합적인 평가를 제공하며, YOLO 성능 메트릭 가이드에 자세히 설명되어 있습니다. 사용자가 모델 훈련 및 검증 중에 이러한 메트릭을 추적하는 데 도움이 되는 도구는 Ultralytics HUB와 같은 플랫폼 내에 있습니다. 리콜에 대한 이해를 통해 개발자는 보안 경보 시스템에서 포괄적인 탐지를 보장하는 등 특정 요구 사항에 맞게 모델을 미세 조정할 수 있습니다. 성능을 평가하려면 혼동 매트릭스에서 파생된 메트릭을 분석하고 잠재적으로 불균형한 데이터 세트의 컨텍스트를 고려해야 하는 경우가 많습니다.

모두 보기