머신 러닝에서 리콜이 무엇인지, 왜 중요한지, AI 모델이 중요한 긍정적 사례를 효과적으로 포착하는 방법을 알아보세요.
리콜은 머신 러닝 및 통계의 핵심 성능 지표로, 분류 및 정보 검색 작업에서 특히 중요합니다. 이는 모델이 데이터 세트에서 모든 관련 인스턴스를 정확하게 식별하는 능력을 측정합니다. 민감도 또는 진양성률(TPR)이라고도 하는 Recall은 다음과 같은 질문에 대한 답을 제공합니다: "모든 실제 양성 사례 중에서 모델이 양성으로 정확하게 예측한 사례는 몇 개입니까?"라는 질문에 답합니다. 높은 회상률은 양성 사례(오탐)를 놓칠 경우 심각한 결과를 초래하는 시나리오에서 매우 중요합니다.
Recall은 데이터 세트 내의 실제 양성 사례에 초점을 맞추고 모델이 성공적으로 포착한 사례의 수를 정량화합니다. 이 수치는 실제 양성으로 정확하게 식별된 사례인 정양성(TP)과 실제 양성이지만 음성으로 잘못 식별된 사례인 오탐(FN)의 합에 대한 비율로 계산됩니다. 재인식이 높은 모델은 대부분의 긍정적인 사례를 정확하게 식별합니다. 모델 성능을 평가하려면 회상도를 이해하는 것이 필수적이며, 종종 혼동 매트릭스를 사용하여 시각화합니다.
정확도는 종종 정확도와 함께 논의됩니다. 정확도는 실제로 정확하게 식별된 양성 반응의 비율을 측정하는 반면, 정밀도는 예측된 양성 반응 중 실제로 정확한 비율(TP / (TP + 오탐)의 비율)을 측정합니다. 정확도와 회수율 사이에는 종종 상충 관계가 있으며, 어느 한 쪽을 최적화하면 다른 쪽에 부정적인 영향을 미칠 수 있으며, 회수율과 정확도 중 우선순위를 정하는 것은 특정 애플리케이션에 따라 달라집니다:
F1 점수는 정확도와 회수율의 균형을 맞추는 단일 지표를 제공합니다.
리콜은 많은 분야에서 중요한 평가 지표입니다:
컴퓨터 비전에서 리콜은 객체 감지 및 이미지 분할과 같은 작업을 평가하는 데 필수적입니다. 다음과 같은 객체 감지 모델의 경우 Ultralytics YOLO와 같은 객체 감지 모델의 경우, Recall은 모델이 이미지 내에서 특정 객체 클래스의 모든 인스턴스를 얼마나 잘 찾아내는지를 나타냅니다. Recall이 높다는 것은 모델이 감지해야 하는 객체를 거의 놓치지 않는다는 것을 의미합니다. 일반적으로 정밀도 및 평균 정밀도(mAP) 와 함께 사용되어 탐지 성능에 대한 종합적인 평가를 제공하며, YOLO 성능 메트릭 가이드에 자세히 설명되어 있습니다. 사용자가 모델 훈련 및 검증 중에 이러한 메트릭을 추적하는 데 도움이 되는 도구는 Ultralytics HUB와 같은 플랫폼 내에 있습니다. 리콜에 대한 이해를 통해 개발자는 보안 경보 시스템에서 포괄적인 탐지를 보장하는 등 특정 요구 사항에 맞게 모델을 미세 조정할 수 있습니다. 성능을 평가하려면 혼동 매트릭스에서 파생된 메트릭을 분석하고 잠재적으로 불균형한 데이터 세트의 컨텍스트를 고려해야 하는 경우가 많습니다.