앵커 기반 감지기가 정밀한 위치 파악, 확장 적응성, 실제 애플리케이션을 통해 물체 감지를 혁신하는 방법을 알아보세요.
앵커 기반 감지기는 객체 감지를 수행하기 위한 컴퓨터 비전(CV)의 기본 접근 방식을 나타냅니다. 이러한 모델은 특정 크기와 종횡비를 가진 '앵커' 또는 '프리어'라고 하는 사전 정의된 참조 상자 집합에 의존합니다. 이러한 앵커는 이미지 전체에서 시작점 또는 템플릿 역할을 하여 모델이 잠재적인 물체, 특히 규모와 모양이 크게 다른 물체의 위치와 종류를 보다 효과적으로 예측할 수 있도록 도와줍니다. 초기의 많은 성공적인 객체 감지 아키텍처는 이 방법을 활용했습니다.
앵커 기반 디텍터의 핵심 아이디어는 입력 이미지의 다양한 위치에 조밀하게 그리드형 앵커 박스를 배치하는 것입니다. 각 앵커 박스는 미리 정의된 배율과 종횡비를 가진 잠재적인 객체 후보를 나타냅니다. 훈련 과정에서 모델은 각 앵커에 대해 두 가지 주요 사항을 학습합니다. 첫째, 앵커에 관련 객체가 포함되어 있는지 여부(분류)와 둘째, 실제 객체의 경계 상자에 꼭 맞도록 앵커의 위치와 치수를 조정하는 방법(회귀)입니다.
넓은 주차장 이미지에서 다양한 차량을 검색한다고 상상해 보세요. 픽셀 단위로 스캔하는 대신 미리 정의된 직사각형 템플릿(앵커)을 사용합니다. 오토바이에는 작은 세로형, 자동차에는 중간 크기의 사각형, 버스에는 큰 가로형 템플릿을 사용합니다. 이러한 템플릿을 이미지 전체에 오버레이합니다. 템플릿이 차량과 크게 겹치면 모델은 "예, 이것은 자동차입니다"라고 확인하고 템플릿을 약간 이동하고 크기를 조정하여 차량의 경계와 완벽하게 일치하도록 학습합니다. 주로 배경을 덮는 앵커는 이렇게 분류됩니다. 이 방법은 미리 정의된 모양에 따라 가능성을 체계적으로 다룹니다. 성능은 종종 IoU(Intersection over Union) 및 mAP(평균 정밀도) 같은 메트릭을 사용하여 측정합니다.
흔히 컨볼루션 신경망(CNN)을 기반으로 구축되는 앵커 기반 탐지기는 몇 가지 주목할 만한 특징을 제공합니다:
물체 감지의 중요한 발전은 앵커가 없는 감지기의 등장입니다. 앵커 기반 모델(예: YOLOv4)과 달리 앵커 프리 방식은 미리 정의된 앵커 모양에 의존하지 않고 주요 지점(예: 모서리 또는 중심)을 식별하거나 한 지점에서 물체 경계까지의 거리를 예측하여 물체의 위치와 크기를 직접 예측합니다.
주요 차이점은 다음과 같습니다:
다음과 같은 최신 모델 Ultralytics YOLO11 와 같은 최신 모델은 앵커 프리 접근 방식을 사용하여 효율성과 단순성에서 이점을 활용합니다. 앵커 프리 탐지의 장점에 대한 자세한 내용은 YOLO11 확인할 수 있습니다.
앵커 없는 방식을 선호하는 추세에도 불구하고, 앵커 기반 탐지기는 수많은 애플리케이션에 성공적으로 배포되었습니다:
앵커가 없는 방법이 인기를 얻고 있지만, 특정 상황이나 레거시 시스템에서 객체 감지의 진화와 지속적인 관련성을 이해하려면 앵커 기반 감지기를 이해하는 것이 필수적입니다. 다음과 같은 도구 PyTorch 와 TensorFlow 와 같은 도구는 앵커 기반 및 앵커 없는 모델 개발을 모두 지원하며, Ultralytics HUB와 같은 플랫폼은 최신 탐지기의 훈련과 배포를 간소화합니다.