앵커 기반 감지기는 컴퓨터 비전에서 일반적으로 사용되는 객체 감지 모델의 한 유형입니다. 이 모델은 '앵커'라고 하는 사전 정의된 상자를 사용하여 이미지 내 객체의 위치와 클래스를 예측합니다. 이러한 앵커는 기준점 역할을 하여 모델이 잠재적인 객체에 대한 제안을 생성하는 데 도움을 줍니다. 특히 다양한 크기와 모양의 객체를 식별하는 데 효과적이기 때문에 많은 객체 감지 아키텍처에서 널리 사용되고 있습니다.
앵커 기반 감지기는 이미지에 걸쳐 슬라이드되는 다양한 배율과 종횡비를 가진 앵커 박스 그리드를 사용하여 작동합니다. 이러한 앵커 박스는 다양한 잠재적 물체 크기와 모양을 포괄할 수 있도록 전략적으로 배치됩니다. 학습 과정에서 모델은 각 앵커 박스를 객체가 포함되어 있는지 또는 배경만 있는지를 분류하는 방법을 학습합니다. 또한 물체를 정확하게 감지하기 위해 이러한 앵커 박스의 위치를 세분화합니다. 이 세분화 작업에는 객체의 실측 기준선 바운딩 박스와 더 잘 일치하도록 앵커 박스의 크기와 위치를 조정하는 작업이 포함됩니다. 최종 출력은 각각 해당 클래스 레이블과 신뢰도 점수가 있는 바운딩 박스 집합으로, 객체가 존재할 가능성을 나타냅니다.
기본적인 머신 러닝 개념에 익숙한 사용자를 위해 넓은 주차장에서 여러 종류의 차량을 검색한다고 가정해 보겠습니다. 전체 영역을 무작위로 스캔하는 대신 다양한 크기와 모양의 사전 정의된 검색 영역(앵커)을 사용합니다(오토바이용은 소형, 자동차용은 중형, 버스용은 대형). 이러한 검색 영역을 주차장을 가로질러 이동하면서 각 검색 영역에 차량이 있는지 확인합니다. 검색 영역이 차량과 거의 일치하는 경우, 검색 영역의 크기와 위치를 차량에 맞게 조정합니다. 이 방법을 사용하면 주차장에 있는 모든 차량을 빠르고 정확하게 찾을 수 있습니다.
앵커 기반 감지기는 다양한 애플리케이션에 적합한 몇 가지 장점을 제공합니다:
앵커 기반 감지기는 효과적이지만, 앵커가 없는 감지기에 비해 몇 가지 한계가 있습니다. 앵커 프리 감지기는 미리 정의된 앵커 박스를 사용하지 않고 객체 위치를 직접 예측합니다. 다음은 몇 가지 주요 차이점입니다:
앵커 프리 감지의 이점에 대한 자세한 내용은 Ultralytics YOLO11 앵커 프리 감지의 이점에 대한 도움말을 참조하세요.
앵커 기반 감지기는 견고함과 적응성으로 인해 다양한 산업 분야에서 널리 사용되고 있습니다. 특히 물체가 다양한 배율과 화면 비율로 표시되는 시나리오에서 효과적입니다. 다음은 실제 적용 사례의 구체적인 두 가지 예입니다:
여러 인기 있는 객체 감지 모델은 앵커 기반 접근 방식을 사용합니다. 이전 버전의 Ultralytics YOLO 제품군은 잘 알려진 앵커 기반 검출기입니다. 다른 주목할 만한 모델로는 앵커를 사용하여 영역 제안을 생성하기 위해 영역 제안 네트워크(RPN) 개념을 도입한 Faster R-CNN과 다양한 스케일의 여러 피처 맵을 사용하여 객체를 감지하는 싱글 샷 멀티박스 검출기(SSD)(소스)가 있습니다. 이러한 모델은 객체 감지 분야에서 벤치마크를 설정했으며 새로운 아키텍처 개발에 지속적으로 영향을 미치고 있습니다.