로봇 공학 및 감시와 같은 실시간 애플리케이션에 이상적인 1단계 물체 감지기( YOLO)의 속도와 효율성에 대해 알아보세요.
컴퓨터 비전(CV) 분야, 특히 객체 감지의 경우 속도와 효율성이 정확도만큼이나 중요한 경우가 많습니다. 1단계 객체 감지기는 이러한 우선순위를 염두에 두고 설계되어 이미지 또는 비디오 내에서 객체를 식별하고 위치를 파악하는 간소화된 접근 방식을 제공합니다. 2단계 디텍터와 달리 1단계 디텍터는 신경망의 단일 포워드 패스에서 객체 위치 파악 및 분류를 수행하므로 훨씬 빠르고 실시간 애플리케이션에 더 적합합니다.
1단계 객체 감지기는 관심 영역을 제안하기 위한 별도의 단계를 생략하는 엔드투엔드 설계가 특징입니다. 이러한 직접적인 접근 방식을 통해 백본 네트워크가 처리한 입력 이미지 특징에서 직접 경계 상자와 클래스 확률을 예측할 수 있습니다. 네트워크는 전체 이미지를 한 번 처리하고 단일 단계에서 감지 결과를 출력합니다. 이 아키텍처는 속도를 강조하기 때문에 빠른 처리가 필수적인 애플리케이션에 이상적입니다. 대표적인 예는 다음과 같습니다. Ultralytics YOLO 모델 제품군( YOLO11), SSD(싱글 샷 멀티박스 디텍터) 등이 있습니다.
1단계와 2단계 물체 감지기의 근본적인 차이점은 작동 파이프라인에 있습니다. R-CNN 제품군과 같은 2단계 감지기는 먼저 수많은 영역 제안(물체가 존재할 수 있는 잠재적 영역)을 생성한 다음, 두 번째 별개의 단계에서 이러한 제안을 분류하고 구체화합니다. 이 2단계 프로세스는 일반적으로 특히 작은 물체의 경우 더 높은 정확도를 달성하지만 계산 시간이 크게 증가하고 추론 속도가 느려지는 대가가 따릅니다. 반면, 1단계 감지기는 이러한 단계를 통합하여 전체 이미지에 대해 로컬라이제이션과 분류를 동시에 수행합니다. 이러한 통합 접근 방식은 상당한 속도 향상을 가져다주지만, 역사적으로 최신 2단계 방식에 비해 정확도가 약간 떨어지는 트레이드오프가 발생하기도 했는데, 최신 1단계 디텍터는 이러한 격차를 줄이기 위해 지속적으로 노력하고 있습니다. 성능은 보통 평균 정밀도(mAP)와 같은 지표를 사용해 측정합니다.
1단계 물체 감지기의 속도와 효율성은 신속한 의사 결정이 필요한 수많은 실제 시나리오에서 매우 유용합니다:
1단계 객체 탐지기의 개발 및 배포는 다음과 같은 다양한 도구와 프레임워크를 통해 용이하게 이루어집니다:
개발자와 연구자는 1단계 객체 감지기의 원리, 장점 및 응용 분야를 이해함으로써 다양한 실시간 컴퓨터 비전 과제에 효과적으로 속도를 활용할 수 있습니다.