2단계 객체 감지기는 컴퓨터 비전의 객체 감지 모델 범주 중 하나로, 두 단계로 감지 프로세스를 수행합니다. 먼저 이 모델은 이미지에서 물체가 위치할 수 있는 잠재적 영역인 영역 제안 세트를 생성합니다. 그런 다음 제안된 각 영역을 분류하고 경계 상자 좌표를 세분화하여 객체를 정확하게 식별하고 위치를 찾습니다. 이 2단계 접근 방식을 사용하면 특히 물체의 크기, 방향, 모양이 다를 수 있는 복잡한 시나리오에서 물체 감지 작업의 정확도를 높일 수 있습니다.
2단계 객체 감지기의 작동은 지역 제안과 지역 분류의 두 가지 주요 단계로 나눌 수 있습니다.
지역 제안: 첫 번째 단계에서는 모델이 이미지 내에서 잠재적인 객체 위치를 식별합니다. 이 작업은 일반적으로 선택적 검색 또는 최근에는 영역 제안 네트워크(RPN)와 같은 알고리즘을 사용하여 수행됩니다. RPN은 이미지를 스캔하여 물체가 포함될 가능성이 있는 영역을 식별하고 해당 영역 주변에 경계 상자를 생성하는 신경망의 일종입니다.
영역 분류: 두 번째 단계에서는 제안된 영역 내의 객체를 분류하고 경계 상자를 보다 정확하게 맞추기 위해 조정합니다. 제안된 각 영역은 CNN(컨볼루션 신경망) 을 통과하여 특징을 추출한 다음 객체를 분류하고 경계 상자 좌표를 수정하는 데 사용됩니다. 이 단계를 통해 감지된 각 물체가 이미지 내에서 정확하게 레이블이 지정되고 위치가 파악됩니다.
2단계 물체 감지기의 기능에는 몇 가지 주요 구성 요소와 기술이 필수적입니다:
지역 제안 네트워크(RPN): RPN은 고품질의 지역 제안을 효율적으로 생성하는 데 매우 중요합니다. CNN이 출력한 특징 맵 위에 작은 네트워크를 슬라이딩하여 각 위치에 물체가 존재할 확률을 예측하고 경계 상자 조정을 제안하는 방식으로 작동합니다.
특징 추출: 특징 추출은 제안된 영역에서 의미 있는 특징을 추출하기 위해 ResNet 또는 VGG와 같은 CNN을 사용하는 것을 포함합니다. 이러한 특징은 후속 분류 및 바운딩 박스 회귀 작업에 필수적입니다.
바운딩 박스 회귀: 제안된 영역 내에서 개체를 분류한 후 경계 상자 회귀를 사용하여 경계 상자 좌표를 미세 조정하여 감지된 개체 주위에 꼭 맞도록 합니다.
2단계 객체 감지기는 종종 1단계 객체 감지기와 비교됩니다( Ultralytics YOLO (You Only Look Once)). 1단계 감지기는 네트워크를 한 번에 통과하여 객체 감지를 수행하므로 실시간 애플리케이션에 더 빠르고 적합하지만, 2단계 감지기는 일반적으로 2단계 프로세스로 인해 더 높은 정확도를 제공합니다.
정확도: 2단계 감지기는 일반적으로 2단계에서 제안된 각 영역을 자세히 분석하고 세분화할 수 있기 때문에 더 높은 정확도를 달성합니다. 이는 물체가 겹치거나 배경이 복잡한 시나리오에서 특히 유용합니다.
속도: 같은 1단계 감지기는 Ultralytics YOLO 와 같은 1단계 감지기는 전체 이미지를 한 번의 포워드 패스로 처리하기 때문에 더 빠릅니다. 2단계 감지기는 더 정확하지만 각 영역 제안을 개별적으로 처리하는 추가 단계로 인해 속도가 느립니다.
2단계 물체 감지기는 높은 정확도가 가장 중요한 다양한 실제 애플리케이션에서 사용됩니다:
자율주행 차량: 자율주행차에서는 보행자, 차량, 기타 물체를 정확하게 감지하는 것이 안전한 주행을 위해 매우 중요합니다. 2단계 감지기는 모든 잠재적 위험을 정확하게 식별하고 위치를 파악할 수 있도록 도와줍니다. 자율주행 기술에서의 AI 활용에 대해 자세히 알아보세요.
의료 영상: 의료 분야에서 2단계 감지기는 종양이나 골절과 같은 이상 징후를 감지하기 위해 X-레이 및 MRI 스캔과 같은 의료 이미지를 분석하는 데 사용됩니다. 이러한 디텍터의 높은 정확도는 신뢰할 수 있는 진단과 치료 계획에 매우 중요합니다. AI와 영상의학에 대해 자세히 알아보세요.
2단계 탐지 프레임워크를 기반으로 몇 가지 영향력 있는 모델이 개발되었습니다:
R-CNN(CNN 기능이 있는 지역): 이 카테고리의 선구적인 모델 중 하나인 R-CNN은 선택적 검색을 사용하여 지역 제안을 생성하고 CNN을 사용하여 각 지역을 분류합니다.
고속 R-CNN: R-CNN보다 개선된 Fast R-CNN은 전체 이미지를 CNN을 통해 한 번 처리한 다음 각 영역 제안에 대한 특징을 추출하여 처리 속도를 크게 높입니다.
더 빨라진 R-CNN: 이 모델은 지역 제안 생성 기능을 감지 네트워크와 통합하여 속도와 정확도를 더욱 향상시키는 지역 제안 네트워크(RPN)를 도입합니다.
특정 객체 감지 아키텍처에 대한 자세한 내용은 객체 감지에 대한 Wikipedia 페이지와 같은 리소스를 참조하세요.