2단계 객체 감지기는 컴퓨터 비전 분야에서 두드러진 접근 방식으로, 특히 이미지 내에서 다양한 객체를 감지하고 식별하는 등의 작업에서 정확도가 높은 것으로 알려져 있습니다. 이 시스템은 감지 프로세스를 두 개의 순차적인 단계로 세분화하여 작동하므로 1단계 객체 감지기에 비해 더 높은 정밀도로 객체를 식별할 수 있는 상세하고 강력한 방법을 제공합니다.
이 프로세스는 이미지에서 잠재적인 관심 영역(ROI)을 생성하는 첫 번째 단계로 시작됩니다. 이 단계에서는 물체 자체를 정확히 찾아내지 않고도 물체가 포함될 가능성이 있는 영역을 식별하는 기술을 사용합니다. 일반적인 방법으로는 후보 객체 위치를 효율적으로 제공하는 영역 제안 네트워크(RPN)가 있습니다.
두 번째 단계에서는 감지기가 식별된 영역을 분류하고 물체에 더 잘 맞도록 경계를 조정하여 이러한 제안을 구체화합니다. 이 세분화 작업에는 컨볼루션 신경망(CNN)을 사용하여 객체를 분류하고 경계를 추가로 정의하는 보다 상세한 분석이 포함됩니다.
2단계 감지기는 정확도가 높다는 평가를 받지만, Ultralytics YOLO 제품군과 같은 1단계 객체 감지기에 비해 속도가 느린 경향이 있습니다. 1단계 감지기는 ROI 제안 단계를 건너뛰고 가능한 물체 위치의 조밀한 샘플링을 통해 직접 예측을 수행합니다. 이 직접 방식은 더 빠를 수 있지만 정확도가 다소 떨어질 수 있으므로 정밀도가 중요한 애플리케이션에는 2단계 감지기가 더 적합합니다.
R-CNN과 변형: 최초의 R-CNN(지역 기반 컨볼루션 신경망)은 속도와 정확도를 최적화한 Fast R-CNN과 Faster R-CNN과 같은 더 빠른 모델의 기반을 닦았습니다. 더 빠른 R-CNN은 의료 영상이나 자율 주행 차량 기술처럼 정확도가 우선시되는 시나리오에서 일반적으로 사용됩니다.
마스크 R-CNN: Faster R-CNN의 확장 버전인 Mask R-CNN은 객체를 감지할 뿐만 아니라 각 객체의 픽셀 수준 마스크도 제공합니다. 패션 업계에서 자동화된 의류 태깅을 위해 단순한 객체 감지를 넘어 인스턴스 세분화가 필요한 경우에 널리 사용됩니다(마스크 R-CNN 살펴보기).
자율주행차에서는 2단계 감지기를 사용하여 보행자, 자전거 운전자, 차량을 높은 정확도로 식별하여 안전과 도로 규정 준수를 보장합니다. 자율 주행 차량의 AI는 의사 결정 시스템을 위해 이러한 감지기에 크게 의존합니다.
2단계 물체 감지기는 종양, 골절 또는 기타 심각한 상태를 정확하게 식별하는 데 도움이 되는 의료 이미지 분석에 중요한 역할을 합니다. 정밀도가 중요한 의료 분야에서 이러한 모델은 더 나은 진단 과정과 결과를 촉진합니다. 의료 분야의 비전 AI는 의료 분야를 변화시키는 다양한 애플리케이션을 선보입니다.
AI와 머신러닝의 발전으로 2단계 객체 감지기는 전이 학습 및 AI 윤리와 같은 다른 기술과 점점 더 통합되고 있습니다. Ultralytics 허브와 같은 플랫폼과의 통합을 통해 원활한 교육과 배포가 가능해져 더 많은 사람들이 최첨단 객체 감지 기능을 이용할 수 있게 되었습니다.
알고리즘 효율성과 하드웨어 기능이 지속적으로 개선되면서 2단계 객체 감지의 미래는 밝아 보입니다. 이러한 발전은 다양한 복잡한 영역에서 AI 기반 솔루션의 기본 요소로 자리 잡을 수 있도록 보장합니다. 이러한 기술을 활용하는 데 관심이 있다면 Ultralytics' 리소스 및 솔루션에서 상당한 지원과 지침을 얻을 수 있습니다.