용어집

객체 감지 아키텍처

이미지 이해를 위한 AI 백본인 객체 감지 아키텍처의 강력한 성능을 알아보세요. 지금 바로 유형, 도구, 실제 적용 사례에 대해 알아보세요!

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

객체 감지 아키텍처는 인공 지능(AI) 시스템이 이미지를 '보고' 이해하는 방식의 중추입니다. 이러한 아키텍처는 이미지 내에서 객체를 분류하여 어떤 객체가 있는지 알려줄 뿐만 아니라 일반적으로 감지된 각 인스턴스 주위에 경계 상자를 그려 객체의 위치를 찾도록 설계된 특수 신경망입니다. 머신 러닝의 기본에 익숙한 사람이라면 이러한 아키텍처를 이해하는 것이 컴퓨터 비전의 힘을 발휘하는 데 있어 핵심입니다.

핵심 구성 요소

객체 감지 아키텍처의 핵심에는 여러 가지 중요한 구성 요소가 함께 작동합니다. 컨볼루션 신경망(CNN)은 시각 데이터에서 패턴과 계층 구조를 식별하는 특징 추출기 역할을 하는 기본 요소입니다. 또 다른 핵심 개념은 예측된 바운딩 박스와 기준값 박스 간의 중첩을 측정하여 객체 로컬라이제이션의 정확도를 평가하는 데 사용되는 메트릭인 IoU(Intersection over Union)입니다.

아키텍처 유형

객체 감지 아키텍처는 크게 몇 가지 주요 유형으로 분류할 수 있습니다. R-CNN 및 고속 R-CNN과 같은 2단계 감지기는 먼저 영역 제안을 생성한 다음 이러한 제안을 분류하고 구체화하여 정확성을 우선시합니다. 반면, SSD 및 1단계 객체 감지기와 같은 1단계 감지기는 속도를 중시하여 한 번에 객체 로컬라이제이션과 분류를 수행합니다. Ultralytics YOLO"You Only Look Once"의 약자인 YOLO는 실시간 성능과 정확성으로 잘 알려진 고효율 1단계 디텍터의 또 다른 범주로, Ultralytics HUB 플랫폼을 통해 사용할 수 있습니다.

유사 용어와 구별하기

객체 감지 아키텍처와 관련 컴퓨터 비전 작업을 구분하는 것이 중요합니다. 이미지 분류는 이미지에 객체가 있는지 여부를 알려주지만 객체의 위치를 찾아내지는 못합니다. 시맨틱 분할은 이미지의 각 픽셀을 시맨틱 클래스로 분류하여 단순한 경계 상자가 아닌 픽셀 단위로 장면을 이해함으로써 객체 감지보다 한 단계 더 나아갑니다. 객체 감지는 특히 이미지 내에서 여러 객체를 식별하고 위치를 파악하는 데 중점을 두어 객체의 존재와 위치를 구조적으로 이해합니다.

실제 애플리케이션

객체 감지 아키텍처의 적용 분야는 방대하고 다양합니다. 자율 주행 기술에서 이러한 아키텍처는 차량이 주변 환경을 인식하고 보행자, 다른 차량, 교통 표지판을 실시간으로 감지하는 데 매우 중요합니다. 의료 분야에서는 의료 이미지 분석을 지원하여 스캔에서 종양과 같은 이상 징후를 식별하여 더 빠르고 정확한 진단을 내리는 데 기여합니다. 이는 객체 감지 아키텍처가 산업을 어떻게 변화시키고 있는지에 대한 몇 가지 예시일 뿐입니다.

도구 및 기술

객체 탐지 모델을 구축하고 배포하기 위해 몇 가지 강력한 도구와 프레임워크가 사용됩니다. Ultralytics YOLO 는 일종의 아키텍처일 뿐만 아니라 사용자 지정 객체 감지기를 훈련하기 위한 사전 훈련된 모델과 도구를 제공하는 인기 있는 프레임워크입니다. OpenCV는 객체 감지 작업을 보완하는 다양한 컴퓨터 비전 알고리즘과 도구를 제공하는 또 다른 필수 라이브러리입니다.

과제 및 향후 방향

상당한 진전에도 불구하고 객체 감지 아키텍처는 여전히 도전 과제에 직면해 있습니다. 작은 물체를 정확하게 감지하고, 오클루전(부분적으로 숨겨진 물체)을 처리하며, 물체의 크기와 모양에 따른 변화를 관리하는 것은 여전히 활발한 연구 분야입니다. 앵커가 없는 감지 기는 감지 프로세스를 간소화하고 잠재적으로 견고성을 향상시킬 수 있는 유망한 방향입니다. 모델 아키텍처와 훈련 기법의 지속적인 발전은 객체 감지의 가능성의 경계를 계속 넓혀가고 있습니다.

모두 보기