Yolo 비전 선전
선전
지금 참여하기
용어집

객체 감지 아키텍처

백본부터 헤드까지 객체 탐지 아키텍처를 탐구하세요. Ultralytics 실시간 컴퓨터 비전을 위해 어떻게 최상의 속도와 정확도를 제공하는지 알아보세요.

객체 탐지 아키텍처는 시각 데이터 내에서 항목을 식별하고 위치를 파악하는 데 사용되는 신경망의 구조적 설계도입니다. 컴퓨터 비전(CV)이라는 광범위한 분야에서 이러한 아키텍처는 원시 픽셀 데이터를 의미 있는 통찰력으로 처리함으로써 기계가 '보는' 방식을 정의합니다. 단순히 이미지에 라벨을 붙이는 기본 분류 모델과 달리, 객체 탐지 아키텍처는 발견한 각 개별 객체에 대해 클래스 라벨과 신뢰도 점수 외에도 바운딩 박스를 출력하도록 설계됩니다. 이러한 구조적 설계는 모델의 속도, 정확도, 계산 효율성을 결정하며, 실시간 추론이나 고정밀 분석을 위한 모델 선택 시 핵심 요소가 됩니다.

아키텍처의 핵심 구성 요소

구체적인 설계는 다양하지만, 대부분의 현대적 아키텍처는 세 가지 기본 구성 요소를 공유합니다: 백본, 목, 그리고 머리입니다. 백본은 주요 특징 추출기 역할을 합니다. 일반적으로 이미지넷(ImageNet)과 같은 대규모 데이터셋으로 사전 훈련된 컨볼루션 신경망(CNN)입니다. ImageNet과 같은 대규모 데이터셋으로 사전 훈련된 기본적인 형태, 가장자리, 질감을 식별하는 역할을 담당합니다. 백본으로 널리 사용되는 선택지에는 ResNet과 CSPDarknet이 있습니다.

목(Neck )은 백본(Backbone)과 최종 출력 레이어를 연결합니다. 목의 역할은 백본의 서로 다른 단계에서 나온 특징들을 혼합하고 결합하여 모델이 다양한 크기의 detect 수 있도록 하는 것입니다. 이는 다중 스케일 특징 융합(multi-scale feature fusion)으로 알려진 개념입니다. 아키텍처는 종종 예측 레이어로 전달되는 의미 정보를 풍부하게 하기 위해 여기서 피처 피라미드 네트워크(FPN) 또는 경로 집계 네트워크(PANet)를 활용합니다. 마지막으로, 검출 헤드는 이러한 융합된 특징들을 처리하여 각 객체의 특정 클래스와 좌표 위치를 예측합니다.

진화: 2단계 대 1단계

역사적으로 아키텍처는 크게 두 가지 범주로 나뉘었습니다. R-CNN 계열과 같은 2단계 검출기는 먼저 물체가 존재할 가능성이 있는 관심 영역(RoI)을 제안한 후, 두 번째 단계에서 classify 영역을 classify . 일반적으로 정확도는 높지만, 에지 디바이스에는 종종 계산 부담이 너무 큽니다.

반면, 단일 단계 탐지기는 탐지를 단순한 회귀 문제로 처리하여 단일 패스에서 이미지 픽셀을 경계 상자 좌표와 클래스 확률로 직접 매핑합니다. YOLO (You Only Look Once) 계열이 개척한 이 접근법은 실시간 성능을 가능케 함으로써 업계를 혁신했습니다. 현대적 발전은 YOLO26과 같은 모델로 정점에 달했으며, 이는 우수한 속도를 제공할 뿐만 아니라 엔드투엔드 방식의 NMS)가필요 없는 아키텍처를 채택했습니다. 이러한 최신 아키텍처는 후처리 단계에서 NMS필요성을 제거함으로써 지연 시간 변동성을 줄여주며, 이는 안전이 중요한 시스템에 있어 핵심적입니다.

실제 애플리케이션

아키텍처 선택은 산업 전반에 걸쳐 AI 솔루션의 성공에 직접적인 영향을 미칩니다.

  • 소매 자동화: 스마트 슈퍼마켓에서는 효율적인 단일 단계 아키텍처를 통해 컨베이어 벨트나 쇼핑 카트에 담긴 상품을 즉시 인식하는 자동 계산 시스템이 구현되어 대기 시간과 인적 오류를 줄입니다.
  • 의료 진단: 고해상도 아키텍처는 의료 영상 분석에 활용되어 X선이나 MRI 스캔에서 종양과 같은 detect . 이 경우 아키텍처의 정밀한 세부 사항 유지 능력이 순수 처리 속도보다 더 중요합니다.

관련 용어 구분하기

탐지 아키텍처를 유사한 컴퓨터 비전 작업과 구분하는 것이 중요하다:

  • vs. 이미지 분류: 이미지 분류 아키텍처(VGG나 EfficientNet 등)는 전체 이미지에 단일 레이블(예: "고양이")을 할당합니다. 이는 고양이가 어디에 있는지 또는 고양이 여러 마리가 있는지 알려주지 않으며, 이는 탐지 아키텍처의 주요 기능입니다.
  • 대. 인스턴스 분할: 탐지가 객체 주변에 박스를 표시하는 반면, 인스턴스 분할은 각 객체의 정확한 픽셀 단위 윤곽선(마스크)을 식별합니다. 분할 아키텍처는 종종 탐지 아키텍처의 확장 형태입니다 (예: 탐지 헤드에 마스크 분기 추가).

Ultralytics 구현

현대 프레임워크는 이러한 아키텍처의 복잡성을 추상화하여 개발자가 최소한의 코드로 최신 설계를 활용할 수 있게 합니다. ultralytics 패키지를 사용하면 사전 훈련된 모델을 로드할 수 있습니다. YOLO26 모델을 생성하고 즉시 추론을 실행합니다. 클라우드에서 데이터셋을 관리하고 맞춤형 아키텍처를 훈련하려는 팀을 위해, Ultralytics 플랫폼 전체 MLOps 파이프라인을 간소화합니다.

from ultralytics import YOLO

# Load the YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")

# Run inference on an image source
# This uses the model's architecture to detect objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기