용어집

수신 필드

컴퓨터 비전을 위한 CNN에서 수용 필드의 중요성에 대해 알아보세요. 객체 감지, 세분화 및 AI 최적화에 어떤 영향을 미치는지 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

수용 영역은 합성곱 신경망(CNN)의 기본 개념으로, 특히 컴퓨터 비전(CV)과 관련이 있습니다. 이는 후속 레이어에서 특정 뉴런이나 유닛의 활성화에 영향을 미치는 입력 데이터의 특정 영역(예: 이미지 또는 특징 맵)을 의미합니다. 감각 뉴런의 반응을 이끌어낼 수 있는 감각 공간의 영역을 설명하는 신경과학에서 유래한 이 개념은 CNN의 인공 뉴런이 입력을 '보는' 방식과 직접적으로 연결됩니다. 수용 영역을 이해하는 것은 다양한 작업을 위한 효과적인 네트워크 아키텍처를 설계하는 데 매우 중요합니다.

컨볼루션 신경망의 중요성

CNN에서는 일반적으로 레이어가 쌓여 있습니다. 각 컨볼루션 레이어는 입력에 필터(커널)를 적용합니다. 특정 레이어의 뉴런은 이전 레이어 출력의 작은 영역에만 연결되며, 이 영역은 커널 크기에 해당합니다. 그러나 네트워크 깊숙이 들어가면 단일 뉴런의 활성화는 원본 입력 이미지의 점점 더 넓은 영역의 영향을 받게 됩니다. 이는 각 뉴런이 이전 레이어에 있는 뉴런의 수용 영역에서 정보를 통합하기 때문입니다. 이렇게 계층적으로 수용 필드 크기가 증가하면 CNN은 초기 계층의 단순한 가장자리와 텍스처부터 더 깊은 계층의 복잡한 물체와 패턴에 이르기까지 다양한 규모의 특징을 학습할 수 있습니다. 수용 필드 크기를 적절하게 관리하는 것은 작은 물체를 인식하든 전체 장면을 분류하든 네트워크가 작업과 관련된 컨텍스트를 캡처할 수 있도록 하는 핵심 요소입니다.

수신 필드 크기에 영향을 미치는 요인

몇 가지 아키텍처 선택이 CNN에서 뉴런의 유효 수용 필드 크기에 영향을 미칩니다:

  • 커널 크기: 커널이 클수록 단일 레이어에서 수용 필드가 직접적으로 증가합니다.
  • 보폭: 보폭: 커널이 입력을 가로질러 이동하는 단계 크기입니다. 보폭이 클수록 더 깊은 레이어에서 수신 필드가 더 빨리 증가하지만 공간 해상도가 감소할 수 있습니다.
  • 레이어 풀링: 최대 풀링과 같은 작업은 피처 맵을 다운샘플링하여 원본 입력에 비해 후속 레이어의 수용 필드를 효과적으로 증가시킵니다. 풀링에 대한 자세한 내용은 여기에서 확인할 수 있습니다.
  • 확장된 컨볼루션(아트리스 컨볼루션): 커널 요소 사이에 간격을 두어 커널이 매개변수 수나 계산 비용을 늘리지 않고도 더 넓은 영역을 커버할 수 있도록 합니다. 이 기술은 DeepLab과 같은 연구에 자세히 설명되어 있습니다.
  • 네트워크 깊이: 레이어를 더 많이 쌓는 것이 수신 필드 크기를 늘리는 가장 일반적인 방법입니다. 깊이가 깊은 네트워크는 본질적으로 최종 레이어에 더 큰 수신 필드가 있습니다.

다양한 작업의 수신 필드

최적의 수용 필드 크기는 특정 컴퓨터 비전 작업에 따라 크게 달라집니다:

  • 이미지 분류: 모든 시각적 정보를 기반으로 글로벌 결정을 내리기 위해 최종 레이어에 전체 이미지를 포괄하는 넓은 수용 필드가 필요한 경우가 많습니다. 모델은 ImageNet과 같은 데이터 세트에서 학습될 수 있습니다.
  • 물체 감지: 다양한 규모의 객체를 감지하려면 다양한 크기의 수용 필드가 필요합니다. Ultralytics YOLO 같은 아키텍처는 다양한 수용 필드가 있는 피처 맵을 생성하기 위해 피처 피라미드 네트워크(FPN)와 같은 기술을 사용하는 경우가 많습니다. 작은 물체를 감지하려면 더 작은 수용 필드가 필요하고, 큰 물체를 감지하려면 더 큰 수용 필드가 필요합니다. 아키텍처가 이를 어떻게 처리하는지 다양한 YOLO 모델 간의 비교를 살펴보세요.
  • 시맨틱 세분화: 조밀한 픽셀 수준의 예측이 필요합니다. 컨텍스트를 위해서는 넓은 수용 필드가 필요하지만, 공간 해상도를 유지하는 것도 중요합니다. 여기서 확장 컨볼루션은 해상도를 잃지 않고 수용 필드를 늘리기 위해 자주 사용됩니다. 균열 세분화와 같은 작업을 확인해 보세요.
  • 인스턴스 세분화: 개체 감지와 시맨틱 세그멘테이션을 결합하여 감지를 위한 다양한 수용 필드와 개별 인스턴스 마스킹을 위한 세분화된 공간 정보를 모두 필요로 합니다. Ultralytics YOLO11 인스턴스 세분화를 지원합니다.

실제 적용 사례

  1. 자율주행 차량: Waymo와 같은 회사에서 개발한 것과 같은 자율주행차의 물체 감지 시스템은 보행자, 다른 차량, 신호등, 다양한 크기와 거리의 차선 표시를 식별해야 합니다. 세심하게 설계된 수신 필드를 갖춘 CNN은 잠재적으로 다음과 같은 모델을 사용합니다. YOLOv8 또는 RT-DETR과 같은 모델을 사용하면 시스템이 가까운 작은 장애물(더 작은 수신 필드가 필요)과 멀리 있는 큰 차량 또는 도로 표지판(더 큰 수신 필드가 필요)을 동시에 인식할 수 있습니다. 차량용 솔루션의 AI는 종종 이 기능에 의존합니다.
  2. 의료 이미지 분석: 종양이나 병변과 같은 이상 징후를 감지하기 위해 의료 스캔(예: CT, MRI)을 분석할 때(종양 감지의 예 참조), 수용 필드 크기는 매우 중요합니다. 수용 필드가 너무 작으면 더 큰 구조나 맥락 정보를 놓칠 수 있고, 너무 크면 중요한 국소 세부 정보를 평균화할 수 있습니다. 방사선학 AI에 사용되는 모델은 작은 병변의 미묘한 질감과 더 넓은 해부학적 맥락을 모두 포착할 수 있도록 수용 필드 크기의 균형을 맞춰야 합니다. 뇌종양 데이터 세트와 같은 데이터 세트에 대한 효과적인 모델 학습은 이러한 균형을 고려합니다.

관련 개념 및 도구

수용 필드를 이해하는 것은 커널 크기, 보폭, 패딩 및 전체 네트워크 아키텍처와 같은 개념과 밀접하게 연관되어 있습니다. 커널이 로컬 연결 패턴을 정의하는 반면, 수용 필드는 입력에 대한 누적 효과를 설명합니다. 다음과 같은 다양한 딥 러닝 프레임워크 PyTorchTensorFlow 와 같은 다양한 딥 러닝 프레임워크가 이러한 개념을 구현합니다. CNN에서 수용 필드를 시각화하여 아키텍처 설계 및 디버깅을 지원하는 도구가 존재합니다. 다음과 같은 모델로 작업할 때 Ultralytics YOLO11 와 같은 모델로 작업할 때, 수용 필드에 대한 인식은 특정 탐지 또는 세분화 작업에 적합한 모델 크기나 구성을 선택하는 데 도움이 됩니다.

모두 보기