용어집

백본

딥 러닝에서 백본의 역할에 대해 알아보고, ResNet 및 ViT와 같은 최고의 아키텍처를 살펴보고, 실제 AI 애플리케이션에 대해 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

딥 러닝, 특히 컴퓨터 비전 분야에서 '백본'이라는 용어는 특징 추출을 담당하는 신경망의 중요한 부분을 의미합니다. 백본은 나머지 네트워크가 구축되는 토대라고 생각하면 됩니다. 백본은 이미지와 같은 원시 입력 데이터를 가져와서 네트워크의 후속 부분에서 효과적으로 활용할 수 있는 피처 맵이라는 구조화된 형식으로 변환합니다. 이러한 피처 맵은 가장자리, 질감, 모양 등 입력에 대한 필수 정보를 캡처하여 모델이 복잡한 시각적 데이터를 이해하고 해석할 수 있게 해줍니다. 기본적인 머신러닝 개념에 익숙한 사용자의 경우, 백본은 입력 데이터의 계층적 표현을 학습하는 신경망의 초기 레이어로 이해할 수 있습니다.

백본의 역할과 중요성

백본은 딥러닝 모델의 전반적인 성능과 효율성을 결정하는 데 중요한 역할을 합니다. 일반적으로 컨볼루션 연산, 풀링, 활성화의 여러 계층으로 구성됩니다. 컨볼루션 레이어는 입력 데이터에서 특징을 추출하는 역할을 하며, 풀링 레이어는 특징 맵의 공간적 차원을 줄여 모델의 계산 효율을 높입니다. 활성화 함수는 네트워크에 비선형성을 도입하여 복잡한 패턴을 학습할 수 있도록 합니다. 백본인 피처 맵의 출력은 객체 감지를 위한 감지 헤드나 이미지 분할을 위한 분할 모듈과 같은 네트워크의 후속 부분으로 공급됩니다. 백본에서 추출한 특징의 품질은 모델이 의도한 작업을 정확하게 수행할 수 있는 능력에 직접적인 영향을 미칩니다.

인기 있는 백본 아키텍처

여러 백본 아키텍처는 다양한 작업에서 효율적이기 때문에 컴퓨터 비전 분야에서 인기를 얻고 있습니다. 몇 가지 주목할 만한 예는 다음과 같습니다:

  • 잔여 네트워크(ResNet): ResNet은 잔여 연결이라는 개념을 도입하여 소실 그라데이션 문제를 완화함으로써 매우 심층적인 네트워크를 훈련할 수 있게 해줍니다. ResNet 아키텍처는 이미지 분류, 물체 감지, 분할 작업에서 놀라운 성능을 보여주었습니다.
  • 비전 트랜스포머(ViT): ViT 아키텍처는 원래 자연어 처리를 위해 개발된 트랜스포머 모델을 컴퓨터 비전 작업에 적용합니다. ViT는 이미지를 패치로 나누고 시퀀스로 처리하여 모델이 이미지 내에서 장거리 종속성을 캡처할 수 있도록 합니다.

백본의 실제 애플리케이션

백본은 기계가 인간과 유사한 방식으로 시각적 데이터를 '보고' 해석할 수 있게 해주는 광범위한 실제 AI 애플리케이션의 기본 요소입니다. 다음은 두 가지 구체적인 예시입니다:

자율 주행 차량

자율주행차에서 백본은 카메라 및 기타 센서의 시각 데이터를 처리하여 차량이 주변 환경을 인식할 수 있도록 하는 데 사용됩니다. 예를 들어 Ultralytics YOLO 모델은 효율적인 백본을 활용하여 보행자, 다른 차량, 교통 표지판과 같은 물체를 실시간으로 감지합니다. 이 정보는 차량의 내비게이션 시스템이 정보에 입각한 결정을 내리고 안전한 주행을 보장하는 데 매우 중요합니다.

헬스케어

의료 이미지 분석에서 백본은 엑스레이, MRI, CT 스캔과 같은 의료 이미지에서 특징을 추출하는 데 사용됩니다. 그런 다음 이러한 특징을 질병 진단, 이상 감지, 해부학적 구조의 분할과 같은 작업에 사용할 수 있습니다. 예를 들어, 백본은 뇌종양 감지 데이터 세트와 같은 뇌종양 이미지 데이터 세트를 학습하여 종양을 식별하고 위치를 파악하는 데 도움이 되는 관련 특징을 학습할 수 있습니다.

백본 선택 고려 사항

특정 애플리케이션에 적합한 백본을 선택하는 것은 작업의 복잡성, 사용 가능한 컴퓨팅 리소스, 원하는 정확도 등 여러 요인에 따라 달라집니다. 모바일 디바이스나 엣지 AI 애플리케이션과 같이 리소스가 제약된 환경에서는 매개변수가 적은 가벼운 백본이 선호될 수 있습니다. 반면에 높은 정확도가 필요한 작업의 경우 더 깊고 복잡한 백본이 필요할 수 있습니다.

백본과 다른 컴포넌트 비교

백본을 신경망의 다른 구성 요소와 구별하는 것이 중요합니다. 백본이 특징을 추출하는 동안 감지 헤드나 세분화 모듈과 같은 네트워크의 다른 부분은 이러한 특징을 기반으로 예측을 담당합니다. 백본은 네트워크의 눈과 같아서 원시 시각 정보를 제공하고, 다른 구성 요소는 두뇌와 같아서 해당 정보를 해석하여 특정 작업을 수행합니다. 또한 전이 학습이라는 개념이 백본에 적용되는 경우가 많은데, 이미지넷과 같은 대규모 데이터 세트에서 사전 학습된 백본이 새로운 작업에 대한 학습의 시작점으로 사용됩니다. 이를 통해 모델은 사전 학습 데이터 세트에서 학습한 지식을 활용하여 성능을 개선하고 학습 시간을 단축할 수 있습니다. Ultralytics HUB와 같은 도구는 다양한 백본을 실험하고 사용자 지정 모델을 훈련하는 프로세스를 간소화합니다.

모두 보기