용어집

컨볼루션 신경망(CNN)

컨볼루션 신경망(CNN)이 어떻게 컴퓨터 비전을 혁신하여 의료, 자율 주행 자동차 등의 분야에서 AI를 지원하는지 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

합성곱 신경망(CNN)은 이미지나 동영상과 같은 격자형 데이터를 처리하는 데 특히 효과적인 신경망(NN) 의 특수한 유형입니다. 입력을 평면 벡터로 처리하는 기존 신경망과 달리 CNN은 입력 데이터에서 직접 특징의 공간 계층 구조를 자동으로 적응적으로 학습하도록 설계되었습니다. 이는 주로 컨볼루션 연산의 적용을 통해 이루어지며, 최신 컴퓨터 비전(CV) 의 초석이 되고 인공 지능(AI)의 상당한 발전을 주도합니다. 지역적 종속성과 공간적 관계를 포착할 수 있기 때문에 픽셀 배열이 중요한 작업에 매우 적합합니다.

핵심 구성 요소 및 기능

CNN은 일반적으로 시각 정보를 처리하고 변환하는 여러 주요 계층으로 구성됩니다:

  • 컨볼루션 레이어: CNN의 기본 레이어입니다. 입력 이미지 전체에 학습 가능한 필터(커널) 세트를 적용합니다. 각 필터는 가장자리, 모서리 또는 텍스처와 같은 특정 특징을 감지합니다. 필터가 입력 이미지 위로 슬라이드(컨볼브)하면서 감지된 특징의 위치와 강도를 강조하는 특징 맵을 생성합니다. 네트워크는 모델 학습 과정에서 이러한 필터를 자동으로 학습합니다.
  • 활성화 레이어: 컨볼루션 레이어에 이어 ReLU(정류된 선형 단위) 또는 누수 ReLU와 같은 활성화 함수는 비선형성을 도입합니다. 이를 통해 네트워크는 단순한 선형 조합을 뛰어넘는 더 복잡한 패턴을 학습할 수 있습니다.
  • 레이어 풀링: 이 레이어는 피처 맵의 공간적 크기(너비와 높이)를 줄여 계산 부하를 줄이고 과적합을 제어합니다. 일반적인 방법으로는 로컬 영역의 최대값을 사용하는 최대 풀링이 있으며, 이는 피처 위치의 변화에 대해 네트워크가 더욱 견고해지도록 도와줍니다. 풀링 방법에 대한 개요에서 더 자세한 내용을 확인할 수 있습니다.
  • 완전히 연결된 레이어: 일반적으로 네트워크의 끝 부분에 있는 이 레이어는 기존 피드포워드 신경망과 유사하게 이전 레이어의 모든 뉴런과 현재 레이어의 모든 뉴런을 연결합니다. 컨볼루션 및 풀링 레이어에서 추출한 높은 수준의 특징을 사용하여 이미지에 최종 레이블을 할당하는 등의 분류 또는 회귀 작업을 수행합니다.

다른 신경망과의 주요 차이점

CNN은 다른 네트워크 유형과 구별되는 고유한 특성을 가지고 있습니다:

  • 공간 계층 구조: 기본 NN과 달리 CNN은 공간 관계를 명시적으로 모델링합니다. 초기 레이어는 단순한 특징(가장자리)을 감지하고, 더 깊은 레이어는 이를 결합하여 더 복잡한 패턴(모양, 물체)을 인식합니다. 이러한 계층적 구조는 인간의 시각 처리 방식을 모방합니다.
  • 매개변수 공유: 입력 이미지의 여러 부분에 단일 필터를 적용하여 완전히 연결된 네트워크가 동일한 이미지를 처리하는 것에 비해 총 매개변수 수를 크게 줄입니다. 따라서 CNN의 효율성이 향상되고 특히 큰 이미지의 경우 과적합이 덜 발생합니다. 필터가 어느 한 지점에서 커버하는 영역을 수용 영역이라고 합니다.
  • 번역 불변성: 풀링 및 매개변수 공유로 인해 CNN은 이미지 내에서 객체의 위치가 약간만 이동해도 객체를 인식할 수 있습니다.
  • 순환신경망(RNN)과 비교: CNN은 이미지와 같은 공간 데이터를 처리하는 데 탁월한 반면, 순환 신경망(RNN)은 순차적 데이터를 위해 설계되어 자연어 처리(NLP)시계열 분석과 같은 작업에 적합합니다.

실제 애플리케이션

CNN은 다양한 영역에서 수많은 혁신의 원동력이 되고 있습니다:

  1. 의료 이미지 분석: 의료 분야의 AI에서 CNN은 엑스레이, CT, MRI와 같은 의료 스캔을 분석합니다. 종양, 골절 또는 당뇨병성 망막증과 같은 미묘한 이상 징후를 발견하는 방사선과 의사를 지원합니다. 이러한 연구는 Radiology와 같은 저널에 게재됩니다 : 인공 지능은 질병을 나타내는 패턴을 식별하는 CNN을 보여주며, 종종 높은 정확도를 달성합니다. 예를 들어, 다음과 같은 모델은 Ultralytics YOLO 와 같은 모델은 의료 영상에서 종양 감지와 같은 작업에 적용되어 의료 영상 분석에서 CNN 기반 아키텍처의 실용적인 적용을 보여줍니다.
  2. 자율 주행 차량: CNN은 자율 주행 차량의 AI에 매우 중요합니다. 카메라와 LiDAR의 데이터를 사용하여 보행자, 차량, 교통 표지판, 차선 표시를 식별하기 위해 실시간 물체 감지를 수행하는 인식 시스템을 구동합니다. 이를 통해 차량은 주변 환경을 이해하고 안전한 주행 결정을 내릴 수 있습니다. 웨이모와 같은 회사는 자율주행 시스템을 위해 CNN에 크게 의존하고 있습니다. CNN은 또한 이미지 분할에 기여하여 차량이 주행 가능한 영역과 장애물을 구분할 수 있게 해줍니다.

도구 및 프레임워크

강력한 딥 러닝(DL) 도구와 프레임워크를 통해 CNN을 개발하고 배포할 수 있습니다:

모두 보기