용어집

컨볼루션

컨볼루션이 어떻게 컴퓨터 비전에서 AI를 강화하여 물체 감지, 이미지 인식, 의료 영상과 같은 작업을 정밀하게 수행할 수 있도록 지원하는지 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

컨볼루션은 인공 지능, 특히 컴퓨터 비전(CV) 분야에서 널리 사용되는 기본적인 수학적 연산입니다. 컨볼루션은 합성곱 신경망(CNN)의 핵심 구성 요소로, 이러한 네트워크가 이미지와 같은 격자형 데이터에서 계층적 패턴을 효과적으로 학습할 수 있게 해줍니다. 이 과정에는 입력 신호나 이미지에 커널이라고 하는 작은 필터를 적용하여 특징 맵이라고 하는 출력을 생성하는 것이 포함됩니다. 이러한 피처 맵은 커널이 감지한 가장자리, 텍스처 또는 모양과 같은 특정 패턴을 강조 표시합니다.

컨볼루션의 작동 방식

큰 이미지(입력) 위에 작은 돋보기(커널)를 밀어 넣는다고 상상해 보세요. 각 위치에서 돋보기는 이미지의 작은 부분에 초점을 맞춥니다. 컨볼루션 연산은 커널에 정의된 가중치를 사용하여 해당 패치 내의 픽셀 값의 가중치 합계를 계산합니다. 이렇게 계산된 단일 값은 출력 피처 맵에서 하나의 픽셀이 됩니다. 커널은 전체 입력 이미지를 단계별로 체계적으로 슬라이드하여('보폭'이라는 매개변수로 정의됨) 완전한 특징 맵을 생성합니다. 예를 들어 한 커널은 수평 가장자리를 감지하고 다른 커널은 모서리를 감지하는 등 커널마다 서로 다른 특징을 감지하도록 설계되었습니다. 단일 레이어에서 여러 개의 커널을 사용함으로써 CNN은 입력에서 풍부한 특징 세트를 추출할 수 있습니다. 이 프로세스에 대한 시각적 설명은 CNN에 대한 스탠포드 CS231n 강의 노트와 같은 리소스에서 살펴볼 수 있습니다.

컨볼루션의 주요 구성 요소

  • 입력 데이터: 일반적으로 멀티채널 이미지(예: RGB 채널) 또는 이전 레이어의 출력 피처 맵입니다.
  • 커널(필터): 탐지할 피처를 정의하는 작은 가중치 행렬입니다. 이러한 가중치는 모델 학습 과정에서 학습됩니다.
  • 특징 맵: 감지된 특징의 존재 여부와 공간적 위치를 나타내는 컨볼루션 작업의 결과물입니다.
  • 보폭: 보폭: 각 단계에서 커널이 입력에 따라 이동하는 픽셀 수입니다.
  • 패딩: 입력 이미지의 테두리 주변에 픽셀(일반적으로 0)을 추가하여 출력 피처 맵의 공간 치수를 제어합니다.

컨볼루션의 응용

컨볼루션 레이어는 많은 최신 AI 애플리케이션에서 필수적인 요소입니다:

1. 물체 감지

객체 탐지에서 CNN은 컨볼루션을 사용하여 경계 상자를 사용하여 이미지 내에서 객체와 그 위치를 식별합니다. 다음과 같은 모델 Ultralytics YOLO 와 같은 모델은 컨볼루션 레이어에 크게 의존하여 다양한 스케일의 특징을 추출하므로 다양한 물체를 효율적으로 감지할 수 있습니다. 이는 보행자, 자동차, 교통 표지판을 실시간으로 감지하는 것이 안전을 위해 필수적인 자율 주행 차량과 같은 애플리케이션에 매우 중요합니다. 자동차 솔루션의 AI에 대해 자세히 알아보세요.

2. 의료 이미지 분석

컨볼루션은 의료 이미지 분석에 중요한 역할을 하며 방사선 전문의가 엑스레이, CT, MRI와 같은 스캔을 분석하는 데 도움을 줍니다. CNN을 사용하는 AI 모델은 종양이나 골절과 같은 미묘한 이상 징후를 인간 전문가보다 더 빠르고 때로는 더 정확하게 감지할 수 있습니다. 예를 들어 종양 탐지에 YOLOv11을 사용하면 이러한 기능을 확인할 수 있습니다. 의료 솔루션의 AI에 대해 자세히 알아보세요.

컨볼루션과 관련 개념 비교

컨볼루션은 신경망 내에서 다른 연산 및 개념과 함께 사용되는 경우가 많습니다:

  • 풀링: 컨볼루션이 특징을 추출하는 동안 풀링 레이어(예: 최대 풀링 또는 평균 풀링)는 특징 맵의 공간 차원(다운샘플링)을 줄입니다. 이렇게 하면 계산 부하가 줄어들고 작은 공간 변화에도 특징 표현이 더욱 견고해집니다. 풀링은 한 지역의 특징을 요약하는 반면, 컨볼루션은 특징을 추출합니다. 자세한 내용은 CNN의 풀링 레이어에 대해 설명하는 리소스에서 확인할 수 있습니다.
  • 특징 추출: 원시 데이터를 기계 학습에 사용할 수 있는 수치적 특징으로 변환하는 과정을 가리키는 광범위한 용어입니다. 컨볼루션은 특히 CNN에서 그리드와 같은 데이터에서 자동으로 특징을 추출하는 데 매우 효과적인 특정 기술입니다.
  • 완전 연결 레이어: 커널을 로컬로 적용하고 가중치를 공유하는 컨볼루션 레이어와 달리, 완전 연결 레이어는 이전 레이어의 모든 뉴런을 현재 레이어의 모든 뉴런과 연결합니다. 일반적으로 CNN 아키텍처의 마지막 부분에 나타나 컨볼루션 및 풀링 레이어에서 추출한 높은 수준의 특징을 기반으로 분류 또는 회귀를 수행합니다. 신경망(NN)의 기본 사항에 대해 자세히 알아보세요.

컨볼루션을 이해하는 것은 Ultralytics HUB를 통해 제공되는 모델을 포함한 수많은 최신 AI 모델이 시각적 정보를 해석하는 방식을 파악하는 데 핵심입니다. 다음과 같은 프레임워크 PyTorchTensorFlow 와 같은 프레임워크는 컨볼루션 연산의 효율적인 구현을 제공합니다. OpenCV와 같은 라이브러리도 블러 처리 및 선명도 향상과 같은 기존 이미지 처리 작업에 컨볼루션을 활용합니다.

모두 보기