시맨틱 분할은 이미지 내의 모든 픽셀에 특정 클래스 레이블을 할당하는 컴퓨터 비전(CV) 의 기본 작업입니다. 객체를 식별하거나 전체 이미지를 분류하는 다른 비전 작업과 달리 시맨틱 분할은 장면 콘텐츠를 픽셀 단위로 밀도 있게 파악할 수 있습니다. 즉, 단순히 자동차가 있다는 것을 감지하는 것이 아니라 어떤 픽셀이 자동차 범주에 속하는지 정확하게 파악하여 도로, 하늘 또는 보행자에 속하는 픽셀과 구분합니다. 이미지를 다양한 객체 범주에 해당하는 의미 있는 영역으로 분할하여 시각적 환경을 종합적으로 이해하는 것을 목표로 합니다.
시맨틱 세분화의 작동 방식
시맨틱 세그멘테이션의 주요 목표는 이미지의 각 픽셀을 미리 정의된 카테고리 집합으로 분류하는 것입니다. 예를 들어 자동차, 보행자, 나무가 여러 개 포함된 이미지에서 시맨틱 분할 모델은 자동차를 구성하는 모든 픽셀을 '자동차', 보행자의 모든 픽셀을 '보행자', 나무의 모든 픽셀을 '나무'로 레이블을 지정합니다. 이 모델은 동일한 객체 클래스의 모든 인스턴스를 동일하게 취급합니다.
최신 의미론적 세그멘테이션은 딥 러닝, 특히 CNN(Convolutional Neural Network)에 크게 의존합니다. 이러한 모델은 일반적으로 지도 학습 기법을 사용하여 훈련되며, 상세한 픽셀 수준의 주석이 포함된 대규모 데이터 세트가 필요합니다. 이 과정에는 이미지를 네트워크에 입력하면 세분화 맵이 출력되는 과정이 포함됩니다. 이 맵은 기본적으로 각 픽셀의 값(종종 색상으로 표시됨)이 예측된 클래스 레이블에 해당하는 이미지로, '도로', '건물', '사람' 등과 같은 다양한 카테고리를 시각적으로 구분합니다. 데이터 라벨링의 품질은 정확한 모델을 학습시키는 데 매우 중요합니다.
다른 세분화 작업과의 주요 차이점
의미론적 세분화와 관련 컴퓨터 비전 작업을 구분하는 것이 중요합니다:
- 이미지 분류: 전체 이미지에 단일 레이블을 할당합니다(예: "이 이미지에는 고양이가 포함되어 있습니다"). 개체의 위치나 윤곽선은 지정하지 않습니다.
- 개체 감지: 경계 상자를 사용하여 개체를 식별하고 위치를 찾습니다. 객체의 위치를 알려주지만 픽셀 수준에서 정확한 모양은 제공하지 않습니다.
- 인스턴스 세분화: 각 픽셀을 분류할 뿐만 아니라 동일한 오브젝트 클래스의 여러 인스턴스를 구분하여 시맨틱 세그먼트보다 한 단계 더 나아갑니다. 예를 들어, 장면의 각 개별 자동차에 고유 ID와 마스크를 할당할 수 있습니다. 자세한 내용은 인스턴스 분할과 시맨틱 분할을 비교하는 이 가이드를 참조하세요.
- 파놉틱 세분화: 시맨틱 및 인스턴스 세분화를 결합하여 모든 픽셀에 대한 카테고리 레이블과 셀 수 있는 객체('사물')에 대한 고유 인스턴스 ID를 모두 제공하는 동시에 하늘이나 도로와 같이 셀 수 없는 배경 영역('사물')을 그룹화합니다.
실제 애플리케이션
시맨틱 세분화가 제공하는 상세한 장면 이해는 많은 실제 애플리케이션에서 매우 중요합니다:
- 자율 주행: 자율주행차는 시맨틱 세분화를 사용하여 주변 환경을 정확하게 이해합니다. 자율 주행 시스템은 도로, 차선, 인도, 보행자, 다른 차량, 장애물에 속하는 픽셀을 분류함으로써 보다 안전한 내비게이션 결정을 내릴 수 있습니다. 이는 차량용 AI 솔루션의 핵심 구성 요소입니다.
- 의료 이미지 분석: 의료 분야에서 시맨틱 세그멘테이션은 MRI나 CT와 같은 의료 스캔을 분석하는 데 도움이 됩니다. 자동으로 장기를 묘사하고, 종양이나 병변을 식별 및 측정하며, 픽셀 수준의 정확도로 이상 징후를 강조할 수 있습니다. 예를 들어, Ultralytics YOLO 모델은 종양 탐지에 사용되어 방사선 전문의가 상세한 의료 영상 기술을 기반으로 진단 및 치료 계획을 세우는 데 도움을 줄 수 있습니다.
- 위성 이미지 분석: 토지 피복 분류, 삼림 벌채 모니터링, 도시 계획 및 농업 분야에 사용됩니다. NASA 지구 관측소의 예에서 볼 수 있듯이 위성 사진에서 숲, 수역, 들판, 건물이 들어선 지역을 구분할 수 있습니다. 컴퓨터 비전으로 위성 이미지를 분석하는 방법에 대해 자세히 알아보세요.
- 로보틱스: 로봇이 장면 내의 레이아웃과 물체를 이해하여 주변 환경을 보다 효과적으로 인식하고 상호 작용할 수 있도록 지원합니다. 로봇 공학에 컴퓨터 비전을 통합하는 방법에 대해 알아보세요.
모델 및 도구
시맨틱 세그멘테이션은 종종 딥러닝 모델, 특히 CNN에서 파생된 아키텍처를 사용합니다.