Yolo 비전 선전
선전
지금 참여하기
용어집

개체 인스턴스 분할

인스턴스 세그멘테이션이 어떻게 픽셀 단위 객체 탐지를 가능하게 하는지 알아보세요. 초고속 실시간 마스크 생성을 위한 Ultralytics 활용법 등을 확인해 보세요.

인스턴스 분할은 컴퓨터 비전(CV) 분야의 정교한 기술로, 이미지 내 관심 대상물 각각을 픽셀 단위로 식별하고 경계를 구분합니다. 표준 객체 탐지가 직사각형 경계 상자로 물체를 위치 파악하는 반면, 인스턴스 분할은 탐지된 모든 개체에 대해 정밀한 마스크를 생성함으로써 분석을 심화시킵니다. 이러한 능력 덕분에 인공지능(AI) 모델은 동일한 클래스의 개별 객체를 구분할 수 있습니다. 예를 들어 겹쳐진 두 사람을 분리함으로써, 단순한 분류 방법에 비해 시각적 장면에 대한 풍부하고 상세한 이해를 제공합니다.

세분화 유형 구분

인스턴스 분할의 유용성을 완전히 이해하려면 다른 관련 이미지 처리 작업과 구분하는 것이 도움이 됩니다. 각 방법은 응용 프로그램 요구 사항에 따라 서로 다른 수준의 세분성을 제공합니다.

  • 의미적 분할: 이 접근법은 이미지 내 모든 픽셀을 범주(예: "도로", "하늘", "차량")로 분류합니다. 그러나 동일한 범주 내 개별 객체 간 차이는 구분하지 않습니다. 세 대의 차량이 서로 나란히 주차된 경우, 의미적 분할은 이를 단일 "차량" 영역으로 인식합니다.
  • 인스턴스 분할: 이 방법은 각 개체를 고유한 개체로 취급합니다. 개별 인스턴스를 탐지하고 각각의 픽셀에 고유한 레이블을 할당합니다. 주차된 차량의 예시에서 인스턴스 분할은 "차량 A", "차량 B", "차량 C"를 각각 식별하는 세 개의 별개의 마스크를 생성할 것입니다.
  • 파노프틱 세그멘테이션: 의미적 세그멘테이션의 배경 라벨링과 인스턴스 세그멘테이션의 계수 가능한 객체 식별을 결합한 하이브리드 접근법.

픽셀 단위 분석의 메커니즘

현대적인 인스턴스 분할 모델은 일반적으로 고급 딥러닝(DL) 아키텍처, 특히 컨볼루션 신경망(CNN)에 의존합니다. 이러한 네트워크는 이미지에서 특징을 추출하여 객체의 클래스와 공간적 윤곽을 모두 예측합니다. 역사적으로, Mask R-CNN과 같은 2단계 아키텍처가 표준이었으며, 먼저 관심 영역을 제안한 후 이를 마스크로 정교화하는 방식을 취했습니다.

그러나 최근의 발전으로 YOLO26과 같은 단일 단계 탐지기가 등장했으며, 이는 탐지와 분할을 동시에 수행합니다. 이러한 "엔드 투 엔드" 접근 방식은 실시간 추론 속도를 크게 향상시켜 소비자용 하드웨어에서 실시간 비디오 스트림에 고정밀 분할을 적용할 수 있게 합니다.

실제 애플리케이션

인스턴스 분할이 제공하는 정확한 경계는 의사 결정에 있어 물체의 정확한 형태와 위치를 파악해야 하는 산업 분야에서 매우 중요합니다.

  • 의료 분야 인공지능: 의학 진단에서 종양이나 병변의 정확한 크기와 형태를 파악하는 것은 매우 중요합니다. 인스턴스 분할 기술은 모델이 MRI 영상에서이상 부위를 높은 정밀도로 윤곽을 그릴 수 있게 하여, 방사선과 의사가 치료 계획을 수립하고 질병 진행을 모니터링하는 데 도움을 줍니다.
  • 자율주행 차량: 자율주행 차량은 복잡한 환경을 주행하기 위해 세분화 기술을 활용합니다. Cityscapes와 같은 데이터셋을 통해 차량은 주행 가능한 표면을 식별하고, 차선 표시를 인식하며, 혼잡한 횡단보도에서 개별 보행자를 구분하여 안전을 보장합니다.
  • 농업에서의 인공지능: 정밀 농업은 작물 건강 상태를 모니터링하기 위해 세분화 기술을 활용합니다. 비전 시스템을 장착한 로봇은 개별 과일을 식별하여 자동 수확하거나 detect 잡초를 detect 표적 제초제 살포가 가능해 화학 물질 사용량을 줄이고 수확량을 최적화합니다.

Python 이용한 세분화 구현

개발자는 다음을 사용하여 인스턴스 세분화를 쉽게 구현할 수 있습니다. ultralytics library. 다음 예제는 사전 훈련된 모델을 로드하는 방법을 보여줍니다. YOLO26 모델 이미지에 대한 분할 마스크를 생성합니다.

from ultralytics import YOLO

# Load a pre-trained YOLO26 instance segmentation model
# The 'n' suffix denotes the nano version, optimized for speed
model = YOLO("yolo26n-seg.pt")

# Run inference on an image
# This predicts classes, bounding boxes, and masks
results = model("https://ultralytics.com/images/bus.jpg")

# Visualize the results
# Displays the image with overlaid segmentation masks
results[0].show()

도전 과제와 모델 훈련

강력하지만 인스턴스 분할은 단순한 바운딩 박스 탐지에 비해 계산 집약적입니다. 픽셀 단위 정밀도를 가진 마스크 생성은 상당한 GPU 정밀한 데이터 주석 작업을 요구합니다. 이러한 작업에 필요한 데이터 주석은 모든 객체 주변에 정밀한 다각형을 그리는 과정을 포함하며, 이는 시간이 많이 소요될 수 있습니다.

이 프로세스를 간소화하기 위해 팀들은 종종 Ultralytics 같은 도구를 사용합니다. Ultralytics 데이터셋 관리, 자동 주석 부여, 클라우드 기반 훈련 기능을 제공합니다. 이를 통해 개발자는 특정 산업 부품이나 생물학적 표본과 같은 사용자 정의 데이터로 모델을 미세 조정하고, 최적화된 형식(예: ONNX)을 사용하여 에지 AI 장치에 효율적으로 배포할 수 있습니다. ONNX 또는 TensorRT와 같은 최적화된 형식으로 에지 AI 장치에 효율적으로 배포할 수 있습니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기