인스턴스 세그멘테이션이 어떻게 픽셀 단위 객체 탐지를 가능하게 하는지 알아보세요. 초고속 실시간 마스크 생성을 위한 Ultralytics 활용법 등을 확인해 보세요.
인스턴스 분할은 컴퓨터 비전(CV) 분야의 정교한 기술로, 이미지 내 관심 대상물 각각을 픽셀 단위로 식별하고 경계를 구분합니다. 표준 객체 탐지가 직사각형 경계 상자로 물체를 위치 파악하는 반면, 인스턴스 분할은 탐지된 모든 개체에 대해 정밀한 마스크를 생성함으로써 분석을 심화시킵니다. 이러한 능력 덕분에 인공지능(AI) 모델은 동일한 클래스의 개별 객체를 구분할 수 있습니다. 예를 들어 겹쳐진 두 사람을 분리함으로써, 단순한 분류 방법에 비해 시각적 장면에 대한 풍부하고 상세한 이해를 제공합니다.
인스턴스 분할의 유용성을 완전히 이해하려면 다른 관련 이미지 처리 작업과 구분하는 것이 도움이 됩니다. 각 방법은 응용 프로그램 요구 사항에 따라 서로 다른 수준의 세분성을 제공합니다.
현대적인 인스턴스 분할 모델은 일반적으로 고급 딥러닝(DL) 아키텍처, 특히 컨볼루션 신경망(CNN)에 의존합니다. 이러한 네트워크는 이미지에서 특징을 추출하여 객체의 클래스와 공간적 윤곽을 모두 예측합니다. 역사적으로, Mask R-CNN과 같은 2단계 아키텍처가 표준이었으며, 먼저 관심 영역을 제안한 후 이를 마스크로 정교화하는 방식을 취했습니다.
그러나 최근의 발전으로 YOLO26과 같은 단일 단계 탐지기가 등장했으며, 이는 탐지와 분할을 동시에 수행합니다. 이러한 "엔드 투 엔드" 접근 방식은 실시간 추론 속도를 크게 향상시켜 소비자용 하드웨어에서 실시간 비디오 스트림에 고정밀 분할을 적용할 수 있게 합니다.
인스턴스 분할이 제공하는 정확한 경계는 의사 결정에 있어 물체의 정확한 형태와 위치를 파악해야 하는 산업 분야에서 매우 중요합니다.
개발자는 다음을 사용하여 인스턴스 세분화를 쉽게 구현할 수 있습니다. ultralytics library. 다음 예제는 사전 훈련된 모델을 로드하는 방법을 보여줍니다. YOLO26 모델
이미지에 대한 분할 마스크를 생성합니다.
from ultralytics import YOLO
# Load a pre-trained YOLO26 instance segmentation model
# The 'n' suffix denotes the nano version, optimized for speed
model = YOLO("yolo26n-seg.pt")
# Run inference on an image
# This predicts classes, bounding boxes, and masks
results = model("https://ultralytics.com/images/bus.jpg")
# Visualize the results
# Displays the image with overlaid segmentation masks
results[0].show()
강력하지만 인스턴스 분할은 단순한 바운딩 박스 탐지에 비해 계산 집약적입니다. 픽셀 단위 정밀도를 가진 마스크 생성은 상당한 GPU 정밀한 데이터 주석 작업을 요구합니다. 이러한 작업에 필요한 데이터 주석은 모든 객체 주변에 정밀한 다각형을 그리는 과정을 포함하며, 이는 시간이 많이 소요될 수 있습니다.
이 프로세스를 간소화하기 위해 팀들은 종종 Ultralytics 같은 도구를 사용합니다. Ultralytics 데이터셋 관리, 자동 주석 부여, 클라우드 기반 훈련 기능을 제공합니다. 이를 통해 개발자는 특정 산업 부품이나 생물학적 표본과 같은 사용자 정의 데이터로 모델을 미세 조정하고, 최적화된 형식(예: ONNX)을 사용하여 에지 AI 장치에 효율적으로 배포할 수 있습니다. ONNX 또는 TensorRT와 같은 최적화된 형식으로 에지 AI 장치에 효율적으로 배포할 수 있습니다.