컴퓨터 비전 분야의 이미지 분할 기술을 탐구하세요. Ultralytics 인스턴스 분할, 의미적 분할, 범옵틱 분할을 위해 어떻게 정밀한 픽셀 단위 마스크를 제공하는지 알아보세요.
이미지 분할은 컴퓨터 비전(CV) 분야의 정교한 기술로, 디지털 이미지를 여러 개의 픽셀 하위 그룹으로 분할하는 것을 포함하며, 이는 흔히 이미지 세그먼트 또는 영역이라고 불립니다. 표준 이미지 분류가 전체 이미지에 단일 레이블을 할당하는 것과 달리, 분할은 각 개별 픽셀에 특정 클래스 레이블을 할당함으로써 시각적 데이터를 훨씬 더 세분화된 수준에서 분석합니다. 이 과정은 정밀한 픽셀 수준 지도를 생성하여 인공지능(AI) 모델이 단순히 어떤 객체가 존재하는지뿐만 아니라 정확히 어디에 위치하는지, 그리고 그 객체의 구체적인 경계가 무엇인지를 이해할 수 있게 합니다.
이러한 고충실도 이해를 달성하기 위해 분할 모델은 일반적으로 딥 러닝(DL) 아키텍처를 활용하며, 특히 컨볼루션 신경망(CNN)을 사용합니다. 이러한 네트워크는 강력한 특징 추출기로 작용하여 경계선, 질감, 복잡한 형태와 같은 패턴을 식별합니다. 고전적인 U-Net과 같은 전통적인 분할 아키텍처는 종종 인코더-디코더 구조를 채택합니다. 인코더는 입력 이미지를 압축하여 의미적 맥락을 포착하는 반면, 디코더는 공간적 세부 사항을 재구성하여 최종 분할 마스크를 출력합니다. U-Net과 같은 전통적인 세분화 아키텍처는 종종 인코더-디코더 구조를 사용합니다. 인코더는 입력 이미지를 압축하여 의미적 맥락을 포착하는 반면, 디코더는 공간적 세부 사항을 재구성하여 최종 세분화 마스크를 출력합니다.
현대적 발전은 2026년 1월 출시된 YOLO26과 같은 실시간 아키텍처를 가능케 했습니다. 이러한 모델들은 세그멘테이션 기능을 엔드투엔드 파이프라인에 직접 통합하여 클라우드 GPU부터 에지 디바이스에 이르는 다양한 하드웨어에서 고속 처리를 가능하게 합니다.
프로젝트의 구체적인 목표에 따라 개발자들은 일반적으로 세 가지 주요 세분화 기법 중에서 선택합니다:
세분화와 객체 탐지를 구분하는 것이 매우 중요합니다. 탐지 알고리즘은 직사각형 경계 상자를 사용하여 항목을 국소화하지만, 해당 상자 내에 배경 픽셀이 불가피하게 포함됩니다. 분할은 물체의 정확한 윤곽선이나 다각형을 추적함으로써 더 타이트하고 정확한 표현을 제공합니다. 이 차이는 로봇 팔이 충돌 없이 조작하기 위해 물체의 정확한 기하학적 구조를 알아야 하는 로봇 그레이핑과 같은 응용 분야에서 매우 중요합니다.
이미지 분할이 제공하는 정밀도는 다양한 산업 전반에 걸쳐 혁신을 주도합니다:
개발자는 다음을 사용하여 인스턴스 분할을 효율적으로 구현할 수 있습니다. ultralytics Python .
다음 예제는 최첨단 기술을 사용합니다. YOLO26 모델속도와 정확도 모두에 최적화되어 있습니다.
from ultralytics import YOLO
# Load a pre-trained YOLO26 segmentation model
# 'n' denotes the nano version, optimized for speed
model = YOLO("yolo26n-seg.pt")
# Run inference on an image to generate masks
# The model identifies objects and outlines their shape
results = model("https://ultralytics.com/images/bus.jpg")
# Display the image with segmentation overlays
results[0].show()
사용자 지정 작업에서 높은 성능을 달성하기 위해 팀은 종종 고품질 훈련 데이터를 선별해야 합니다. Ultralytics 다각형 마스크로 이미지를 주석 처리하고, 데이터셋을 관리하며, 클라우드에서 모델을 훈련시키는 도구를 제공함으로써 이 과정을 간소화하여 전체 머신 러닝 운영(MLOps)라이프사이클을 효율화합니다. OpenCV 과 같은 라이브러리도 이미지 전처리 및 결과 마스크 후처리를 위해 이러한 모델과 함께 자주 사용됩니다.