파놉틱 세분화가 어떻게 시맨틱 및 인스턴스 세분화를 통합하여 AI 애플리케이션에서 정확한 픽셀 수준의 장면 이해를 지원하는지 알아보세요.
파놉틱 분할은 모든 픽셀에 클래스 레이블과 고유 인스턴스 ID를 모두 할당하여 이미지를 완전하고 일관성 있게 이해하는 것을 목표로 하는 고급 컴퓨터 비전 작업입니다. 이는 각 픽셀에 카테고리(예: '자동차', '도로', '하늘')를 지정하는 의미적 분할과 개별 객체 인스턴스(예: '자동차 1', '자동차 2')를 식별하고 묘사하는 인스턴스 분할이라는 두 가지 주요 분할 패러다임을 효과적으로 통합합니다. 목표는 같은 클래스의 여러 객체를 구분하고 흔히 '물건'(예: 도로, 하늘, 초목)과 셀 수 있는 '사물'(예: 자동차, 보행자, 자전거)로 불리는 무정형 배경 영역을 식별하는 장면의 포괄적인 픽셀 수준 맵을 만드는 것입니다. 이러한 전체론적 접근 방식은 시맨틱 또는 인스턴스 세분화만 사용하는 것보다 더 풍부한 장면 컨텍스트를 제공합니다.
파놉틱 분할 알고리즘은 이미지를 처리하여 모든 픽셀이 의미론적 레이블을 받고, 계산 가능한 객체('사물')에 속하는 경우 고유한 인스턴스 ID를 받는 단일 출력 맵을 생성합니다. 배경 영역('사물')에 속한 픽셀은 동일한 시맨틱 레이블을 공유하지만 일반적으로 고유한 인스턴스 ID를 갖지 않습니다(또는 사물 카테고리당 단일 ID를 공유). 최신 접근 방식은 종종 딥 러닝, 특히 CNN(Convolutional Neural Network) 또는 트랜스포머를 기반으로 하는 아키텍처를 활용합니다. 일부 방법은 시맨틱 및 인스턴스 세분화를 위해 별도의 네트워크 분기를 사용한 다음 결과를 융합하는 반면, 원래의 "파놉틱 세분화" 문서에서 소개한 것처럼 파놉틱 작업을 위해 특별히 설계된 엔드투엔드 모델을 사용하는 방법도 있습니다. 이러한 모델을 훈련하려면 COCO 파놉틱 데이터 세트나 도시 풍경 데이터 세트와 같이 상세한 파놉틱 주석이 포함된 데이터 세트가 필요합니다. 성능은 종종 세분화 품질과 인식 품질을 결합한 파놉틱 품질(PQ ) 메트릭을 사용하여 측정됩니다.
파놉틱 세분화와 관련 컴퓨터 비전 작업의 차이점을 이해하는 것이 중요합니다:
파놉틱 분할은 시맨틱 분할과 인스턴스 분할의 강점을 고유하게 결합하여 모든 픽셀을 클래스 레이블이 지정된 배경 영역 또는 별개의 객체 인스턴스로 분할하는 통합된 출력을 제공합니다.
파놉틱 세분화가 제공하는 포괄적인 장면 이해는 다양한 영역에서 유용합니다:
YOLO11 같은 Ultralytics 모델은 객체 감지 및 인스턴스 세분화와 같은 작업에서 최첨단 성능을 제공하지만, 파놉틱 세분화는 점점 더 정교해지는 AI 애플리케이션에 필수적인 다음 단계의 통합 장면 이해를 나타냅니다. Ultralytics HUB와 같은 플랫폼을 사용하여 관련 작업을 위한 모델을 관리하고 훈련할 수 있습니다.