녹색 확인
링크가 클립보드에 복사됨

인스턴스 세분화란 무엇인가요? 빠른 가이드

인스턴스 분할의 정의, 작동 방식, 다양한 컴퓨터 비전 애플리케이션에서의 사용 및 그 영향에 대해 자세히 살펴보는 시간을 가져보세요.

도로 상황을 모니터링하는 교통 카메라부터 매장의 셀프 체크아웃 시스템에 이르기까지 컴퓨터 비전 애플리케이션은 일상 생활에서 점점 더 보편화되고 있습니다. 기계가 인간과 유사한 방식으로 시각 데이터를 이해할 수 있게 함으로써 비전 AI는 다양한 산업 분야에서 영향력을 발휘하고 있습니다.

이러한 애플리케이션의 대부분은 이미지의 주요 객체 주위에 경계 상자를 배치하는 컴퓨터 비전 작업인 객체 감지에 의존합니다. 이 접근 방식은 종종 잘 작동하지만, 일부 이미지 분석 솔루션에는 더 높은 정밀도가 필요합니다.

예를 들어 의료 영상 촬영에서는 단순히 종양을 감지하는 것 이상으로 종양의 정확한 윤곽을 파악하는 것이 중요합니다. 마찬가지로 로봇 공학에서도 기계가 물체를 정확하게 파악하려면 물체의 정확한 윤곽을 인식해야 합니다. 이러한 문제를 해결하기 위해 인스턴스 세분화는 보다 정밀한 솔루션을 제공합니다.

인스턴스 분할은 객체를 감지하는 것만으로는 충분하지 않은 사용 사례를 지원하기 위해 설계된 컴퓨터 비전 작업으로, 픽셀 수준의 정확도를 제공합니다. 다음과 같은 컴퓨터 비전 모델은 Ultralytics YOLO11 와 같은 컴퓨터 비전 모델을 사용하여 이미지와 동영상에 인스턴스 분할을 쉽게 적용할 수 있습니다. 

그림 1. 인스턴스 세분화에 YOLO11 사용한 예시.

이 가이드에서는 인스턴스 세분화의 작동 방식과 그 적용, 그리고 특정 세분화 작업에 맞게 Ultralytics YOLO11 사용자 지정 학습하는 방법을 자세히 설명합니다.

인스턴스 세분화란 무엇인가요?

사람들이 가까이 모여 서 있는 단체 사진이 있다고 가정해 봅시다. 물체 감지 기능은 각 사람 주위에 상자를 그리는 데 도움이 될 수 있지만 정확한 모양을 알려주지는 못합니다. 

반면에 인스턴스 분할은 겹치는 부분이 있더라도 전체 윤곽을 볼 수 있도록 각 인물의 주변을 세밀하게 추적하는 것과 유사합니다. 단순히 상자로 사물의 위치를 표시하는 것이 아니라 픽셀 수준에서 각 사물의 정확한 모양을 식별하므로 복잡한 이미지를 더 쉽게 이해할 수 있습니다.

그 결과 물체의 모양을 채우는 세부적인 마스크가 생성되어 물체에 속하는 픽셀을 정확히 찾아냅니다. 이 수준의 정밀도는 물체의 정확한 모양과 경계를 이해하는 것이 중요한 많은 실제 애플리케이션에서 유용합니다.

그림 2. YOLO11인스턴스 세분화 지원을 보여주는 예시.

인스턴스 세분화와 시맨틱 세분화 비교

인스턴스 세분화를 탐색하다가 의미론적 세분화라는 개념을 접할 수 있습니다.

두 기술 모두 컴퓨터가 픽셀 수준에서 이미지를 이해하는 데 도움이 되지만, 그 목적은 서로 다릅니다. 시맨틱 분할은 카테고리에 따라 모든 픽셀에 레이블을 지정하여 같은 유형의 모든 객체를 함께 그룹화합니다. 예를 들어 자동차가 여러 대 있는 이미지에서 시맨틱 분할은 개별 차량을 구분하지 않고 모두 "자동차"로 표시합니다.

반면 인스턴스 세분화는 각 개체를 개별적으로 식별함으로써 한 단계 더 나아갑니다. 개별 인스턴스에 고유한 레이블을 할당하고 모양을 중심으로 정밀한 마스크를 생성합니다. 따라서 동일한 이미지에서 인스턴스 세분화는 모든 것을 '자동차'로 표시하는 것이 아니라 각 자동차를 개별적으로 인식하고 윤곽을 그립니다.

이 둘의 주요 차이점은 의미론적 세분화는 개체를 범주별로 그룹화하는 반면, 인스턴스 세분화는 각 개체를 명확한 경계를 가진 고유한 개체로 구분한다는 점입니다. 어떤 작업을 사용할지는 이미지에 무엇이 있는지 파악하는 것으로 충분할지, 아니면 개별 개체를 구분하는 것이 중요한지 등 특정 애플리케이션에 따라 달라집니다.

그림 3. 인스턴스 세분화와 시맨틱 세분화 비교(각각 오른쪽과 왼쪽).

인기 있는 인스턴스 세분화 모델

현재 Vision AI 커뮤니티에서 사용할 수 있는 다양한 인스턴스 세분화 모델이 있습니다. 일부는 더 빠르고, 일부는 더 정확하며, 일부는 사용하기 더 쉽습니다. 

이러한 옵션은 유용하지만 특정 작업에 사용하기에 적합한 옵션이 무엇인지에 대한 질문으로 이어질 수 있습니다. 여러 옵션 중에서 속도와 정확성에 중점을 두는 Ultralytics YOLO 모델이 가장 인기가 있습니다. 

또한 이러한 모델은 수년에 걸쳐 크게 발전해 왔습니다. 예를 들어 Ultralytics YOLOv5 와 같은 프레임워크를 사용하여 배포를 간소화함으로써 깊은 기술 전문 지식 없이도 더 많은 사람들이 고급 비전 AI에 액세스할 수 있게 되었습니다.

이러한 성공을 기반으로 구축합니다, Ultralytics YOLOv8 은 인스턴스 분할, 포즈 추정, 이미지 분류와 같은 컴퓨터 비전 작업에 대한 향상된 지원을 도입했습니다. 

이제 YOLO11 성능을 새로운 차원으로 끌어올렸습니다. YOLOv8m 22% 더 적은 매개 변수로 COCO 데이터 세트에서 더 높은 평균 정밀도(mAP)를 달성하여 더 적은 리소스를 사용하면서도 더 정확하게 물체를 인식할 수 있습니다.

그림 4. YOLO11.

간단히 말해, YOLO11 효율성 저하 없이 최첨단 정확도를 제공하므로 이 분야의 판도를 바꿀 수 있는 제품입니다.

인스턴스 세분화의 작동 방식 이해

다음으로 인스턴스 세분화가 일반적으로 어떻게 작동하는지 살펴보겠습니다. 구형 컴퓨터 비전 모델은 2단계 접근 방식을 사용합니다. 

먼저 객체 주위에 경계 상자를 그려서 객체를 감지합니다. 그런 다음 픽셀 수준의 마스크를 생성하여 각 물체의 정확한 모양을 윤곽을 그립니다. 잘 알려진 예로 마스크 예측 단계를 추가하여 객체 감지 모델을 기반으로 구축하는 마스크 R-CNN이 있습니다. 이 방법은 효과적이지만 이미지를 여러 단계로 처리하기 때문에 속도가 느려 실시간 애플리케이션에 적용하기가 더 어려울 수 있습니다.

반면, YOLO11 같은 모델은 한 번에 이미지를 처리하면서 객체 경계 상자와 인스턴스 분할 마스크를 동시에 예측합니다. 이 간소화된 접근 방식은 높은 정확도를 유지하면서 훨씬 더 빠르게 처리합니다. 따라서 속도와 정밀도가 모두 중요한 자율 주행, 비디오 분석, 로봇 공학 같은 실시간 애플리케이션에 특히 유용합니다.

인스턴스 세분화를 위한 맞춤형 교육 YOLO11

YOLO11 기본적으로 사전 학습된 모델로 제공됩니다. 예를 들어 세분화를 위해 일상적인 객체를 다루는 COCO-Seg 데이터 세트에 대해 학습되었습니다. 그러나 Ultralytics Python 패키지는 고유한 객체를 세분화해야 하는 특수한 애플리케이션에 필수적인 사용자 지정 학습을 지원합니다.

맞춤형 학습 또는 모델 미세 조정이 중요한 이유는 무엇인가요? 사용자 지정 학습은 사전 학습된 모델에 이미 포함된 지식을 기반으로 전이 학습을 활용합니다. 처음부터 다시 시작하는 것이 아니라 더 적은 데이터 세트와 더 적은 컴퓨팅 리소스를 사용하여 기존 모델을 새로운 작업에 맞게 조정하면서도 높은 정확도를 유지합니다.

YOLO11 맞춤 교육 방법

예를 들어 세분화를 위해 YOLO11 미세 조정하는 단계에 대해 자세히 살펴보세요: 

  • 데이터 준비: 특정 애플리케이션에 따라 이미지를 수집하고 주석을 달 수 있습니다. Ultralytics 여러 이미지 데이터 세트를 지원하지만, 필요한 YOLO 형식으로 이미지와 주석을 준비하여 자체 데이터 세트를 사용하여 학습할 수도 있습니다.
  • 사전 학습된 모델 사용: 처음부터 시작하는 대신 사전 학습된 Ultralytics YOLO11 모델을 사용하세요.
  • 모델 훈련: 배치 크기(반복당 처리되는 이미지 수), 이미지 크기(목표 입력 해상도), 에포크(총 훈련 주기) 등 중요한 훈련 설정을 조정하고 모델을 훈련합니다.
  • 성능 평가: 모델 학습이 완료된 후에는 mAP와 같은 성능 메트릭을 사용하여 모델의 정확도를 테스트할 수 있습니다. Ultralytics Python 패키지는 모델 평가를 위한 기본 제공 기능도 제공합니다.

YOLO11 활성화된 인스턴스 세분화 애플리케이션

인스턴스 세분화는 기계가 사물을 더 정확하게 보고 이해하도록 지원하여 현실의 문제를 해결하는 데 사용할 수 있습니다. 자동화 개선부터 환경 보호에 이르기까지 다양한 분야에서 중요한 역할을 합니다. 인스턴스 세분화가 어떤 분야에 영향을 미치고 있는지 몇 가지 예를 살펴보겠습니다.

YOLO11 사용한 건설 현장 안전 및 모니터링

인스턴스 세분화는 건설 현장의 안전과 효율성을 보장하는 데 중요한 역할을 할 수 있습니다. 예를 들어 중장비를 모니터링하는 데 사용할 수 있습니다. 

YOLO11 크레인, 굴삭기, 불도저 등 다양한 유형의 장비를 정확하게 세분화하여 식별하고 실시간으로 위치를 추적할 수 있도록 미세 조정할 수 있습니다. 이를 통해 현장 관리자는 장비가 지정된 구역 내에서만 작동하고 작업자가 있거나 위험이 있는 구역을 침범하지 않도록 할 수 있습니다. 

또한 이러한 솔루션을 실시간 알림 시스템과 통합하면 신속한 시정 조치를 취할 수 있습니다. 이 외에도 수집된 인사이트를 통해 사이트 레이아웃과 워크플로우를 최적화하여 위험을 줄이고 생산성을 높일 수 있습니다.

그림 5. YOLO11 사용한 중장비 모니터링.

세분화 및 YOLO11 통한 동물 YOLO11

동물 행동 모니터링은 연구자, 농부, 환경 보호 운동가들이 다양한 환경에서 동물을 더 잘 돌볼 수 있도록 도와줍니다. 인스턴스 세분화는 농장, 동물원, 자연 서식지에서 개별 동물을 식별하고 세분화함으로써 이러한 시스템에서 유용한 역할을 합니다. 경계 상자를 사용하는 기존의 객체 감지와 달리, 인스턴스 분할은 각 동물에 대한 픽셀 수준의 묘사를 제공하므로 동물이 가까이 있을 때 특히 유용합니다.

세밀한 세분화를 통해 움직임과 행동을 더욱 정확하게 추적할 수 있습니다. 겹치거나 밀집된 동물을 명확하게 인식하고 상호 작용, 건강 평가, 활동 패턴을 보다 정밀하게 분석할 수 있습니다. 전반적으로 동물 행동에 대한 심층적인 인사이트는 동물 관리 및 관리 방식을 개선합니다.

그림 6. 인스턴스 세분화를 사용한 가축 모니터링.

스포츠 분석 및 선수 추적의 YOLO11

정확한 선수 및 이벤트 추적은 스포츠 분석에서 매우 중요한 부분입니다. 기존의 추적 방법은 수동 태깅에 의존하기 때문에 세부적인 상호작용을 포착하지 못할 수 있습니다. 컴퓨터 비전을 사용하면 픽셀 수준에서 각 선수, 공, 주요 이벤트와 같은 세부 정보를 세분화하여 상세한 인사이트를 얻을 수 있습니다.

예를 들어, 인스턴스 세분화는 각 선수와 객체를 명확하게 구분하여 파울이나 오프볼 사고와 같은 이벤트를 감지하는 데 도움이 될 수 있습니다. YOLO11 같은 모델을 통한 세분화된 모니터링은 분석가에게 보다 명확한 정보를 제공하여 움직임 패턴, 공간적 위치, 상호 작용을 높은 정확도로 연구할 수 있게 해줍니다. 이러한 인사이트의 주요 이점은 팀이 전략을 개선하고 전반적인 성과를 높이는 데 도움이 된다는 것입니다.

인스턴스 세분화의 장단점

인스턴스 세분화가 다양한 산업에 가져올 수 있는 몇 가지 주요 이점은 다음과 같습니다:

  • 자동화 개선: 인스턴스 세분화는 품질 관리 및 안전 모니터링과 같은 작업을 자동화함으로써 수동 개입의 필요성을 줄이고 인적 오류를 최소화합니다.
    ↪f_200D↩
  • 장면 이해도 향상: 인스턴스 세분화는 각 오브젝트의 윤곽을 정확하게 파악함으로써 복잡한 장면을 더 깊이 이해하여 정보에 입각한 의사 결정을 지원합니다.
    ↪cf_200D↩
  • 효율적인 후처리: 픽셀 수준의 출력은 배경 제거, 개체 수 계산, 공간 분석과 같은 작업을 간소화하여 추가 처리 단계의 필요성을 줄여줍니다.

이러한 이점은 인스턴스 세분화가 다양한 사용 사례에 미치는 영향을 강조하지만, 구현과 관련된 문제도 고려해야 합니다. 

인스턴스 세분화의 몇 가지 주요 제한 사항은 다음과 같습니다:

  • 투명도 관련 문제: 유리나 물과 같이 투명하거나 반사되는 물체를 분할하기가 어려워 경계가 부정확해집니다.
    ↪f_200D↩
  • 유지보수 오버헤드: 모델의 정확성과 관련성을 유지하려면 환경 조건과 데이터 세트의 변화에 따라 지속적인 업데이트와 미세 조정이 필요합니다.
    ↪f_200D↩
  • 많은 주석 작업: 인스턴스 세분화 모델을 학습하려면 상세한 픽셀 수준의 주석이 필요하므로 데이터 준비에 소요되는 시간과 비용이 크게 증가합니다.

주요 요점

인스턴스 분할을 사용하면 겹치는 경우에도 개별 객체를 정밀하게 구분할 수 있습니다. 픽셀 수준에서 객체 경계를 캡처함으로써 객체 감지와 같은 기존 컴퓨터 비전 작업에 비해 시각적 데이터를 더 깊이 이해할 수 있습니다.

최근 컴퓨터 비전의 발전으로 인스턴스 세분화가 더 빠르고 사용하기 쉬워졌습니다. 특히, Ultralytics YOLO11 같은 컴퓨터 비전 모델은 프로세스를 간소화하여 최소한의 설정으로 실시간 세분화가 가능하므로 다양한 산업과 애플리케이션에서 더 쉽게 사용할 수 있습니다.

AI에 대해 궁금하신가요? GitHub 리포지토리를 방문하고 커뮤니티에 참여하여 계속 탐색해 보세요. 솔루션 페이지에서 자율 주행 자동차의 AI와 농업 분야의 비전 AI와 같은 혁신에 대해 알아보세요. 라이선스 옵션을 확인하고 컴퓨터 비전 프로젝트를 시작하세요!

Facebook 로고트위터 로고LinkedIn 로고복사 링크 기호

이 카테고리에서 자세히 보기

인공지능의 미래
를 함께 만들어 갑시다!

머신 러닝의 미래와 함께하는 여정 시작하기