인스턴스 세분화: 빠른 가이드

컴퓨터 비전 애플리케이션은 도로 상황을 모니터링하는 교통 카메라부터 상점의 무인 계산대에 이르기까지 우리 일상생활에서 점점 더 보편화되고 있습니다. 비전 AI는 인간과 유사한 방식으로 시각 데이터를 이해할 수 있도록 지원함으로써 다양한 산업에 영향을 미치고 있습니다.

이러한 애플리케이션 중 다수는 이미지의 주요 객체 주위에 경계 상자를 배치하는 컴퓨터 비전 작업인 객체 감지에 의존합니다. 이 접근 방식은 종종 잘 작동하지만 일부 이미지 분석 솔루션은 훨씬 더 높은 정밀도가 필요합니다.

예를 들어, 의료 영상은 종양을 감지하는 것 이상을 필요로 하며, 정확한 모양을 윤곽선으로 표시하는 것이 중요합니다. 마찬가지로 로봇 공학에서 기계는 객체를 올바르게 잡기 위해 정확한 윤곽선을 인식해야 합니다. 이러한 문제를 해결하기 위해 Instance Segmentation은 보다 정확한 솔루션을 제공합니다.

인스턴스 분할은 객체를 감지하는 것만으로는 충분하지 않은 사용 사례를 지원하기 위해 설계된 컴퓨터 비전 작업으로, 픽셀 수준의 정확도를 제공합니다. 다음과 같은 컴퓨터 비전 모델은 Ultralytics YOLO11 와 같은 컴퓨터 비전 모델을 사용하여 이미지와 동영상에 인스턴스 분할을 쉽게 적용할 수 있습니다.

__wf_reserved_inherit — 그림 1. 인스턴스 세분화에 YOLO11 사용한 예시.

‍

이 가이드에서는 인스턴스 세분화의 작동 방식과 그 적용, 그리고 특정 세분화 작업에 대해 Ultralytics YOLO11 사용자 지정 학습하는 방법을 자세히 설명합니다.

개체 인스턴스 분할이란 무엇인가요?

예를 들어, 사람들이 서로 가까이 서 있는 단체 사진이 있다고 가정해 보겠습니다. 객체 감지는 각 사람 주위에 상자를 그리는 데 도움이 될 수 있지만 정확한 모양을 알 수는 없습니다.

반면에 인스턴스 분할은 각 사람의 전체 윤곽선을 볼 수 있도록 각 사람 주위를 조심스럽게 추적하는 것과 유사합니다. 단순히 상자로 무언가가 있는 위치를 표시하는 대신 픽셀 수준에서 각 객체의 정확한 모양을 식별하여 복잡한 이미지를 더 쉽게 이해할 수 있습니다.

그 결과 객체의 모양을 채우고 정확히 어떤 픽셀이 객체에 속하는지 정확하게 찾아내는 상세한 마스크가 생성됩니다. 이러한 수준의 정밀도는 객체의 정확한 모양과 경계를 파악하는 것이 중요한 많은 실제 응용 분야에서 유용합니다.

‍

개체 인스턴스 분할 vs 시맨틱 분할

인스턴스 분할을 탐색하는 동안 시맨틱 분할 개념을 접할 수 있습니다.

두 기술 모두 컴퓨터가 픽셀 수준에서 이미지를 이해하도록 돕지만, 서로 다른 목적을 수행합니다. 시맨틱 세분화는 모든 픽셀을 해당 범주에 따라 레이블링하여 동일한 유형의 모든 객체를 함께 그룹화합니다. 예를 들어, 여러 대의 자동차가 있는 이미지에서 시맨틱 세분화는 개별 차량을 구별하지 않고 모두 "자동차"로 표시합니다.

반면에 개체 인스턴스 분할은 각 객체를 개별적으로 식별하여 한 단계 더 나아갑니다. 개별 인스턴스에 고유한 레이블을 할당하고 모양 주위에 정확한 마스크를 만듭니다. 따라서 동일한 이미지에서 개체 인스턴스 분할은 모든 것을 "자동차"로 레이블 지정하는 것이 아니라 각 자동차를 개별적으로 인식하고 윤곽을 그립니다.

두 가지의 주요 차이점은 시맨틱 세분화가 객체를 범주별로 그룹화하는 반면, 인스턴스 세분화는 각 객체를 명확한 경계를 가진 고유한 엔터티로 구별한다는 것입니다. 어떤 작업을 사용할지 선택하는 것은 특정 애플리케이션에 따라 다릅니다. 이미지에 무엇이 있는지 아는 것으로 충분한지, 아니면 개별 객체를 구별하는 것이 중요한지에 따라 달라집니다.

‍

인스턴스 분할 작동 방식 이해

다음으로, 인스턴스 분할이 일반적으로 어떻게 작동하는지 살펴보겠습니다. 이전 컴퓨터 비전 모델은 2단계 접근 방식을 사용합니다.

먼저 객체 주위에 경계 상자를 그려서 객체를 detect . 그런 다음 픽셀 수준의 마스크를 생성하여 각 물체의 정확한 모양을 윤곽을 그립니다. 잘 알려진 예로 마스크 예측 단계를 추가하여 객체 감지 모델을 기반으로 구축하는 마스크 R-CNN이 있습니다. 이 방법은 효과적이지만 이미지를 여러 단계로 처리하기 때문에 속도가 느려 실시간 애플리케이션에 적용하기가 더 어려울 수 있습니다.

반면, YOLO11 같은 모델은 한 번에 이미지를 처리하면서 객체 경계 상자와 인스턴스 분할 마스크를 동시에 예측합니다. 이 간소화된 접근 방식은 높은 정확도를 유지하면서 훨씬 더 빠르게 처리합니다. 따라서 속도와 정밀도가 모두 중요한 자율 주행, 비디오 분석, 로봇 공학 같은 실시간 애플리케이션에 특히 유용합니다.

인스턴스 세분화를 위한 맞춤형 교육 YOLO11

YOLO11 기본적으로 사전 학습된 모델로 제공됩니다. 예를 들어 세분화를 위해 일상적인 객체를 다루는 COCO 데이터 세트에 대해 학습되었습니다. 그러나 Ultralytics Python 패키지는 고유한 객체를 세분화해야 하는 특수한 애플리케이션에 필수적인 사용자 지정 학습을 지원합니다.

모델의 사용자 정의 학습 또는 미세 조정이 중요한 이유는 무엇입니까? 사용자 정의 학습은 사전 훈련된 모델에 이미 내장된 지식을 활용하여 전이 학습을 활용합니다. 처음부터 시작하는 대신 기존 모델을 더 작은 데이터 세트와 더 적은 컴퓨팅 리소스를 사용하여 새로운 작업에 적용하면서도 높은 정확도를 유지합니다.

YOLO11 맞춤 교육 방법

예를 들어 세분화를 위해 YOLO11 미세 조정하는 단계에 대해 자세히 살펴보세요:

데이터 준비: 특정 애플리케이션에 따라 이미지를 수집하고 주석을 달 수 있습니다. Ultralytics 여러 이미지 데이터 세트를 지원하지만, 필요한 YOLO 형식으로 이미지와 주석을 준비하여 자체 데이터 세트를 사용하여 학습할 수도 있습니다.
‍
사전 학습된 모델 사용: 처음부터 시작하는 대신 사전 학습된 Ultralytics YOLO11 모델을 사용하세요.
‍
모델 훈련: 배치 크기(반복당 처리되는 이미지), 이미지 크기(대상 입력 해상도) 및 에포크(총 훈련 주기)와 같은 중요한 훈련 설정을 조정하고 모델을 훈련합니다.
‍
성능 평가: 모델 학습이 완료된 후에는 mAP 같은 성능 메트릭을 사용하여 모델의 정확도를 테스트할 수 있습니다. Ultralytics Python 패키지는 모델 평가를 위한 기본 제공 기능도 제공합니다.

YOLO11 활성화된 인스턴스 세분화 애플리케이션

개체 인스턴스 분할은 기계가 사물을 더 정확하게 보고 이해하도록 지원함으로써 실제 문제를 해결하는 데 사용될 수 있습니다. 자동화 개선에서 환경 보호에 이르기까지 여러 분야에서 핵심적인 역할을 합니다. 이것이 어떤 영향을 미치는지 몇 가지 예를 살펴보겠습니다.

YOLO11 사용한 건설 현장 안전 및 모니터링

개체 인스턴스 분할은 건설 현장에서 안전과 효율성을 보장하는 데 중요한 역할을 할 수 있습니다. 예를 들어, 중장비 모니터링에 사용될 수 있습니다.

YOLO11 크레인, 굴삭기, 불도저 등 다양한 유형의 장비를 정확하게 segment 식별하고 실시간으로 위치를 track 수 있도록 미세 조정할 수 있습니다. 이를 통해 현장 관리자는 장비가 지정된 구역 내에서만 작동하고 작업자가 있거나 위험이 있는 구역을 침범하지 않도록 할 수 있습니다.

또한 이러한 솔루션을 실시간 경고 시스템과 통합하면 신속한 시정 조치를 취할 수 있습니다. 더 나아가 수집된 통찰력은 현장 레이아웃과 워크플로를 최적화하여 위험을 줄이고 생산성을 높이는 데 도움이 될 수 있습니다.

‍

세분화 및 YOLO11 통한 동물 YOLO11

동물 행동 모니터링은 연구원, 농부, 환경 보호론자들이 다양한 환경에서 동물을 더 잘 돌볼 수 있도록 돕습니다. 인스턴스 분할은 농장, 동물원 및 자연 서식지에서 개별 동물을 식별하고 분할하여 이러한 시스템에서 유용한 역할을 합니다. 경계 상자를 사용하는 기존 객체 감지와 달리 인스턴스 분할은 각 동물의 픽셀 수준 구분을 제공하므로 동물이 가까이 있을 때 특히 유용합니다.

자세한 분할은 움직임과 행동을 보다 정확하게 추적하는 데 도움이 됩니다. 겹치거나 밀집된 동물들을 명확하게 인식할 수 있으며, 상호 작용, 건강 평가 및 활동 패턴에 대한 보다 정확한 분석을 제공합니다. 전반적으로 동물 행동에 대한 더 깊은 통찰력은 동물 관리 및 관리 관행을 향상시킵니다.

‍

스포츠 분석 및 선수 추적의 YOLO11

정확한 선수 및 이벤트 추적은 스포츠 분석에서 매우 중요한 부분입니다. 기존의 추적 방식은 수동 태깅에 의존하기 때문에 세부적인 상호작용을 포착하지 못할 수 있습니다. 컴퓨터 비전을 사용하면 픽셀 수준에서 각 선수, 공, 주요 이벤트와 같은 세부 정보를 segment 상세한 인사이트를 얻을 수 있습니다.

예를 들어, 인스턴스 세분화는 각 선수와 객체를 명확하게 구분하여 파울이나 오프볼 사고와 같은 이벤트를 detect 데 도움이 될 수 있습니다. YOLO11 같은 모델을 통한 세분화된 모니터링은 분석가에게 보다 명확한 정보를 제공하여 움직임 패턴, 공간적 위치, 상호작용을 높은 정확도로 연구할 수 있게 해줍니다. 이러한 인사이트의 주요 이점은 팀이 전략을 개선하고 전반적인 성과를 높이는 데 도움이 된다는 것입니다.

인스턴스 분할의 장단점

인스턴스 분할이 다양한 산업에 가져다 줄 수 있는 주요 이점은 다음과 같습니다.

향상된 자동화: 품질 관리 및 안전 모니터링과 같은 작업을 자동화함으로써 인스턴스 분할은 수동 개입의 필요성을 줄이고 인적 오류를 최소화합니다.
‍
더 나은 장면 이해: 각 객체를 정확하게 윤곽선으로 표시함으로써 인스턴스 분할은 복잡한 장면을 더 깊이 이해하는 데 기여하여 더 많은 정보에 입각한 의사 결정을 지원합니다.
‍
효율적인 후처리: 픽셀 수준 출력은 배경 제거, 객체 계산 및 공간 분석과 같은 작업을 간소화하여 추가 처리 단계의 필요성을 줄입니다.

이러한 이점은 인스턴스 분할이 다양한 사용 사례에 미치는 영향을 강조하지만, 구현과 관련된 어려움을 고려하는 것도 중요합니다.

인스턴스 분할의 주요 제한 사항은 다음과 같습니다.

투명성 문제: 유리 및 물과 같은 투명하거나 반사되는 객체를 분할하기가 어려워 부정확한 경계가 발생합니다.
‍
유지 관리 오버헤드: 모델을 정확하고 관련성 있게 유지하려면 환경 조건 및 데이터 세트가 변경됨에 따라 지속적인 업데이트 및 미세 조정이 필요합니다.
‍
높은 어노테이션 노력: 인스턴스 분할 모델을 훈련하려면 자세한 픽셀 수준 어노테이션이 필요하므로 데이터 준비에 소요되는 시간과 비용이 크게 증가합니다.

주요 내용

개체 인스턴스 분할을 사용하면 겹치는 경우에도 개별 객체를 정밀하게 구별할 수 있습니다. 픽셀 수준에서 객체 경계를 캡처하여 객체 감지와 같은 기존 컴퓨터 비전 작업에 비해 시각적 데이터에 대한 더 깊은 이해를 제공합니다.

최근 컴퓨터 비전의 발전으로 인스턴스 세분화가 더 빠르고 사용하기 쉬워졌습니다. 특히, Ultralytics YOLO11 같은 컴퓨터 비전 모델은 프로세스를 간소화하여 최소한의 설정으로 실시간 세분화가 가능하므로 다양한 산업과 애플리케이션에서 더 쉽게 사용할 수 있습니다.

AI에 대해 더 궁금하신가요? 저희 GitHub 저장소를 방문하고 저희 커뮤니티와 연결하여 계속 탐색해 보세요. 솔루션 페이지에서 자율 주행 자동차의 AI 및 농업 분야의 비전 AI와 같은 혁신에 대해 알아보세요. 라이선스 옵션을 확인하고 컴퓨터 비전 프로젝트를 시작해 보세요!

인스턴스 세분화란 무엇일까요? 간단 가이드

개체 인스턴스 분할이란 무엇인가요?

개체 인스턴스 분할 vs 시맨틱 분할

인기 있는 인스턴스 분할 모델

인스턴스 분할 작동 방식 이해

인스턴스 세분화를 위한 맞춤형 교육 YOLO11

YOLO11 맞춤 교육 방법

YOLO11 활성화된 인스턴스 세분화 애플리케이션

YOLO11 사용한 건설 현장 안전 및 모니터링

세분화 및 YOLO11 통한 동물 YOLO11

스포츠 분석 및 선수 추적의 YOLO11

인스턴스 분할의 장단점

주요 내용

이 카테고리에서 더 읽어보기

단안 깊이 추정이란 무엇인가? 개요

이미지 컴퓨팅이란 무엇인가? 간략한 소개

템플릿 매칭이란 무엇인가? 간단한 안내서

함께 미래의 AI를 만들어 갑시다!