인스턴스 분할의 정의, 작동 방식, 다양한 컴퓨터 비전 애플리케이션에서의 사용 및 그 영향에 대해 자세히 살펴보는 시간을 가져보세요.
도로 상황을 모니터링하는 교통 카메라부터 매장의 셀프 체크아웃 시스템에 이르기까지 컴퓨터 비전 애플리케이션은 일상 생활에서 점점 더 보편화되고 있습니다. 기계가 인간과 유사한 방식으로 시각 데이터를 이해할 수 있게 함으로써 비전 AI는 다양한 산업 분야에서 영향력을 발휘하고 있습니다.
이러한 애플리케이션의 대부분은 이미지의 주요 객체 주위에 경계 상자를 배치하는 컴퓨터 비전 작업인 객체 감지에 의존합니다. 이 접근 방식은 종종 잘 작동하지만, 일부 이미지 분석 솔루션에는 더 높은 정밀도가 필요합니다.
예를 들어 의료 영상 촬영에서는 단순히 종양을 감지하는 것 이상으로 종양의 정확한 윤곽을 파악하는 것이 중요합니다. 마찬가지로 로봇 공학에서도 기계가 물체를 정확하게 파악하려면 물체의 정확한 윤곽을 인식해야 합니다. 이러한 문제를 해결하기 위해 인스턴스 세분화는 보다 정밀한 솔루션을 제공합니다.
인스턴스 분할은 객체를 감지하는 것만으로는 충분하지 않은 사용 사례를 지원하기 위해 설계된 컴퓨터 비전 작업으로, 픽셀 수준의 정확도를 제공합니다. 다음과 같은 컴퓨터 비전 모델은 Ultralytics YOLO11 와 같은 컴퓨터 비전 모델을 사용하여 이미지와 동영상에 인스턴스 분할을 쉽게 적용할 수 있습니다.
이 가이드에서는 인스턴스 세분화의 작동 방식과 그 적용, 그리고 특정 세분화 작업에 맞게 Ultralytics YOLO11 사용자 지정 학습하는 방법을 자세히 설명합니다.
사람들이 가까이 모여 서 있는 단체 사진이 있다고 가정해 봅시다. 물체 감지 기능은 각 사람 주위에 상자를 그리는 데 도움이 될 수 있지만 정확한 모양을 알려주지는 못합니다.
반면에 인스턴스 분할은 겹치는 부분이 있더라도 전체 윤곽을 볼 수 있도록 각 인물의 주변을 세밀하게 추적하는 것과 유사합니다. 단순히 상자로 사물의 위치를 표시하는 것이 아니라 픽셀 수준에서 각 사물의 정확한 모양을 식별하므로 복잡한 이미지를 더 쉽게 이해할 수 있습니다.
그 결과 물체의 모양을 채우는 세부적인 마스크가 생성되어 물체에 속하는 픽셀을 정확히 찾아냅니다. 이 수준의 정밀도는 물체의 정확한 모양과 경계를 이해하는 것이 중요한 많은 실제 애플리케이션에서 유용합니다.
인스턴스 세분화를 탐색하다가 의미론적 세분화라는 개념을 접할 수 있습니다.
두 기술 모두 컴퓨터가 픽셀 수준에서 이미지를 이해하는 데 도움이 되지만, 그 목적은 서로 다릅니다. 시맨틱 분할은 카테고리에 따라 모든 픽셀에 레이블을 지정하여 같은 유형의 모든 객체를 함께 그룹화합니다. 예를 들어 자동차가 여러 대 있는 이미지에서 시맨틱 분할은 개별 차량을 구분하지 않고 모두 "자동차"로 표시합니다.
반면 인스턴스 세분화는 각 개체를 개별적으로 식별함으로써 한 단계 더 나아갑니다. 개별 인스턴스에 고유한 레이블을 할당하고 모양을 중심으로 정밀한 마스크를 생성합니다. 따라서 동일한 이미지에서 인스턴스 세분화는 모든 것을 '자동차'로 표시하는 것이 아니라 각 자동차를 개별적으로 인식하고 윤곽을 그립니다.
이 둘의 주요 차이점은 의미론적 세분화는 개체를 범주별로 그룹화하는 반면, 인스턴스 세분화는 각 개체를 명확한 경계를 가진 고유한 개체로 구분한다는 점입니다. 어떤 작업을 사용할지는 이미지에 무엇이 있는지 파악하는 것으로 충분할지, 아니면 개별 개체를 구분하는 것이 중요한지 등 특정 애플리케이션에 따라 달라집니다.
현재 Vision AI 커뮤니티에서 사용할 수 있는 다양한 인스턴스 세분화 모델이 있습니다. 일부는 더 빠르고, 일부는 더 정확하며, 일부는 사용하기 더 쉽습니다.
이러한 옵션은 유용하지만 특정 작업에 사용하기에 적합한 옵션이 무엇인지에 대한 질문으로 이어질 수 있습니다. 여러 옵션 중에서 속도와 정확성에 중점을 두는 Ultralytics YOLO 모델이 가장 인기가 있습니다.
또한 이러한 모델은 수년에 걸쳐 크게 발전해 왔습니다. 예를 들어 Ultralytics YOLOv5 와 같은 프레임워크를 사용하여 배포를 간소화함으로써 깊은 기술 전문 지식 없이도 더 많은 사람들이 고급 비전 AI에 액세스할 수 있게 되었습니다.
이러한 성공을 기반으로 구축합니다, Ultralytics YOLOv8 은 인스턴스 분할, 포즈 추정, 이미지 분류와 같은 컴퓨터 비전 작업에 대한 향상된 지원을 도입했습니다.
이제 YOLO11 성능을 새로운 차원으로 끌어올렸습니다. YOLOv8m 22% 더 적은 매개 변수로 COCO 데이터 세트에서 더 높은 평균 정밀도(mAP)를 달성하여 더 적은 리소스를 사용하면서도 더 정확하게 물체를 인식할 수 있습니다.
간단히 말해, YOLO11 효율성 저하 없이 최첨단 정확도를 제공하므로 이 분야의 판도를 바꿀 수 있는 제품입니다.
다음으로 인스턴스 세분화가 일반적으로 어떻게 작동하는지 살펴보겠습니다. 구형 컴퓨터 비전 모델은 2단계 접근 방식을 사용합니다.
먼저 객체 주위에 경계 상자를 그려서 객체를 감지합니다. 그런 다음 픽셀 수준의 마스크를 생성하여 각 물체의 정확한 모양을 윤곽을 그립니다. 잘 알려진 예로 마스크 예측 단계를 추가하여 객체 감지 모델을 기반으로 구축하는 마스크 R-CNN이 있습니다. 이 방법은 효과적이지만 이미지를 여러 단계로 처리하기 때문에 속도가 느려 실시간 애플리케이션에 적용하기가 더 어려울 수 있습니다.
반면, YOLO11 같은 모델은 한 번에 이미지를 처리하면서 객체 경계 상자와 인스턴스 분할 마스크를 동시에 예측합니다. 이 간소화된 접근 방식은 높은 정확도를 유지하면서 훨씬 더 빠르게 처리합니다. 따라서 속도와 정밀도가 모두 중요한 자율 주행, 비디오 분석, 로봇 공학 같은 실시간 애플리케이션에 특히 유용합니다.
YOLO11 기본적으로 사전 학습된 모델로 제공됩니다. 예를 들어 세분화를 위해 일상적인 객체를 다루는 COCO-Seg 데이터 세트에 대해 학습되었습니다. 그러나 Ultralytics Python 패키지는 고유한 객체를 세분화해야 하는 특수한 애플리케이션에 필수적인 사용자 지정 학습을 지원합니다.
맞춤형 학습 또는 모델 미세 조정이 중요한 이유는 무엇인가요? 사용자 지정 학습은 사전 학습된 모델에 이미 포함된 지식을 기반으로 전이 학습을 활용합니다. 처음부터 다시 시작하는 것이 아니라 더 적은 데이터 세트와 더 적은 컴퓨팅 리소스를 사용하여 기존 모델을 새로운 작업에 맞게 조정하면서도 높은 정확도를 유지합니다.
예를 들어 세분화를 위해 YOLO11 미세 조정하는 단계에 대해 자세히 살펴보세요:
인스턴스 세분화는 기계가 사물을 더 정확하게 보고 이해하도록 지원하여 현실의 문제를 해결하는 데 사용할 수 있습니다. 자동화 개선부터 환경 보호에 이르기까지 다양한 분야에서 중요한 역할을 합니다. 인스턴스 세분화가 어떤 분야에 영향을 미치고 있는지 몇 가지 예를 살펴보겠습니다.
인스턴스 세분화는 건설 현장의 안전과 효율성을 보장하는 데 중요한 역할을 할 수 있습니다. 예를 들어 중장비를 모니터링하는 데 사용할 수 있습니다.
YOLO11 크레인, 굴삭기, 불도저 등 다양한 유형의 장비를 정확하게 세분화하여 식별하고 실시간으로 위치를 추적할 수 있도록 미세 조정할 수 있습니다. 이를 통해 현장 관리자는 장비가 지정된 구역 내에서만 작동하고 작업자가 있거나 위험이 있는 구역을 침범하지 않도록 할 수 있습니다.
또한 이러한 솔루션을 실시간 알림 시스템과 통합하면 신속한 시정 조치를 취할 수 있습니다. 이 외에도 수집된 인사이트를 통해 사이트 레이아웃과 워크플로우를 최적화하여 위험을 줄이고 생산성을 높일 수 있습니다.
동물 행동 모니터링은 연구자, 농부, 환경 보호 운동가들이 다양한 환경에서 동물을 더 잘 돌볼 수 있도록 도와줍니다. 인스턴스 세분화는 농장, 동물원, 자연 서식지에서 개별 동물을 식별하고 세분화함으로써 이러한 시스템에서 유용한 역할을 합니다. 경계 상자를 사용하는 기존의 객체 감지와 달리, 인스턴스 분할은 각 동물에 대한 픽셀 수준의 묘사를 제공하므로 동물이 가까이 있을 때 특히 유용합니다.
세밀한 세분화를 통해 움직임과 행동을 더욱 정확하게 추적할 수 있습니다. 겹치거나 밀집된 동물을 명확하게 인식하고 상호 작용, 건강 평가, 활동 패턴을 보다 정밀하게 분석할 수 있습니다. 전반적으로 동물 행동에 대한 심층적인 인사이트는 동물 관리 및 관리 방식을 개선합니다.
정확한 선수 및 이벤트 추적은 스포츠 분석에서 매우 중요한 부분입니다. 기존의 추적 방법은 수동 태깅에 의존하기 때문에 세부적인 상호작용을 포착하지 못할 수 있습니다. 컴퓨터 비전을 사용하면 픽셀 수준에서 각 선수, 공, 주요 이벤트와 같은 세부 정보를 세분화하여 상세한 인사이트를 얻을 수 있습니다.
예를 들어, 인스턴스 세분화는 각 선수와 객체를 명확하게 구분하여 파울이나 오프볼 사고와 같은 이벤트를 감지하는 데 도움이 될 수 있습니다. YOLO11 같은 모델을 통한 세분화된 모니터링은 분석가에게 보다 명확한 정보를 제공하여 움직임 패턴, 공간적 위치, 상호 작용을 높은 정확도로 연구할 수 있게 해줍니다. 이러한 인사이트의 주요 이점은 팀이 전략을 개선하고 전반적인 성과를 높이는 데 도움이 된다는 것입니다.
인스턴스 세분화가 다양한 산업에 가져올 수 있는 몇 가지 주요 이점은 다음과 같습니다:
이러한 이점은 인스턴스 세분화가 다양한 사용 사례에 미치는 영향을 강조하지만, 구현과 관련된 문제도 고려해야 합니다.
인스턴스 세분화의 몇 가지 주요 제한 사항은 다음과 같습니다:
인스턴스 분할을 사용하면 겹치는 경우에도 개별 객체를 정밀하게 구분할 수 있습니다. 픽셀 수준에서 객체 경계를 캡처함으로써 객체 감지와 같은 기존 컴퓨터 비전 작업에 비해 시각적 데이터를 더 깊이 이해할 수 있습니다.
최근 컴퓨터 비전의 발전으로 인스턴스 세분화가 더 빠르고 사용하기 쉬워졌습니다. 특히, Ultralytics YOLO11 같은 컴퓨터 비전 모델은 프로세스를 간소화하여 최소한의 설정으로 실시간 세분화가 가능하므로 다양한 산업과 애플리케이션에서 더 쉽게 사용할 수 있습니다.
AI에 대해 궁금하신가요? GitHub 리포지토리를 방문하고 커뮤니티에 참여하여 계속 탐색해 보세요. 솔루션 페이지에서 자율 주행 자동차의 AI와 농업 분야의 비전 AI와 같은 혁신에 대해 알아보세요. 라이선스 옵션을 확인하고 컴퓨터 비전 프로젝트를 시작하세요!