X
YOLO Vision 2024 is here!
YOLO Vision 24
2024년 9월 27일
YOLO Vision 24
Free hybrid event
녹색 확인
링크가 클립보드에 복사됨

컴퓨터 비전 애플리케이션의 작동 방식 살펴보기

컴퓨터 비전의 응용 분야에 대해 자세히 알아보세요. 또한 객체 감지 및 세분화와 같은 다양한 컴퓨터 비전 작업을 살펴봅니다.

컴퓨터 비전 모델의 역사를 살펴보면서 컴퓨터 비전이 어떻게 발전해 왔으며 오늘날의 고급 비전 모델에 이르기까지 어떤 경로를 거쳐 왔는지 살펴봤습니다. 다음과 같은 최신 모델은 Ultralytics YOLOv8 과 같은 최신 모델은 여러 컴퓨터 비전 작업을 지원하며 다양하고 흥미로운 애플리케이션에 사용되고 있습니다. 

이 글에서는 컴퓨터 비전과 비전 모델의 기본에 대해 살펴봅니다. 작동 방식과 다양한 산업 분야에 적용되는 다양한 애플리케이션을 다룰 것입니다. 컴퓨터 비전 혁신은 어디에나 존재하며 소리 없이 세상을 변화시키고 있습니다. 하나씩 알아보세요! 

컴퓨터 비전이란 무엇인가요?

인공 지능(AI)은 인간 지능의 일부를 복제하는 것을 목표로 하는 많은 기술을 포괄하는 용어입니다. 이러한 AI의 하위 분야 중 하나가 컴퓨터 비전입니다. 컴퓨터 비전은 기계에 주변 환경을 보고, 관찰하고, 이해할 수 있는 눈을 부여하는 데 중점을 둡니다. 

컴퓨터 비전 솔루션은 인간의 시각과 마찬가지로 사물을 구별하고, 거리를 계산하고, 움직임을 감지하는 것을 목표로 합니다. 하지만 평생의 경험을 통해 보고 이해하는 인간과 달리 컴퓨터는 방대한 양의 데이터, 고화질 카메라, 복잡한 알고리즘에 의존합니다. 

그림 1. 인간의 시각과 컴퓨터 시각 비교.

컴퓨터 비전 시스템은 이미지와 동영상과 같은 시각적 데이터를 놀라운 속도와 정확도로 처리하고 분석할 수 있습니다. 방대한 양의 시각 정보를 빠르고 정확하게 분석하는 능력 덕분에 컴퓨터 비전은 제조부터 의료에 이르기까지 다양한 산업 분야에서 강력한 도구로 활용되고 있습니다.

다양한 컴퓨터 비전 작업을 지원하는 비전 모델

컴퓨터 비전 모델은 모든 컴퓨터 비전 애플리케이션의 핵심입니다. 비전 모델은 기본적으로 기계가 시각 정보를 해석하고 이해할 수 있도록 설계된 딥러닝 기술로 구동되는 계산 알고리즘입니다. 비전 모델은 이미지 분류에서 물체 감지에 이르는 중요한 컴퓨터 비전 작업을 가능하게 합니다. 이러한 작업 중 일부와 그 사용 사례에 대해 자세히 살펴보겠습니다. 

이미지 분류

이미지 분류에는 이미지를 미리 정의된 클래스 또는 카테고리로 분류하고 레이블을 지정하는 작업이 포함됩니다. 다음과 같은 비전 모델은 YOLOv8 과 같은 비전 모델은 라벨이 지정된 이미지의 대규모 데이터 세트에 대해 학습할 수 있습니다. 훈련 과정에서 모델은 각 클래스와 관련된 패턴과 특징을 인식하는 방법을 학습합니다. 학습이 완료되면 새로운 이미지의 특징을 분석하고 학습된 패턴과 비교하여 보이지 않는 새로운 이미지의 카테고리를 예측할 수 있습니다. 

그림 2. 이미지 분류의 예.

이미지 분류에는 다양한 유형이 있습니다. 예를 들어 의료 이미지를 다룰 때는 이진 분류를 사용하여 사진을 건강 또는 질병과 같은 두 그룹으로 나눌 수 있습니다. 또 다른 유형은 다중 클래스 분류입니다. 돼지, 염소, 소 등 농장의 여러 동물을 분류하는 것처럼 이미지를 여러 그룹으로 분류하는 데 도움이 될 수 있습니다. 또는 동물을 포유류와 조류로 분류한 다음 사자, 호랑이, 독수리, 참새와 같은 종으로 분류하는 것처럼 동물을 그룹과 하위 그룹으로 분류하고 싶다면 계층적 분류가 가장 좋은 옵션이 될 수 있습니다.

물체 감지

객체 감지는 컴퓨터 비전을 사용하여 이미지와 비디오 프레임에서 객체를 식별하고 위치를 파악하는 프로세스입니다. 객체 주위에 경계 상자를 그리는 객체 로컬라이제이션과 각 객체의 카테고리를 식별하는 객체 분류의 두 가지 작업으로 구성됩니다. 경계 상자 주석을 기반으로 비전 모델은 각 객체 범주에 특정한 패턴과 특징을 인식하고 보이지 않는 새로운 이미지에서 이러한 객체의 존재와 위치를 예측하는 방법을 학습할 수 있습니다. 

그림 3. YOLOv8 축구장에서 선수를 감지하는 데 사용되는 객체 감지 기능.

객체 감지는 스포츠부터 해양 생물학에 이르기까지 다양한 산업 분야에 걸쳐 많은 사용 사례를 가지고 있습니다. 예를 들어, 소매업에서는 아마존의 저스트 워크 아웃(Just Walk Out) 기술이 물체 감지를 사용하여 고객이 집어 든 상품을 식별하여 결제를 자동화합니다. 컴퓨터 비전과 센서 데이터의 조합을 통해 고객은 줄을 서서 기다릴 필요 없이 물건을 집어 들고 나갈 수 있습니다. 

작동 원리를 자세히 살펴보세요:

  • 천장에 설치된 카메라가 매장을 돌아다니는 고객의 모습을 촬영하고, 이 영상은 비전 모델을 통해 실시간으로 처리됩니다.
  • 객체 감지는 고객이 장바구니에 담는 정확한 제품을 감지하여 그에 따라 가상 카트를 업데이트하는 데 사용됩니다.
  • 선반의 무게 센서는 품목의 제거 또는 교체를 감지하여 정확도를 높입니다.
  • 고객이 매장을 나갈 때 물체 감지 및 안면 인식 기술을 사용하여 고객이 떠났는지 확인하고 신용카드와 같은 결제 정보를 사용하여 자동으로 요금을 청구할 수 있습니다.

시맨틱 및 인스턴스 세분화

의미적 분할과 인스턴스 분할 은 이미지를 의미 있는 세그먼트로 분할하는 컴퓨터 비전 작업입니다. 의미적 분할은 의미적 의미에 따라 픽셀을 분류하고 카테고리 내의 모든 개체를 동일한 레이블을 가진 단일 개체로 취급합니다. "하늘" 또는 "바다"와 같이 셀 수 없는 물체나 "나뭇잎" 또는 "풀"과 같은 클러스터에 레이블을 지정하는 데 적합합니다.

반면에 인스턴스 세분화는 감지된 각 개체에 고유한 레이블을 할당하여 동일한 클래스의 여러 인스턴스를 구분할 수 있습니다. 인스턴스 세분화를 사용하면 개체의 수와 독립성이 중요한 카운트 가능한 개체를 세분화할 수 있습니다. 이를 통해 보다 정확하게 식별하고 구분할 수 있습니다.

그림 4. 시맨틱 및 인스턴스 세분화의 예시.

자율주행차와 관련된 예를 통해 시맨틱 분할과 인스턴스 분할의 차이를 더 명확하게 이해할 수 있습니다. 시맨틱 세분화는 장면의 내용을 이해해야 하는 작업에 적합하며, 자율주행 차량에서 횡단보도나 교통 표지판과 같은 도로의 특징을 분류하는 데 사용할 수 있습니다. 한편 인스턴스 세분화는 자율주행 차량에서 개별 보행자, 차량, 장애물을 식별하는 데 사용할 수 있습니다. 

포즈 추정

포즈 추정이란 이미지나 동영상에서 피사체의 포즈의 주요 포인트를 감지하고 추적하는 컴퓨터 비전 작업입니다. 사람의 포즈를 추정하는 데 가장 일반적으로 사용되며 어깨와 무릎과 같은 주요 포인트가 포함됩니다. 사람의 포즈를 추정하면 다양한 애플리케이션에서 중요한 동작과 움직임을 이해하고 인식하는 데 도움이 됩니다.

그림 5. YOLOv8 을 사용한 포즈 추정 예시.

포즈 추정은 스포츠에서 선수의 움직임을 분석하는 데 사용할 수 있습니다. NBA는 경기 중 선수의 움직임과 위치를 연구하기 위해 포즈 추정을 사용합니다. 포즈 추정은 어깨, 팔꿈치, 무릎, 발목과 같은 주요 포인트를 추적하여 선수의 움직임에 대한 상세한 인사이트를 제공합니다. 이러한 인사이트는 코치가 더 나은 전략을 개발하고, 훈련 프로그램을 최적화하고, 경기 중에 실시간으로 조정하는 데 도움이 됩니다. 또한 이 데이터는 선수의 피로도와 부상 위험을 모니터링하여 전반적인 선수의 건강과 경기력을 개선하는 데 도움이 될 수 있습니다.

오리엔티드 바운딩 박스 오브젝트 감지

오리엔티드 바운딩 박스 객체 감지 (OBB)는 회전된 직사각형을 사용하여 이미지에서 객체를 정확하게 식별하고 위치를 파악합니다. 이미지 축에 맞춰 정렬되는 표준 바운딩 박스와 달리 OBB는 물체의 방향에 맞춰 회전합니다. 따라서 수평이나 수직이 완벽하지 않은 물체에 특히 유용합니다. 회전된 개체를 정확하게 찾아내고 분리하여 혼잡한 환경에서 겹치는 것을 방지하는 데 탁월합니다.

그림 6. YOLOV8 을 사용하여 보트의 항공 이미지에서 방향성 바운딩 박스 감지 예시.

해상 감시에서 선박을 식별하고 추적하는 것은 보안 및 자원 관리의 핵심입니다. OBB 감지는 선박이 빽빽하게 밀집되어 있거나 다양한 각도로 향하는 경우에도 선박의 정확한 위치를 파악하는 데 사용할 수 있습니다. 선박 항로를 모니터링하고 해상 교통을 관리하며 항만 운영을 최적화하는 데 도움이 됩니다. 또한 허리케인이나 기름 유출과 같은 사건이 발생한 후 선박과 인프라의 피해를 신속하게 파악하고 평가하여 재난 대응에 도움을 줄 수 있습니다.

개체 추적

지금까지 이미지를 처리하는 컴퓨터 비전 작업에 대해 설명했습니다. 객체 추적은 비디오 프레임 전체에서 객체를 추적할 수 있는 컴퓨터 비전 작업입니다. 감지 알고리즘을 사용하여 첫 번째 프레임에서 객체를 식별하는 것으로 시작하여 비디오에서 이동하는 객체의 위치를 지속적으로 따라갑니다. 객체 추적에는 객체 감지, 특징 추출, 모션 예측과 같은 기술이 포함되어 정확한 추적을 유지합니다.

그림 7. YOLOv8 사용하여 물고기 추적하기.

YOLOv8 같은 비전 모델은 해양 생물학에서 물고기를 추적하는 데 사용할 수 있습니다. 연구자들은 수중 카메라를 사용하여 자연 서식지에서 물고기의 움직임과 행동을 모니터링할 수 있습니다. 이 과정은 첫 번째 프레임에서 개별 물고기를 감지하는 것으로 시작하여 비디오 전체에서 물고기의 위치를 따라갑니다. 물고기를 추적하면 과학자들은 물고기의 이동 패턴, 사회적 행동, 환경과의 상호작용을 이해하는 데 도움이 됩니다. 또한 물고기의 분포와 풍부함에 대한 인사이트를 제공함으로써 지속 가능한 어업 관행을 지원합니다.

컴퓨터 비전에 대한 마지막 살펴보기

컴퓨터 비전은 우리가 기술을 사용하고 세상과 상호작용하는 방식을 적극적으로 변화시키고 있습니다. 컴퓨터 비전은 딥러닝 모델과 복잡한 알고리즘을 사용하여 이미지와 동영상을 이해함으로써 업계에서 많은 프로세스를 간소화하는 데 도움을 줍니다. 물체 감지 및 물체 추적과 같은 컴퓨터 비전 작업을 통해 이전에는 상상할 수 없었던 솔루션을 만들 수 있게 되었습니다. 컴퓨터 비전 기술이 계속 발전함에 따라 미래에는 더 많은 혁신적인 애플리케이션이 등장할 것입니다! 

함께 배우고 성장합시다! GitHub 리포지토리를 살펴보고 AI에 대한 Facebook의 기여를 확인해 보세요. 자율 주행 자동차, 농업과 같은 산업을 AI로 어떻게 재정의하고 있는지 알아보세요. 🚀

Facebook 로고트위터 로고LinkedIn 로고복사 링크 기호

이 카테고리에서 자세히 보기

인공지능의 미래
를 함께 만들어 갑시다!

머신 러닝의 미래와 함께하는 여정 시작하기