컴퓨터 비전(CV)은 컴퓨터와 시스템이 디지털 이미지, 동영상 및 기타 시각적 입력에서 의미 있는 정보를 도출할 수 있도록 하는 인공지능(AI) 내의 전문 분야입니다. 기본적으로 컴퓨터 비전은 인간의 시각적 이해를 재현하여 기계가 시각 데이터를 기반으로 '보고', 해석하고, 의사 결정을 내릴 수 있도록 하는 것을 목표로 합니다. 여기에는 복잡한 알고리즘과 딥러닝(DL) 모델을 사용하여 시각 정보를 처리하여 사물을 인식하고, 장면을 이해하고, 높은 수준의 인사이트를 추출하는 것이 포함됩니다. 주로 밝기 조정이나 필터 적용과 같이 이미지 데이터를 향상시키거나 조작하는 데 중점을 두는 단순한 이미지 처리와 달리 컴퓨터 비전은 시각 자료의 내용과 맥락을 이해하려고 합니다.
AI 및 머신 러닝의 중요성
컴퓨터 비전은 많은 최신 AI 및 머신러닝(ML) 시스템의 기본으로, 기계가 시각적 인식을 통해 물리적 세계와 상호 작용하고 이해하는 데 필요한 기능을 제공합니다. 인간의 시각 피질에서 영감을 얻은 컨볼루션 신경망(CNN)과 같은 기술의 출현은 CV에 혁명을 일으켰습니다. 이러한 네트워크를 통해 모델은 방대한 양의 시각 데이터에서 계층적 특징을 자동으로 학습할 수 있어 다양한 컴퓨터 비전 작업의 정확도를 크게 향상시킬 수 있습니다. 이러한 발전은 이전에는 불가능했던 정교한 애플리케이션을 가능하게 하여 CV를 현재 AI 개발의 초석이자 미래를 변화시키는 AI 사용 사례의 핵심 동력으로 만들었습니다.
주요 개념 및 작업
컴퓨터 비전은 시각 데이터에서 다양한 유형의 정보를 추출하기 위한 광범위한 작업을 포함합니다. 몇 가지 핵심 작업은 다음과 같습니다:
- 이미지 분류: 전체 이미지에 단일 레이블 또는 카테고리를 할당하는 작업(예: 이미지에 '고양이' 또는 '개'가 포함된 것으로 식별)입니다. 이미지넷과 같은 데이터 세트가 이 작업에 일반적으로 사용됩니다.
- 객체 감지: 이미지 내에서 여러 객체의 존재 여부와 위치를 식별하는 것으로, 일반적으로 객체 주위에 경계 상자를 그리고 클래스 레이블을 할당합니다(예: 거리 장면에서 모든 '자동차'와 '보행자' 위치 찾기). 다음과 같은 모델 Ultralytics YOLO 와 같은 모델은 효율적인 객체 감지에 널리 사용됩니다.
- 이미지 세분화: 이미지의 각 픽셀을 특정 물체 또는 영역에 속하도록 분류합니다. 이는 객체 감지보다 더 자세한 이해를 제공합니다. 유형에는 의미적 세분화 (카테고리별로 픽셀에 레이블 지정)와 인스턴스 세분화 (동일한 카테고리 내에서 개별 객체 인스턴스 구분)가 있습니다. 인스턴스 세분화 및 추적에 대한 가이드를 참조하세요.
- 포즈 추정: 물체의 키포인트의 위치와 방향을 감지하는 것으로, 사람의 자세 추정(관절 식별)이나 딱딱한 물체 추적에 자주 사용됩니다. 반려견 자세 추정을 위한 맞춤형 훈련에 대해 알아보세요.
- 객체 추적: 비디오 시퀀스의 여러 프레임에서 특정 객체를 식별하고 추적하는 기능입니다. 객체 감지와 시간적 분석이 결합된 기능입니다. Ultralytics YOLOv8 객체 감지 및 추적에 대해 알아보세요.
- 광학 흐름: 동영상에서 연속된 프레임 사이의 물체 또는 카메라의 움직임을 추정합니다.
컴퓨터 비전과 관련 분야
컴퓨터 비전과 관련 분야를 구분하는 것이 도움이 됩니다:
- 이미지 처리: CV의 전처리 단계로 낮은 수준에서 이미지를 조작하는 데 중점을 둡니다. 노이즈 감소, 대비 향상, OpenCV와 같은 라이브러리를 사용한 필터링 등의 작업을 수행합니다. 이미지 처리는 픽셀을 수정하지만 반드시 이미지 콘텐츠를 해석하지는 않습니다. 컴퓨터 비전과 이미지 처리의 주요 차이점에 대해 자세히 알아보세요.
- 머신 비전(MV): CV와 겹치는 부분이 있지만, MV는 일반적으로 산업 환경에서 자동화된 검사, 공정 제어 및 로봇 안내를 위해 비전 기술을 적용하는 것을 말합니다. MV 시스템은 특정 조명 및 카메라 설정으로 통제된 환경에서 작동하는 경우가 많으며, 제조 품질 검사와 같은 특정 작업의 안정성과 속도에 중점을 둡니다. 머신 비전에 대해 자세히 알아보기.
기술 및 프레임워크
컴퓨터 비전 애플리케이션을 개발하려면 다양한 도구, 라이브러리, 프레임워크가 필요합니다:
실제 애플리케이션
컴퓨터 비전 애플리케이션은 다양한 분야에서 점점 더 널리 사용되고 있습니다:
- 자율주행 차량: CV는 자율 주행 차량이 주변 환경을 인식하고, 보행자와 다른 차량을 감지하고, 교통 표지판을 읽고, 안전하게 주행할 수 있게 해주는 핵심 요소입니다. Waymo와 Tesla 같은 회사는 CV 시스템에 크게 의존하고 있습니다. 자동차 솔루션의 AI에 대해 알아보세요.
- 헬스케어: 의료 이미지 분석에서 CV는 방사선 전문의가 X-레이, CT 스캔, MRI에서 종양이나 골절과 같은 이상 징후를 발견하는 데 도움을 줍니다. 또한 로봇 수술과 환자 모니터링에도 사용됩니다. 방사선과 연구를 살펴보세요 : 인공 지능. 종양 탐지에YOLO11 어떻게 사용되는지 알아보세요.
- 보안 및 감시: CV는 자동화된 모니터링 시스템, 침입 감지, 개인 추적, 군중 행동 분석을 지원합니다. 보안 경보 시스템을 구축하는 방법을 알아보세요.
- 소매업: 애플리케이션에는 진열대 모니터링을 통한 재고 관리, 고객 행동 분석, Amazon Go와 같은 계산대 없는 계산대 시스템 등이 있습니다.
- 제조: 품질 관리, 결함 감지, 조립 라인 모니터링, 로봇 자동화에 사용됩니다. YOLO11 스마트 제조 솔루션을 만드는 방법에 대해 알아보세요.
- 농업: 작물 모니터링, 질병 감지, 잡초 식별, 자동 수확을 통해 정밀 농업을 실현합니다. 실시간 작물 상태 모니터링에 대해 알아보세요.
- 엔터테인먼트: 영화 제작에서 특수 효과, 모션 캡처, 게임에서 몰입감 있는 경험을 만드는 데 사용됩니다. 비디오 게임에서 AI를 살펴보세요.