용어집

컴퓨터 비전(CV)

컴퓨터 비전으로 AI의 잠재력을 실현하세요! 물체 감지, 의료, 자율 주행 자동차 등 다양한 분야에서 AI의 역할을 살펴보세요. 지금 자세히 알아보세요!

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

컴퓨터 비전(CV)은 컴퓨터와 시스템이 디지털 이미지, 동영상 및 기타 시각적 입력에서 의미 있는 정보를 도출할 수 있도록 하는 인공지능(AI) 내의 전문 분야입니다. 기본적으로 컴퓨터 비전은 인간의 시각적 이해를 재현하여 기계가 시각 데이터를 기반으로 '보고', 해석하고, 의사 결정을 내릴 수 있도록 하는 것을 목표로 합니다. 여기에는 복잡한 알고리즘과 딥러닝(DL) 모델을 사용하여 시각 정보를 처리하여 사물을 인식하고, 장면을 이해하고, 높은 수준의 인사이트를 추출하는 것이 포함됩니다. 주로 밝기 조정이나 필터 적용과 같이 이미지 데이터를 향상시키거나 조작하는 데 중점을 두는 단순한 이미지 처리와 달리 컴퓨터 비전은 시각 자료의 내용과 맥락을 이해하려고 합니다.

AI 및 머신 러닝의 중요성

컴퓨터 비전은 많은 최신 AI 및 머신러닝(ML) 시스템의 기본으로, 기계가 시각적 인식을 통해 물리적 세계와 상호 작용하고 이해하는 데 필요한 기능을 제공합니다. 인간의 시각 피질에서 영감을 얻은 컨볼루션 신경망(CNN)과 같은 기술의 출현은 CV에 혁명을 일으켰습니다. 이러한 네트워크를 통해 모델은 방대한 양의 시각 데이터에서 계층적 특징을 자동으로 학습할 수 있어 다양한 컴퓨터 비전 작업의 정확도를 크게 향상시킬 수 있습니다. 이러한 발전은 이전에는 불가능했던 정교한 애플리케이션을 가능하게 하여 CV를 현재 AI 개발의 초석이자 미래를 변화시키는 AI 사용 사례의 핵심 동력으로 만들었습니다.

주요 개념 및 작업

컴퓨터 비전은 시각 데이터에서 다양한 유형의 정보를 추출하기 위한 광범위한 작업을 포함합니다. 몇 가지 핵심 작업은 다음과 같습니다:

  • 이미지 분류: 전체 이미지에 단일 레이블 또는 카테고리를 할당하는 작업(예: 이미지에 '고양이' 또는 '개'가 포함된 것으로 식별)입니다. 이미지넷과 같은 데이터 세트가 이 작업에 일반적으로 사용됩니다.
  • 객체 감지: 이미지 내에서 여러 객체의 존재 여부와 위치를 식별하는 것으로, 일반적으로 객체 주위에 경계 상자를 그리고 클래스 레이블을 할당합니다(예: 거리 장면에서 모든 '자동차'와 '보행자' 위치 찾기). 다음과 같은 모델 Ultralytics YOLO 와 같은 모델은 효율적인 객체 감지에 널리 사용됩니다.
  • 이미지 세분화: 이미지의 각 픽셀을 특정 물체 또는 영역에 속하도록 분류합니다. 이는 객체 감지보다 더 자세한 이해를 제공합니다. 유형에는 의미적 세분화 (카테고리별로 픽셀에 레이블 지정)와 인스턴스 세분화 (동일한 카테고리 내에서 개별 객체 인스턴스 구분)가 있습니다. 인스턴스 세분화 및 추적에 대한 가이드를 참조하세요.
  • 포즈 추정: 물체의 키포인트의 위치와 방향을 감지하는 것으로, 사람의 자세 추정(관절 식별)이나 딱딱한 물체 추적에 자주 사용됩니다. 반려견 자세 추정을 위한 맞춤형 훈련에 대해 알아보세요.
  • 객체 추적: 비디오 시퀀스의 여러 프레임에서 특정 객체를 식별하고 추적하는 기능입니다. 객체 감지와 시간적 분석이 결합된 기능입니다. Ultralytics YOLOv8 객체 감지 및 추적에 대해 알아보세요.
  • 광학 흐름: 동영상에서 연속된 프레임 사이의 물체 또는 카메라의 움직임을 추정합니다.

컴퓨터 비전과 관련 분야

컴퓨터 비전과 관련 분야를 구분하는 것이 도움이 됩니다:

  • 이미지 처리: CV의 전처리 단계로 낮은 수준에서 이미지를 조작하는 데 중점을 둡니다. 노이즈 감소, 대비 향상, OpenCV와 같은 라이브러리를 사용한 필터링 등의 작업을 수행합니다. 이미지 처리는 픽셀을 수정하지만 반드시 이미지 콘텐츠를 해석하지는 않습니다. 컴퓨터 비전과 이미지 처리의 주요 차이점에 대해 자세히 알아보세요.
  • 머신 비전(MV): CV와 겹치는 부분이 있지만, MV는 일반적으로 산업 환경에서 자동화된 검사, 공정 제어 및 로봇 안내를 위해 비전 기술을 적용하는 것을 말합니다. MV 시스템은 특정 조명 및 카메라 설정으로 통제된 환경에서 작동하는 경우가 많으며, 제조 품질 검사와 같은 특정 작업의 안정성과 속도에 중점을 둡니다. 머신 비전에 대해 자세히 알아보기.

기술 및 프레임워크

컴퓨터 비전 애플리케이션을 개발하려면 다양한 도구, 라이브러리, 프레임워크가 필요합니다:

  • 라이브러리: OpenCV(오픈 소스 컴퓨터 비전 라이브러리 )는 이미지 처리 및 클래식 CV 작업을 위한 방대한 알고리즘 모음을 제공하는 기본 라이브러리입니다. 다른 라이브러리로는 Python 이미지 조작을 위한 Pillow와 이미지 처리 알고리즘을 위한 Scikit-image가 있습니다.
  • 딥 러닝 프레임워크: PyTorchTensorFlow 은 CV에 사용되는 모델을 포함하여 딥 러닝 모델을 구축하고 학습하는 데 사용되는 주요 프레임워크입니다.
  • 모델: YOLO (You Only Look Once) 와 같은 최신 모델은 효율적인 실시간 물체 감지를 제공합니다. ResNet과 같은 아키텍처는 일반적인 백본이며, 비전 트랜스포머(ViT) 는 최근 각광받고 있는 새로운 종류의 모델입니다. 다양한 YOLO 모델 성능을 비교해 보세요.
  • 플랫폼: Ultralytics HUB와 같은 도구는 클라우드 교육 및 데이터 세트 관리와 같은 기능을 제공하여 CV 모델을 교육, 배포 및 관리하는 프로세스를 간소화합니다. 다음과 같은 기타 플랫폼 RoboflowWeights & Biases 와 같은 다른 플랫폼은 데이터 주석 및 실험 추적을 위한 보완적인 도구를 제공합니다.

실제 애플리케이션

컴퓨터 비전 애플리케이션은 다양한 분야에서 점점 더 널리 사용되고 있습니다:

모두 보기