용어집

물체 감지

YOLO 과 같은 최첨단 모델을 통해 이미지나 동영상에서 물체를 식별하고 위치를 파악하는 물체 감지의 강력한 기능을 알아보세요. 실제 적용 사례를 살펴보세요!

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

객체 감지는 이미지 또는 동영상 내에서 하나 이상의 객체의 존재 여부, 위치, 유형을 식별하는 컴퓨터 비전(CV) 의 기본 작업입니다. 전체 이미지에 단일 레이블(예: '고양이')을 할당하는 이미지 분류와 달리 객체 감지는 경계 상자를 사용하여 각 객체 인스턴스의 윤곽을 정확하게 그리고 클래스 레이블(예: 좌표 x, y, 폭, 높이에서 '고양이')을 할당합니다. 이 기능을 통해 기계는 시각적 장면을 더욱 세밀하게 이해하여 인간의 시각적 인식을 더욱 가깝게 모방하고 환경과 더욱 복잡한 상호 작용을 할 수 있습니다. 이는 많은 최신 인공 지능(AI) 애플리케이션의 핵심 기술입니다.

객체 감지 작동 방식

객체 감지는 일반적으로 객체 분류('어떤' 객체가 있는지 파악)와 객체 위치 파악(일반적으로 경계 상자 좌표를 통해 객체가 '어디에' 있는지 파악)이라는 두 가지 핵심 작업을 결합합니다. 최신 객체 감지 시스템은 딥 러닝(DL), 특히 컨볼루션 신경망(CNN)에 크게 의존합니다. 이러한 네트워크는 다양한 객체 클래스와 관련된 시각적 특징과 패턴을 학습하기 위해 널리 사용되는 COCO 데이터 세트 또는 Open Images V7과 같은 주석이 달린 대규모 데이터 세트에서 학습됩니다.

학습된 모델은 작동( 추론이라고 함) 중에 입력 이미지 또는 비디오 프레임을 처리합니다. 이 모델은 각각 경계 상자, 예측된 클래스 레이블(예: '자동차', '사람', '개'), 모델의 탐지 확률을 나타내는 신뢰도 점수로 표시되는 잠재적 객체 목록을 출력합니다. 같은 객체에 대해 중복되거나 겹치는 상자를 제거하여 이러한 결과를 개선하기 위해 비최대 억제(NMS) 와 같은 기술을 사용하는 경우가 많습니다. 이러한 모델의 성능은 일반적으로 IoU(Intersection over Union)평균 정밀도(mAP) 같은 메트릭을 사용하여 평가합니다.

물체 감지 대 관련 작업

객체 감지를 다른 관련 컴퓨터 비전 작업과 구분하는 것이 중요합니다:

  • 이미지 분류: 전체 이미지에 하나의 레이블을 할당합니다(예: "이 이미지에는 개가 포함되어 있습니다"). 개체를 찾지는 않습니다.
  • 이미지 세분화: 이미지의 각 픽셀을 분류하여 객체 경계에 대한 상세한 맵을 만듭니다. 이는 객체 감지의 경계 상자보다 더 세분화되어 있습니다.
    • 시맨틱 세분화: 각 픽셀에 클래스 레이블을 할당합니다(예: '자동차'에 속하는 모든 픽셀은 '자동차'로 레이블 지정). 같은 클래스의 다른 인스턴스는 구분하지 않습니다.
    • 인스턴스 세분화: 각 픽셀에 클래스 레이블을 할당하고 동일한 클래스의 개별 인스턴스(예: '자동차 1', '자동차 2')를 구분합니다. 감지와 세분화를 결합합니다.
  • 객체 추적: 연속된 비디오 프레임에서 객체를 감지하고 각 객체에 고유 ID를 할당하여 시간 경과에 따른 움직임을 추적하는 기능입니다. 이는 객체 감지를 기반으로 합니다.

객체 감지 모델의 유형

객체 감지 모델은 일반적으로 두 가지 주요 범주로 나뉘며, 접근 방식과 속도/정확도 트레이드오프가 가장 큰 차이점입니다:

  • 2단계 물체 감지기: 이 모델은 먼저 객체가 위치할 수 있는 관심 영역(RoI)을 제안한 다음 해당 영역 내의 객체를 분류합니다. 예를 들어 R-CNN 제품군 (Fast R-CNN, Faster R-CNN)이 있습니다. 정확도는 높지만 속도가 느린 경향이 있습니다.
  • 1단계 물체 감지기: 이 모델은 별도의 영역 제안 단계 없이 한 번의 패스로 입력 이미지에서 경계 상자와 클래스 확률을 직접 예측합니다. 예를 들면 다음과 같습니다. Ultralytics YOLO (You Only Look Once) 시리즈, SSD(Single Shot MultiBox Detector), RetinaNet 등이 있습니다. 일반적으로 속도가 빨라 실시간 추론에 적합하지만 2단계 방식에 비해 정확도가 약간 떨어지는 단점이 있습니다. YOLO11 와 같은 모델이 이 격차를 효과적으로 해소합니다. 앵커 프리 감지기 같은 최신 접근 방식은 1단계 프로세스를 더욱 간소화합니다. 다양한 YOLO 모델과 다음과 같은 다른 아키텍처 간의 비교를 살펴볼 수 있습니다. RT-DETR.

실제 애플리케이션

객체 감지는 다양한 산업 분야에서 수많은 애플리케이션을 가능하게 하는 초석 기술입니다:

  1. 자율 시스템: 자율 주행 자동차로봇 공학에 필수적이며, 차량과 로봇이 보행자, 다른 차량, 장애물, 교통 표지판 및 상호작용을 위한 특정 물체를 감지하여 주변 환경을 인식할 수 있도록 합니다. 테슬라나 웨이모와 같은 회사는 강력한 물체 감지에 크게 의존하고 있습니다.
  2. 보안 및 감시: 보안 경보 시스템에서 침입자 감지, 군중 모니터링(군중 관리의 비전 AI), 버려진 물건 식별, 공공장소 및 사유지의 모니터링 효율성 향상에 사용됩니다.
  3. 리테일 분석: 자동 결제 시스템, AI 기반 재고 관리, 진열대 모니터링(품절 품목 감지), 고객 유동 패턴 분석과 같은 애플리케이션을 지원합니다.
  4. 헬스케어: 의료 이미지 분석에 적용되어 종양(종양 감지를 위한 YOLO11 사용) 또는 X-레이, CT 스캔 및 MRI에서 병변과 같은 이상 징후를 감지하여 방사선 전문의의 진단을 지원합니다(방사선학: 인공지능).
  5. 농업: 해충, 질병, 잡초 감지, 과일 수 세기(농업 분야의 컴퓨터 비전), 작물 건강 모니터링(농업 솔루션의 AI) 등 정밀 농업 기술을 지원합니다.
  6. 제조: 조립 라인에서 제품의 결함을 감지하여 품질 관리(제조 품질 검사), 위험 구역 모니터링을 통한 안전 확보, 로봇 작업 자동화 등에 사용됩니다.

도구 및 교육

객체 감지 모델을 개발하고 배포하려면 다양한 도구와 기술이 필요합니다. 다음과 같이 널리 사용되는 딥 러닝 프레임워크는 PyTorchTensorFlow 와 같은 인기 있는 딥 러닝 프레임워크는 기본 라이브러리를 제공합니다. OpenCV와 같은 컴퓨터 비전 라이브러리는 필수 이미지 처리 기능을 제공합니다.

Ultralytics 최첨단 Ultralytics YOLO 모델을 포함한 YOLOv8YOLO11속도와 정확성에 최적화되어 있습니다. Ultralytics HUB 플랫폼은 데이터 세트 관리, 사용자 지정 모델 훈련, 하이퍼파라미터 튜닝 수행, 모델 배포를 용이하게 하는 도구를 제공하여 워크플로우를 더욱 간소화합니다. 효과적인 모델 훈련은 종종 ImageNet과 같은 데이터 세트에서 미리 학습된 가중치를 사용하는 전이 학습과 같은 데이터 증강 전략과 기법의 이점을 활용합니다.

모두 보기