용어집

이미지 인식

이미지 인식이 어떻게 AI의 시각적 분류 및 이해 능력을 강화하여 의료, 소매, 보안 등의 분야에서 혁신을 주도하는지 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

이미지 인식은 기계가 이미지나 동영상에서 시각 정보를 식별하고 해석할 수 있도록 하는 인공지능(AI)컴퓨터 비전(CV) 의 중요한 분야입니다. 단순히 픽셀을 보는 것을 넘어 시각 데이터에 묘사된 사물, 사람, 장면, 행동 등의 콘텐츠를 이해하는 것이 포함됩니다. 이 기술은 수많은 애플리케이션의 기반이 되며, 시스템이 인간과 유사한 방식으로 세상을 '보고' 이해할 수 있게 해줍니다.

이미지 인식 작동 방식

이미지 인식의 핵심은 머신러닝(ML), 특히 딥러닝(DL) 알고리즘에 크게 의존합니다. 컨볼루션 신경망(CNN) 은 이미지에서 특징의 공간적 계층 구조를 자동으로 적응적으로 학습하도록 설계된 기본 구성 요소입니다. 이 과정에는 일반적으로 각 이미지에 콘텐츠에 대한 정보로 태그가 지정된 유명한 이미지넷 데이터 세트와 같이 라벨이 지정된 이미지의 방대한 데이터 세트에 대한 모델 학습이 포함되며, 종종 워드넷 계층 구조와 같은 구조를 사용하여 구성됩니다. 학습 과정에서 모델은 특정 시각적 패턴과 특징(예: 가장자리, 질감, 모양)을 다양한 레이블 또는 카테고리와 연관시키는 방법을 학습합니다. ResNet과 같은 아키텍처는 이러한 작업에서 상당히 향상된 성능을 제공합니다. 학습이 완료되면 모델은 보이지 않는 새로운 이미지를 분석하고 그 안에 존재하는 개체나 개념을 예측할 수 있습니다. 이러한 개념에 대한 이해는 딥러닝 전문 분야와 같은 리소스를 통해 심화할 수 있습니다. 이미지넷은 분류의 핵심이지만, COCO와 같은 데이터 세트는 보다 광범위한 시각적 이해 작업에도 필수적입니다. 효과적인 모델 학습을 위해서는 신중한 계획과 실행이 필요합니다.

관련 용어와의 차이점

이미지 인식은 다른 컴퓨터 비전 작업과 관련이 있지만 종종 몇 가지 특정 기능을 포괄하는 더 넓은 의미로 사용됩니다. 좁은 의미의 작업과 구별하는 것이 중요합니다:

  • 이미지 분류: 이 작업은 전체 이미지에 하나의 레이블을 할당합니다(예: '고양이', '자동차', '풍경'). 주요 피사체를 식별하지만 위치를 찾지는 못합니다. Ultralytics 모델은 이미지 분류 작업을 수행할 수 있습니다.
  • 객체 감지: 이미지 내에서 여러 개체를 식별하고 각 개체의 위치를 찾는 것으로, 일반적으로 주변에 경계 상자를 그리고 클래스 레이블(예: "좌표 (x1, y1, x2, y2)에 있는 사람")을 할당하는 방식으로 진행됩니다. Ultralytics 모델로 탐지를 살펴보세요.
  • 이미지 세분화: 여기에는 각 픽셀 를 이미지에 표시합니다.
    • 시맨틱 세분화: 모든 픽셀에 클래스 레이블을 할당합니다(예: 자동차에 속하는 모든 픽셀은 '자동차'로 레이블 지정).
    • 인스턴스 세분화: 동일한 개체 클래스의 개별 인스턴스를 구분합니다(예: '자동차 1', '자동차 2'로 레이블 지정). Ultralytics 다양한 세분화 작업을 지원합니다.

이미지 인식은 때때로 이미지 분류를 구체적으로 의미하기도 하지만, 애플리케이션의 필요에 따라 감지 또는 분할을 포함하는 이미지 콘텐츠를 이해하는 더 광범위한 기능을 의미하기도 합니다.

실제 애플리케이션

이미지 인식은 다양한 산업 분야의 광범위한 애플리케이션을 지원합니다:

  • 의료: 의료 이미지 분석에 사용되어 X-레이, CT 스캔 또는 MRI에서 이상 징후를 식별하여 의사의 상태 진단을 돕습니다. 예를 들어, 의료 영상에서 종양 탐지를 위해 모델을 학습시켜 잠재적으로 조기 진단으로 이어질 수 있습니다. 의료 솔루션의 AI와 방사선학과 같은 저널을 살펴보세요 : 인공 지능과 같은 저널에서 더 많은 인사이트를 확인하세요.
  • 리테일: 자동 결제 시스템, AI 기반 재고 관리를 위한 진열대 모니터링, 고객 행동 분석과 같은 애플리케이션을 지원합니다. AI가 소매업의 효율성을 높이는 방법을 알아보고 전미소매업협회 (NRF)와 같은 기관의 AI에 대한 인사이트를 읽어보세요.
  • 보안 및 감시: 출입 통제 및 개인 식별을 위한 안면 인식 시스템과 도난 방지를 위한 컴퓨터 비전의 의심스러운 활동 감지 기능을 강화합니다. 이 기술의 사용은 AI 윤리와 관련하여 중요한 고려 사항을 제기합니다.
  • 자동차: 자율주행 차량과 첨단 운전자 지원 시스템(ADAS)이 보행자, 다른 차량, 교통 표지판, 차선 표시를 감지하는 데 필수적인 요소입니다. 자동차 솔루션의 AI에 대해 자세히 알아보고 Waymo와 같은 기업의 기술을 살펴보세요.
  • 콘텐츠 검토: 소셜 미디어 플랫폼과 웹사이트에서 사용자가 생성한 콘텐츠를 자동으로 스캔하여 부적절하거나 유해한 이미지와 동영상을 식별하고 플래그를 지정하는 기능으로, TechTarget과 같은 리소스에서 설명합니다.
  • 제조: 조립 라인에서 제품의 결함을 감지하여 품질 관리를 개선하기 위한 육안 품질 검사에 사용됩니다. 제조 분야의 AI 솔루션 살펴보기

이 분야는 컴퓨터 비전 및 패턴 인식 컨퍼런스(CVPR)컴퓨터 비전 재단(CVF) 같은 단체에서 공유되는 연구에 힘입어 끊임없이 발전하고 있습니다. Google Cloud AI 블로그에서 실용적인 인사이트를 읽어보세요.

도구 및 교육

이미지 인식 애플리케이션을 개발하려면 전문 라이브러리와 프레임워크를 사용해야 하는 경우가 많습니다. 주요 기술은 다음과 같습니다:

모두 보기