용어집

제로 샷 학습

제로 샷 학습: 모델이 보이지 않는 데이터를 분류하여 객체 감지, NLP 등을 혁신하는 최첨단 AI 접근 방식에 대해 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

제로 샷 학습(ZSL)은 머신 러닝(ML) 내에서 모델이 학습 단계에서 명시적으로 본 적이 없는 데이터 카테고리를 인식하고 분류하도록 훈련하는 흥미로운 영역입니다. 가능한 모든 카테고리에 대해 레이블이 지정된 예제를 필요로 하는 기존의 지도 학습 접근 방식과 달리, ZSL은 공유된 보조 정보를 사용하여 보이는 클래스에서 보이지 않는 클래스로 지식을 일반화하는 것을 목표로 합니다. 이 기능은 생각할 수 있는 모든 카테고리에 대해 레이블이 지정된 데이터를 수집하는 것이 비현실적이거나 불가능한 실제 시나리오에서 특히 유용합니다.

제로 샷 학습의 작동 방식

ZSL의 핵심 아이디어는 입력 특징 공간(예: 이미지 특징 또는 텍스트 특징)과 의미적 임베딩 공간 사이의 매핑을 학습하는 것입니다. 이 의미 공간은 일반적으로 보이는 클래스와 보이지 않는 클래스 간에 공유되는 높은 수준의 설명적 속성 또는 속성을 인코딩합니다. 예를 들어, 컴퓨터 비전에서는'줄무늬가 있다', '털이 있다', '날개가 있다'와 같은 시각적 속성이나 텍스트 기반 설명이 될 수 있습니다. 자연어 처리(NLP)에서는 단어 임베딩이 이러한 의미 공간 역할을 하는 경우가 많습니다.

훈련 중에 모델은 보이는 클래스의 특징을 해당 의미 표현(예: 속성 또는 임베딩)과 연관시키는 방법을 학습합니다. 추론 시, 보이지 않는 클래스의 인스턴스가 제시되면 모델은 그 특징을 추출하여 학습된 의미 공간에 매핑합니다. 이 매핑을 보이지 않는 클래스의 알려진 의미 표현(별도로 제공됨)과 비교함으로써 모델은 사전 예제 없이도 클래스 레이블을 예측할 수 있습니다. 딥러닝 모델, 특히 CLIP과 같은 대조 학습과 같은 기술을 사용하는 모델은 풍부한 특징 표현을 학습할 수 있기 때문에 ZSL 작업에 자주 사용됩니다. 이러한 작업에 적합한 다양한 데이터 세트는 Ultralytics 데이터 세트 문서에 나열된 것과 같은 다양한 데이터 세트를 탐색할 수 있습니다.

실제 애플리케이션

제로 샷 학습을 통해 다양한 영역에서 강력한 애플리케이션을 사용할 수 있습니다:

  1. 새로운 물체 인식: 이미지 분류 또는 물체 감지 분야에서 ZSL을 사용하면 시스템이 초기 학습 데이터에 없는 물체를 식별할 수 있습니다. 예를 들어, 일반적인 동물에 대해 훈련된 야생동물 모니터링 시스템은 텍스트 설명이나 전문가가 제공한 의미론적 속성 집합을 기반으로 희귀종이나 새로 발견된 종을 식별할 수 있습니다. Ultralytics YOLO 같은 모델은 개방형 어휘 감지를 위해 이 기능을 활용합니다.
  2. 동적 콘텐츠 분류: ZSL은 문서, 뉴스 기사 또는 사용자 생성 콘텐츠를 이전에 레이블이 지정된 데이터가 없는 새로운 주제로 분류할 수 있습니다. 시스템을 기존 카테고리에 대해 학습시킨 다음 단어 임베딩이나 주제 설명을 사용하여 예상치 못한 이벤트나 트렌드와 관련된 콘텐츠를 분류할 수 있습니다.

ZSL과 관련 학습 패러다임 비교

ZSL을 관련 개념과 구별하는 것이 중요합니다:

  • 소수 예제 학습: 매우 적은 수의 레이블이 지정된 예제(0개 이상)에서 새로운 클래스를 학습하는 것을 목표로 합니다.
  • 원샷 학습: 새로운 수업마다 하나의 레이블이 지정된 예제만 제공되는 단발성 학습의 특정 사례입니다.
  • 이전 학습: 한 작업 또는 도메인에서 얻은 지식을 활용하여 다른 관련 작업 또는 도메인의 성능을 향상시키는 것을 포함합니다. 대상 데이터에 대해 사전 학습된 모델을 미세 조정하는 경우가 많으며, 여기에는 일반적으로 대상 클래스의 예가 포함됩니다.

주요 차별점은 ZSL이 훈련 또는 적응 중에 대상 클래스에 대해 레이블이 지정된 예시가 0개라는 엄격한 조건에서 작동한다는 것입니다. 비교 개요는 소수 샷, 제로 샷 및 전이 학습 이해에 대한 토론을 참조하세요.

AI에서의 중요성

제로 샷 학습은 AI 시스템의 확장성과 적응성을 크게 향상시킵니다. 대규모 ML 애플리케이션 개발의 병목 현상인 철저한 데이터 수집 및 주석에 대한 의존도를 줄여줍니다. 모델이 보이지 않는 개념에 대해 추론할 수 있게 함으로써 ZSL은 인공 지능(AI)의 일반화의 경계를 넓혀 시스템을 더욱 강력하게 만들고 현실 세계의 개방적인 특성을 처리할 수 있게 합니다. Ultralytics 허브와 같은 플랫폼은 향후 ZSL 원칙을 활용할 수 있는 모델을 포함한 모델의 훈련과 배포를 용이하게 합니다. ZSL 연구에 대한 자세한 내용은 Wikipedia의 ZSL 페이지 또는 arXiv와 같은 플랫폼에서 찾을 수 있는 학술 조사 등의 리소스를 참조하세요.

모두 보기