원샷 학습(OSL)은 머신러닝(ML)의 전문 영역으로, 각 클래스에 대해 단 하나의 훈련 인스턴스만을 기반으로 새로운 예제를 분류하는 것이 목표입니다. 이는 높은 정확도를 달성하기 위해 클래스당 수천 개의 레이블이 지정된 예시가 필요한 기존의 지도 학습 방법과 크게 대조됩니다. OSL은 특히 훈련 데이터가 부족하거나, 비용이 많이 들거나, 수집에 시간이 많이 걸리는 시나리오에 적합하므로 데이터 제한이 일반적인 실제 애플리케이션에 매우 중요한 기술입니다.
원샷 학습의 작동 방식
OSL 모델은 수많은 예제에서 입력을 클래스 레이블에 직접 매핑하는 방법을 학습하는 대신 일반적으로 유사성 함수를 학습합니다. 핵심 아이디어는 보이지 않는 새로운 예제(쿼리)가 각 클래스에 대해 사용 가능한 레이블이 지정된 단일 예제(지원)와 얼마나 유사한지를 결정하는 것입니다. 쿼리 예가 특정 클래스의 지원 예와 매우 유사하면 해당 클래스 레이블이 할당됩니다. 여기에는 종종 두 개의 입력을 동시에 처리하여 유사성을 판단하는 샴 네트워크와 같은 딥 러닝(DL) 아키텍처를 사용합니다. 이러한 네트워크는 종종 메트릭 학습과 같은 기술을 통해 OSL 작업에 적용되기 전에 강력한 특징 표현을 학습하기 위해 전이 학습을 사용하여 대규모 데이터 세트(예: ImageNet)에서 사전 학습됩니다.
원샷 학습의 핵심 개념
- 지원 세트: 여기에는 모델이 학습해야 하는 각 클래스에 대해 제공되는 레이블이 지정된 단일 예제가 포함되어 있습니다.
- 쿼리 집합: 여기에는 모델이 지원 집합을 기반으로 분류하는 데 필요한 레이블이 지정되지 않은 예가 포함되어 있습니다.
- 유사성/메트릭 학습: 데이터 포인트 간의 유사성을 측정하는 거리 함수 또는 메트릭을 학습하는 과정으로, 쿼리 예제와 지원 예제를 비교하는 데 중요합니다.
- 에피소드 훈련: 대규모 데이터 세트에서 샘플링된 여러 개의 작은 OSL 작업(에피소드)으로 모델을 훈련하여 훈련 중에 단발성 시나리오를 시뮬레이션하는 일반적인 훈련 전략입니다.
원샷 학습과 관련 패러다임 비교
OSL을 이해하려면 관련 개념과 구분해야 합니다:
- 소수점 학습(FSL): OSL은 FSL의 극단적인 변형으로 간주됩니다. OSL은 클래스당 하나의 예제만 사용하는 반면, FSL은 클래스당 적은 수(k > 1, 일반적으로 5개 또는 10개)의 예제를 사용합니다. 둘 다 데이터 부족 문제를 해결하지만 사용 가능한 샘플 수에는 차이가 있습니다. 이러한 패러다임에 대한 자세한 내용은 소수 샘플, 제로 샘플 및 전이 학습 이해에 대한 블로그 게시물에서 확인할 수 있습니다.
- 제로 샷 학습(ZSL): ZSL은 훈련 중에 본 적이 없는 클래스의 인스턴스를 분류하는 훨씬 더 어려운 문제를 해결합니다. 이는 일반적으로 보이는 클래스와 보이지 않는 클래스를 연결하는 시맨틱 속성이나 텍스트 설명과 같은 보조 정보를 활용하여 달성합니다. OSL은 하나의 예시를 보아야 하지만, ZSL은 예시를 보지 않아도 되지만 추가적인 의미론적 맥락이 필요합니다.
- 전이 학습 및 미세 조정: OSL은 종종 전이 학습(대규모 데이터 세트에 대한 사전 학습)을 사용하지만, 그 목표는 다릅니다. 표준 전이 학습 또는 미세 조정은 일반적으로 적절한 양의 대상 데이터를 적응에 사용할 수 있다고 가정하는 반면, OSL은 특히 하나의 예제 제약 조건을 처리합니다. 사용자 지정 학습 Ultralytics YOLO 모델과 같은 기법에는 종종 사전 학습된 가중치를 미세 조정하는 것이 포함되지만, 일반적으로 클래스당 하나 이상의 예제를 사용합니다.
실제 애플리케이션
OSL을 사용하면 데이터 제한으로 인해 제한되었던 다양한 애플리케이션을 사용할 수 있습니다:
- 얼굴 인식: 보안 시스템이나 개인 디바이스는 사진 한 장으로 사람을 등록한 후 신원을 식별하거나 확인해야 할 수 있습니다. NIST는 얼굴 인식 기술에 대한 광범위한 테스트를 수행하며, 많은 경우 유사한 몇 장 또는 한 번의 촬영으로 해결해야 하는 문제에 직면해 있습니다.
- 희귀 물체 감지: 제조 품질 관리나 야생동물 보호와 같은 분야에서는 희귀한 결함이나 멸종 위기종을 식별하는 것이 한 가지 또는 극소수의 이전 사례로만 가능할 수 있습니다. 하지만 다음과 같은 모델은 Ultralytics YOLO11 과 같은 모델은 충분한 데이터로 물체 감지에 탁월하지만, 극히 희귀한 클래스에 대해서는 OSL 기술로 이를 보강할 수 있습니다.
- 서명 확인: 파일에 저장된 단일 참조 서명을 기반으로 사람의 서명을 인증하는 작업입니다. 이 작업을 위해 딥러닝을 활용하는 연구는 주로 데이터가 적은 환경에서 이루어집니다.
- 신약 개발: 잠재적인 신약 후보를 식별하거나 매우 제한된 실험 결과를 바탕으로 분자 특성을 예측하여 연구 프로세스를 가속화합니다. 연구에 따르면 약물과 표적의 상호작용을 예측하는 데 OSL을 적용하는 것으로 나타났습니다.
과제 및 향후 방향
OSL의 주요 과제는 일반화입니다. 어떻게 하면 모델이 과적합 없이 단 하나의 예제에서 클래스의 본질을 안정적으로 학습할 수 있을까요? 단일 지원 예제의 선택과 품질이 매우 중요합니다. 현재 진행 중인 연구는 보다 강력한 기능 표현, 더 나은 유사성 메트릭 개발, 메타러닝 ('학습을 통한 학습')과 같은 기술을 활용하여 OSL 성능을 개선하는 데 초점을 맞추고 있습니다. OSL 기능을 Ultralytics HUB와 같은 범용 비전 모델 및 플랫폼에 통합하면 데이터 제약이 있는 환경에서 적용 범위를 크게 넓힐 수 있습니다. OSL 모델을 평가하려면 이러한 까다로운 조건에서 성능 메트릭을 신중하게 고려해야 합니다.