원샷 학습은 카테고리 또는 클래스별로 아주 적은 수의 예제(이상적으로는 단 한 개)를 통해 모델을 인식하고 일반화하도록 학습시키는 머신 러닝 접근 방식입니다. 이는 일반적으로 효과적인 학습을 위해 수백 또는 수천 개의 예시가 필요한 기존의 머신 러닝 방법과 크게 대조됩니다. 원샷 학습은 대규모 데이터 세트를 수집하는 것이 어렵거나 비용이 많이 들거나 실현 불가능한 시나리오에서 특히 유용합니다. 원샷 러닝은 새로운 사물이나 개념을 한 번 또는 몇 번만 보고도 인식할 수 있는 인간의 학습을 모방하는 것을 목표로 합니다.
원샷 학습의 핵심 아이디어는 객체 분류를 직접 학습하는 대신 유사성 또는 거리 메트릭을 학습하는 것입니다. 원샷 학습은 특정 카테고리를 인식하도록 모델을 훈련시키는 대신, 두 입력이 얼마나 유사하거나 다른지 이해하도록 모델을 훈련시킵니다. 일반적인 기법에는 임베딩 공간에서 유사한 입력이 서로 가깝고 서로 다른 입력이 멀리 떨어져 있는 임베딩을 학습하는 샴 네트워크 또는 삼중 손실 함수가 포함됩니다.
학습 단계에서 모델에는 쌍 또는 세 쌍의 예가 제시되고 이를 구별하는 방법을 학습합니다. 새로운 인스턴스에 직면하여 보이지 않는 여러 범주(범주당 하나의 예만 제공됨)로 분류하라는 요청을 받으면 모델은 새 인스턴스를 제공된 각 예와 비교합니다. 그런 다음 일반적으로 학습된 임베딩 공간에서 가장 가까운 이웃 접근법을 사용하여 이러한 예제와의 유사성을 기반으로 새 인스턴스를 분류합니다. 이 접근 방식은 모델이 특정 예시를 암기하는 대신 유사성을 나타내는 특징을 식별하는 방법을 학습하므로 제한된 데이터로도 효과적으로 일반화할 수 있습니다.
원샷 러닝은 데이터 부족으로 어려움을 겪는 다양한 분야에서 활용되고 있습니다:
밀접한 관련이 있지만, 원샷 학습은 소수 정예 학습의 하위 집합입니다. 원샷 학습은 구체적으로 클래스당 단 하나의 예제에서 학습하는 것을 말합니다. 반면에 소수 샷 학습은 모델이 일반적으로 클래스당 한 개에서 몇 개의 샘플에 이르는 적은 수의 예제에서 학습하는 시나리오를 포함합니다. 두 접근 방식 모두 제한된 데이터의 문제를 해결하는 것을 목표로 하지만, 원샷 학습은 특정 사례로서 원샷 학습을 포함하는 보다 광범위한 용어입니다. 두 가지 모두 효과적인 모델 학습을 위해 대규모 데이터 세트에 의존하는 기존 머신 러닝과는 대조적입니다.
요약하자면, 원샷 학습은 머신러닝의 강력한 패러다임 전환을 통해 모델이 최소한의 데이터로 효과적으로 학습할 수 있게 해줍니다. 부족한 예제로부터 일반화할 수 있는 능력은 다양한 실제 애플리케이션, 특히 데이터 수집에 제약이 있는 컴퓨터 비전 및 기타 영역에서 필수 불가결한 요소입니다. AI가 계속 발전함에 따라 원샷 학습 및 관련 기술은 데이터 한계를 해결하고 머신러닝 애플리케이션의 범위를 확장하는 데 점점 더 중요한 역할을 하게 될 것입니다.