녹색 확인
링크가 클립보드에 복사됨

소수 샷, 제로 샷 및 이전 학습에 대한 이해

컴퓨터 비전에서 소수 샷 학습, 제로 샷 학습, 전이 학습의 차이점과 이러한 패러다임이 AI 모델 학습을 어떻게 형성하는지 살펴보세요.

인공지능(AI) 시스템은 최소한의 사람의 입력만으로 얼굴 인식, 이미지 분류, 자동차 운전과 같은 복잡한 작업을 처리할 수 있습니다. 데이터를 학습하고, 패턴을 인식하고, 이러한 패턴을 사용하여 예측이나 결정을 내림으로써 이러한 작업을 수행합니다. AI가 발전함에 따라 AI 모델이 학습하고 적응하며 놀라운 효율성으로 작업을 수행할 수 있는 방법이 점점 더 정교해지고 있습니다.

예를 들어 컴퓨터 비전은 기계가 세상의 시각 정보를 해석하고 이해할 수 있도록 하는 데 중점을 둔 AI의 한 분야입니다. 기존의 컴퓨터 비전 모델 개발은 학습을 위해 주석이 달린 대규모 데이터 세트에 크게 의존합니다. 이러한 데이터를 수집하고 라벨을 붙이는 작업은 시간과 비용이 많이 들 수 있습니다. 

이러한 문제를 해결하기 위해 연구원들은 제한된 예제에서 학습하는 소수 샷 학습(FSL), 보이지 않는 물체를 식별하는 제로 샷 학습(ZSL), 사전 학습된 모델의 지식을 새로운 작업에 적용하는 전이 학습(TL) 등 혁신적인 접근 방식을 도입했습니다.

이 글에서는 이러한 학습 패러다임이 어떻게 작동하는지 살펴보고, 주요 차이점을 강조하며, 실제 적용 사례를 살펴봅니다. 시작해 보겠습니다!

학습 패러다임의 개요

컴퓨터 비전과 관련하여 소수 샷 학습, 제로 샷 학습 및 전이 학습이 무엇이며 어떻게 작동하는지 살펴보겠습니다. 

단발성 학습

소수 샷 학습은 시스템이 소수의 예제만으로 새로운 물체를 인식하는 방법을 학습하는 방법입니다. 예를 들어 모델에 펭귄, 펠리컨, 퍼핀의 사진 몇 장을 보여주면(이 작은 그룹을 '지원 세트'라고 함) 모델은 이 새들이 어떻게 생겼는지 학습합니다. 

나중에 모델에 펭귄과 같은 새로운 사진을 보여주면 이 새로운 사진을 지원 세트에 있는 사진과 비교하여 가장 가까운 사진을 선택합니다. 이 방법은 많은 양의 데이터를 수집하기 어려울 때 시스템이 몇 가지 예제만으로 학습하고 적응할 수 있기 때문에 유용합니다.

그림 1. 소수 샷 학습의 작동 방식에 대한 개요.

제로 샷 학습

제로 샷 학습은 기계가 예시 없이도 이전에 본 적이 없는 사물을 인식하는 방법입니다. 설명과 같은 시맨틱 정보를 사용하여 연결에 도움을 줍니다.

예를 들어 기계가 고양이, 사자, 말과 같은 동물에 대해 '작고 푹신한', '큰 야생 고양이', '긴 얼굴' 등의 특징을 이해하여 학습한 경우, 이 지식을 사용하여 호랑이와 같은 새로운 동물을 식별할 수 있습니다. 호랑이를 본 적이 없더라도 "어두운 줄무늬가 있는 사자 같은 동물"과 같은 설명을 사용하여 호랑이를 정확하게 식별할 수 있습니다. 이렇게 하면 많은 예제 없이도 기계가 더 쉽게 학습하고 적응할 수 있습니다.

그림 2. 제로 샷 학습은 설명을 사용하여 새로운 개체를 식별합니다.

이전 학습

전이 학습은 모델이 한 작업에서 학습한 내용을 사용하여 유사한 새로운 작업을 해결하는 데 도움을 주는 학습 패러다임입니다. 이 기술은 물체 감지, 이미지 분류, 패턴 인식과 같은 컴퓨터 비전 작업에 특히 유용합니다. 

예를 들어, 컴퓨터 비전에서는 사전 학습된 모델이 동물과 같은 일반적인 물체를 인식한 다음 전이 학습을 통해 다른 개 품종과 같은 특정 물체를 식별하도록 미세 조정할 수 있습니다. 전이 학습은 이전 작업에서 얻은 지식을 재사용함으로써 더 작은 데이터 세트에서 컴퓨터 비전 모델을 더 쉽게 훈련할 수 있어 시간과 노력을 절약할 수 있습니다.

그림 3. 이전 학습의 작동 방식에 대한 개요.

어떤 종류의 모델이 전이 학습을 지원하는지 궁금할 것입니다. Ultralytics YOLO11 이 이를 수행할 수 있는 컴퓨터 비전 모델의 좋은 예입니다. 이 모델은 대규모의 일반 데이터 세트에서 먼저 사전 학습된 최첨단 객체 감지 모델입니다. 그런 다음 특정 작업을 위해 더 작고 특화된 데이터 세트에 대해 미세 조정하고 맞춤 학습할 수 있습니다.

학습 패러다임 비교

이제 소수 샷 학습, 제로 샷 학습 및 전이 학습에 대해 이야기했으니, 이 세 가지가 어떻게 다른지 비교해 보겠습니다.

그림 4. 소수 샷, 제로 샷 및 전이 학습의 주요 차이점 이미지 제공: 작성자.

소량 학습은 라벨링된 데이터의 양이 적을 때 유용합니다. 몇 개의 예제만으로 AI 모델이 학습할 수 있기 때문입니다. 반면 제로 샷 학습은 레이블이 지정된 데이터가 필요하지 않습니다. 대신 설명이나 컨텍스트를 사용하여 시스템이 새로운 작업을 처리하는 데 도움을 줍니다. 반면 전이 학습은 사전 학습된 모델의 지식을 사용하여 다른 접근 방식을 취하므로 최소한의 추가 데이터로 새로운 작업에 빠르게 적응할 수 있습니다. 각 방법은 작업 중인 데이터와 작업 유형에 따라 고유한 강점이 있습니다.

다양한 학습 패러다임의 실제 적용 사례

이러한 학습 패러다임은 이미 여러 분야에서 혁신적인 솔루션으로 복잡한 문제를 해결하며 변화를 일으키고 있습니다. 이러한 학습 패러다임이 현실에서 어떻게 적용될 수 있는지 자세히 살펴보겠습니다.

소수 샷 학습으로 희귀 질환 진단

몇 컷 학습은 의료 분야, 특히 의료 영상 분야의 판도를 바꿀 수 있는 기술입니다. 의사가 대량의 데이터 없이도 몇 가지 예시나 설명만으로 희귀 질환을 진단하는 데 도움을 줄 수 있습니다. 희귀 질환에 대한 대규모 데이터 세트를 수집하는 것이 어려울 수 있기 때문에 데이터가 제한되어 있을 때 특히 유용합니다.

예를 들어, 셰퍼드는 희귀 유전 질환을 진단하기 위해 소수점 학습과 생물의학 지식 그래프를 사용합니다. 증상 및 검사 결과와 같은 환자 정보를 알려진 유전자 및 질병 네트워크에 매핑합니다. 이를 통해 데이터가 제한적인 경우에도 가능한 유전적 원인을 정확히 찾아내고 유사한 사례를 찾을 수 있습니다. 

그림 5. 셰퍼드 모델은 최소한의 데이터를 사용하여 희귀 질환을 진단합니다.

제로 샷 학습을 통한 식물 질병 탐지 개선

농업에서는 식물 질병의 발견이 지연되면 광범위한 작물 피해, 수확량 감소, 막대한 재정적 손실로 이어질 수 있기 때문에 이를 신속하게 파악하는 것이 필수적입니다. 기존의 방법은 대규모 데이터 세트와 전문 지식에 의존하는 경우가 많으며, 특히 외딴 지역이나 자원이 제한된 지역에서는 접근이 쉽지 않을 수 있습니다. 제로 샷 학습과 같은 AI의 발전이 바로 이 부분에서 빛을 발합니다.

토마토와 감자를 재배하는 농부가 잎이 노랗게 변하거나 갈색 반점이 생기는 등의 증상을 발견했다고 가정해 봅시다. 제로 샷 학습은 대규모 데이터 세트 없이도 역병과 같은 질병을 식별하는 데 도움이 될 수 있습니다. 이 모델은 증상에 대한 설명을 사용하여 이전에 보지 못했던 질병을 분류할 수 있습니다. 이 접근 방식은 빠르고 확장 가능하며 농부들이 다양한 식물 문제를 감지할 수 있게 해줍니다. 이를 통해 농부들은 작물의 건강을 보다 효율적으로 모니터링하고 적시에 조치를 취하며 손실을 줄일 수 있습니다.

그림 6. 제로 샷 학습을 사용하여 식물 질병 식별.

자율 주행 차량과 전이 학습

자율주행차는 안전한 주행을 위해 다양한 환경에 적응해야 하는 경우가 많습니다. 전이 학습을 사용하면 처음부터 훈련을 시작하지 않고도 사전 지식을 활용하여 새로운 조건에 빠르게 적응할 수 있습니다. 이러한 기술은 차량이 시각 정보를 해석하는 데 도움을 주는 컴퓨터 비전과 결합하여 다양한 지형과 기상 조건에서 보다 원활하게 탐색할 수 있게 함으로써 자율 주행의 효율성과 안정성을 높여줍니다.

실제 적용 사례로는 주차 공간을 모니터링하기 위해 Ultralytics YOLO11 사용하는 주차 관리 시스템을 들 수 있습니다. 사전 학습된 객체 감지 모델인 YOLO11 전이 학습을 통해 미세 조정하여 비어 있는 주차 공간과 점유 중인 주차 공간을 실시간으로 식별할 수 있습니다. 더 작은 규모의 주차장 이미지 데이터 세트로 모델을 학습시켜 빈 공간, 가득 찬 공간, 예약된 공간까지 정확하게 감지하는 방법을 학습합니다.

그림 7. Ultralytics 사용한 주차 관리YOLO11.

다른 기술과 통합된 이 시스템은 운전자를 가장 가까운 주차 가능 지점으로 안내하여 검색 시간과 교통 혼잡을 줄일 수 있습니다. 전이 학습은 YOLO11기존 물체 감지 기능을 기반으로 하여 처음부터 다시 시작하지 않고도 주차 관리의 특정 요구 사항에 적응할 수 있게 해줍니다. 이러한 접근 방식은 시간과 리소스를 절약하는 동시에 주차 운영을 개선하고 전반적인 사용자 경험을 향상시키는 매우 효율적이고 확장 가능한 솔루션을 만들어냅니다.

학습 패러다임의 새로운 트렌드

컴퓨터 비전 학습 패러다임의 미래는 보다 지능적이고 지속 가능한 비전 AI 시스템을 개발하는 방향으로 기울고 있습니다. 특히 소수의 샷 학습, 제로 샷 학습, 전이 학습을 결합한 하이브리드 접근법을 사용하는 것이 하나의 추세로 떠오르고 있습니다. 이러한 방법의 강점을 혼합하여 모델은 최소한의 데이터로 새로운 작업을 학습하고 다양한 영역에 걸쳐 지식을 적용할 수 있습니다.

흥미로운 예는 적응형 딥 임베딩을 사용하여 이전 작업의 지식과 소량의 새로운 데이터를 사용하여 모델을 미세 조정함으로써 제한된 데이터 세트로 더 쉽게 작업할 수 있도록 하는 것입니다. 

마찬가지로, X-shot 학습은 다양한 양의 데이터가 있는 작업을 처리하도록 설계되었습니다. 모델이 제한적이거나 잡음이 많은 레이블을 통해 학습하는 약한 감독과 명확한 지침을 사용하여 사전 예제가 거의 없거나 전혀 없는 경우에도 빠르게 적응할 수 있도록 도와줍니다. 이러한 하이브리드 접근 방식은 다양한 학습 방법을 통합하면 AI 시스템이 문제를 더 효과적으로 해결하는 데 어떻게 도움이 될 수 있는지 보여줍니다.

주요 요점

소수 샷 학습, 제로 샷 학습, 전이 학습은 각각 컴퓨터 비전의 특정 문제를 해결하므로 다양한 작업에 적합합니다. 올바른 접근 방식은 특정 애플리케이션과 사용 가능한 데이터의 양에 따라 달라집니다. 예를 들어, 소수 샷 학습은 제한된 데이터에서 잘 작동하는 반면, 제로 샷 학습은 보이지 않거나 익숙하지 않은 클래스를 처리하는 데 적합합니다.

앞으로는 이러한 방법을 결합하여 시각, 언어, 오디오를 통합하는 하이브리드 모델을 만드는 것이 핵심이 될 것입니다. 이러한 발전은 AI 시스템을 더욱 유연하고 효율적으로 만들고 복잡한 문제를 해결할 수 있도록 하여 이 분야에서 새로운 혁신의 가능성을 열어주는 것을 목표로 합니다.

커뮤니티에 가입하고 GitHub 리포지토리를 확인하여 AI에 대해 자세히 알아보세요. 자율 주행 자동차의 AI와 농업 분야의 컴퓨터 비전이 미래를 어떻게 변화시키고 있는지 알아보세요. YOLO 라이선스 옵션을 확인하여 시작해보세요!

Facebook 로고트위터 로고LinkedIn 로고복사 링크 기호

이 카테고리에서 자세히 보기

인공지능의 미래
를 함께 만들어 갑시다!

머신 러닝의 미래와 함께하는 여정 시작하기