능동 학습은 머신 러닝(ML) 의 전문 하위 분야로, 학습 알고리즘이 '오라클' 또는 인간 주석가라고 불리는 사용자를 대화형으로 쿼리하여 새로운 데이터 요소에 대한 라벨을 요청할 수 있습니다. 일반적으로 사전에 레이블이 지정된 대규모 데이터 세트가 필요한 기존의 지도 학습과 달리, 능동 학습은 훨씬 적은 레이블 작업으로 높은 모델 성능을 달성하는 것을 목표로 합니다. 이는 주석을 달기 위해 가장 유익한 라벨이 없는 인스턴스를 전략적으로 선택함으로써 이루어집니다. 이 접근 방식은 의료 이미지 분석이나 복잡한 자연어 처리(NLP) 작업처럼 라벨링된 데이터를 얻는 데 비용이 많이 들고 시간이 오래 걸리거나 전문적인 전문 지식이 필요한 영역에서 특히 유용합니다. 핵심 아이디어는 모델이 데이터 라벨링 프로세스를 안내하도록 하여 모델 정확도 향상에 가장 큰 영향을 미치는 곳에 사람의 노력을 집중하는 것입니다.
능동적 학습의 작동 방식
액티브 러닝 프로세스는 일반적으로 반복적인 주기를 따르며, 목표 데이터를 통해 모델을 점진적으로 개선할 수 있습니다:
- 초기 모델 학습: 다음과 같은 모델 Ultralytics YOLO 모델과 같은 객체 감지 또는 이미지 세분화 모델은 처음에 레이블이 지정된 작은 데이터 세트에 대해 학습됩니다.
- 레이블이 지정되지 않은 데이터 쿼리하기: 학습된 모델은 레이블이 지정되지 않은 데이터 풀에 대한 예측(추론)을 하는 데 사용됩니다.
- 쿼리 전략 적용: 쿼리 전략은 모델의 예측(예: 예측 신뢰도 또는 불확실성 기반)을 분석하여 가장 정보가 많은 레이블이 없는 데이터 포인트(모델이 가장 확실하지 않거나 가장 새로운 정보를 제공할 것으로 예상되는 데이터 포인트)를 선택합니다.
- 오라클 주석: 선택한 데이터 포인트는 라벨링을 위해 인간 주석 작성자(오라클)에게 제공됩니다. 여기에서는 효과적인 데이터 수집 및 주석 작성 관행이 중요합니다.
- 모델 재학습: 새로 레이블이 지정된 데이터가 학습 세트에 추가되고, 이 확장된 데이터 세트로 모델이 재학습(또는 미세 조정)됩니다.
- 반복: 원하는 성능 수준에 도달하거나 라벨링 예산이 소진되거나 유의미한 정보가 있는 샘플이 남지 않을 때까지 2단계부터 사이클이 반복됩니다.
쿼리 전략
능동 학습의 효과는 쿼리 전략, 즉 다음에 레이블이 지정되지 않은 데이터 포인트를 선택하는 데 사용되는 알고리즘에 따라 크게 달라집니다. 목표는 일단 레이블이 지정되면 모델 성능을 가장 크게 향상시킬 수 있는 샘플을 선택하는 것입니다. 일반적인 전략은 다음과 같습니다:
- 불확실성 샘플링: 모델의 예측에 대한 신뢰도가 가장 낮은 인스턴스를 선택합니다. 이는 예측 확률, 엔트로피 또는 상위 예측 간의 마진으로 측정하는 경우가 많습니다.
- 위원회별 쿼리(QBC): 모델 앙상블을 사용합니다. 위원들이 예측에 대해 가장 많이 동의하지 않는 인스턴스가 라벨링을 위해 선택됩니다.
- 예상 모델 변경: 레이블이 알려진 경우 모델의 파라미터 또는 그라데이션에 가장 큰 변화를 일으킬 수 있는 인스턴스를 선택합니다.
- 밀도 기반 접근 방식: 불확실할 뿐만 아니라 기본 데이터 분포를 대표하는 인스턴스의 우선 순위를 지정합니다.
전략에 대한 종합적인 개요는 Burr Settles의 능동적 학습 문헌 조사 같은 리소스에서 확인할 수 있습니다.
관련성 및 이점
액티브 러닝은 강력한 딥 러닝(DL) 모델을 개발하는 데 있어 가장 큰 걸림돌인 데이터 라벨링과 관련된 부담과 비용을 크게 줄여줍니다. 팀은 주석 작업에 전략적으로 집중함으로써 다음과 같은 이점을 누릴 수 있습니다:
- 더 적은 데이터로 더 높은 정확도 달성: 동일한 라벨링 예산이 주어졌을 때 무작위 샘플링에 비해 더 나은 모델 성능을 얻을 수 있습니다.
- 라벨링 비용 절감: 수동 주석 달기에 소요되는 시간과 리소스를 최소화합니다.
- 모델 개발 가속화: 가장 영향력 있는 데이터에 우선 순위를 지정하여 원하는 성능 수준에 더 빨리 도달하세요. 능동 학습으로 컴퓨터 비전 개발 속도를 높이는 방법을 살펴보세요.
- 모델 견고성 향상: 모호하거나 어려운 예제에 집중하면 모델을 더 잘 일반화할 수 있습니다.
실제 애플리케이션
액티브 러닝은 레이블이 지정된 데이터가 제약 조건인 다양한 분야에 적용됩니다:
- 의료 영상: YOLO 모델을 사용한 종양 검출과 같은 작업에서는 전문 방사선 전문의의 시간이 소중합니다. 액티브 러닝은 가장 모호한 스캔을 선별하여 검토함으로써 전문가 리소스 사용을 최적화합니다. 이는 효과적인 의료 AI 솔루션을 개발하는 데 매우 중요합니다.
- 자연어 처리(NLP): 감정 분석이나 명명된 개체 인식(NER)과 같은 작업의 경우, 라벨링을 위한 정보성 텍스트 샘플(예: 모호한 감정이나 희귀한 개체)을 식별하면 모델 정확도를 효율적으로 향상시킬 수 있습니다. 다음과 같은 플랫폼의 도구 Hugging Face 와 같은 플랫폼의 도구는 종종 이러한 기술의 이점을 활용합니다.
- 자율주행 차량: 방대한 양의 라벨이 없는 주행 데이터에서 까다롭거나 드문 주행 시나리오(예: 비정상적인 기상 조건, 복잡한 교차로)를 선택하여 주석을 달면 자율 주행 시스템의 안전성과 신뢰성을 개선하는 데 도움이 됩니다.
- 위성 이미지 분석: 대규모 위성 이미지 데이터 세트에서 특정 특징이나 변화를 식별하는 것은 전문가 검토를 위해 모델이 불확실한 영역을 쿼리하도록 함으로써 가속화할 수 있습니다.
능동적 학습과 관련 개념
능동적 학습을 라벨링되지 않은 데이터를 활용하는 다른 학습 패러다임과 구별하는 것이 중요합니다:
- 준지도 학습: 모델 학습 중에 레이블이 지정된 데이터와 레이블이 지정되지 않은 데이터를 동시에 사용합니다. 능동 학습과 달리, 일반적으로 특정 인스턴스에서 레이블을 선택적으로 쿼리하는 대신 사용 가능한 모든 레이블이 없는 데이터를 수동적으로 사용합니다.
- 자기 지도 학습: 사전 작업(예: 이미지의 가려진 부분 예측)을 생성하여 레이블이 없는 데이터에서 표현을 학습합니다. 사전 학습 단계에서 사람의 주석이 필요하지 않은 반면, 능동 학습은 레이블을 위해 오라클에 의존합니다.
- 강화 학습: 환경과의 상호작용을 통해 시행착오를 겪으며 행동에 대한 보상이나 벌칙을 받음으로써 학습합니다. 능동 학습처럼 명시적인 레이블을 쿼리하지 않습니다.
- 연합 학습: 데이터를 로컬로 유지하면서 분산된 디바이스 전반에서 모델을 학습하는 데 중점을 두며, 주로 데이터 프라이버시 문제를 해결합니다. 능동 학습은 효율적인 라벨 획득에 중점을 둡니다. 이러한 기술은 때때로 결합될 수 있습니다.