능동 학습은 알고리즘이 학습할 데이터를 선택하는 데 있어 능동적인 역할을 하는 머신 러닝의 특수한 접근 방식입니다. 완전히 레이블이 지정된 데이터 세트에 의존하는 기존의 지도 학습과 달리, 능동 학습은 가장 유익하다고 판단되는 특정 데이터 포인트에 대한 레이블을 지능적으로 쿼리합니다. 이 표적화된 접근 방식을 사용하면 훨씬 적은 수의 레이블이 지정된 예제로 높은 정확도를 달성할 수 있으므로 특히 레이블이 지정되지 않은 대규모 데이터 세트를 다룰 때 머신러닝 모델을 훈련하는 데 비용 효과적이고 효율적인 전략이 될 수 있습니다.
능동형 학습에서 모델은 오라클(일반적으로 인간 주석가)과 반복적으로 상호 작용하여 가장 가치 있는 데이터 요소에 대한 레이블을 요청합니다. 이 프로세스는 일반적으로 다음 단계를 따릅니다:
능동 학습은 데이터 라벨링에 비용이 많이 들고 시간이 오래 걸리거나 전문 지식이 필요할 때 특히 유용합니다. 능동 학습은 라벨링할 데이터 포인트를 전략적으로 선택함으로써 라벨링 작업을 최소화하는 동시에 모델의 성능을 극대화합니다.
능동적 학습은 기존의 지도 학습에 비해 몇 가지 장점이 있습니다:
능동형 학습은 레이블이 지정된 데이터가 부족하거나 비용이 많이 드는 다양한 영역에서 응용 분야를 찾습니다. 다음은 두 가지 구체적인 예시입니다:
의료 이미지 분석에서 의료 전문가로부터 주석을 얻는 것은 비용과 시간이 많이 소요될 수 있습니다. 액티브 러닝은 모호한 특징이나 희귀 질환이 있는 이미지 등 전문가의 라벨링이 필요한 가장 중요한 의료 이미지를 식별하는 데 사용할 수 있습니다. 이 표적화된 접근 방식을 사용하면 더 적은 수의 라벨링된 이미지로 정확한 진단 모델을 개발할 수 있어 AI 기반 의료 도구의 개발을 가속화할 수 있습니다.
자율 주행 차량용 물체 감지 모델을 학습하려면 다양한 주행 시나리오를 나타내는 방대한 양의 라벨링된 데이터가 필요합니다. 능동 학습은 비정상적인 조명 조건, 가려진 물체, 드문 교통 상황 등 모델에 가장 까다로운 데이터 포인트의 라벨링 우선순위를 정하는 데 도움이 될 수 있습니다. 이렇게 하면 모델이 가장 유익한 데이터로 학습하여 자율 주행 시스템의 안전성과 신뢰성을 향상시킬 수 있습니다. 이는 자율 주행 차량에서 컴퓨터 비전을 활용하는 수많은 애플리케이션 중 하나에 불과합니다.
능동적 학습을 다른 관련 학습 패러다임과 구별하는 것이 중요합니다:
Ultralytics 는 강력한 Ultralytics YOLO 모델을 포함하여 객체 감지를 위한 최첨단 솔루션을 제공합니다. Ultralytics 은 현재 능동적 학습 워크플로를 직접 지원하지 않지만, YOLO 모델에서 생성된 결과와 인사이트를 활용하여 능동적 학습 전략을 구현할 수 있습니다. 예를 들어, 객체 감지에 대한 모델의 신뢰도 점수를 사용하여 라벨링할 불확실한 인스턴스를 식별할 수 있습니다.
또한 Ultralytics 에서는 YOLO 모델의 훈련, 검증 및 배포를 위한 도구와 리소스 모음을 제공합니다. 이러한 도구는 사용자 지정 활성 학습 파이프라인에 통합하여 객체 감지 시스템 개발을 간소화할 수 있습니다. 이러한 기능은 Ultralytics 문서 페이지에서 자세히 살펴볼 수 있습니다.
능동형 학습은 특히 라벨링 데이터가 부족하거나 비용이 많이 드는 경우 머신러닝 모델을 효율적으로 훈련하기 위한 강력한 패러다임입니다. 능동형 학습은 라벨링에 가장 유익한 데이터 포인트를 지능적으로 선택함으로써 비용을 절감하고, 학습 속도를 높이며, 모델 정확도를 향상시킵니다. 다양한 산업 분야에서 AI 솔루션에 대한 수요가 증가함에 따라 액티브 러닝은 강력하고 효율적인 머신러닝 시스템 개발에 점점 더 중요한 역할을 하게 될 것입니다.