용어집

앙상블

앙상블 메서드로 예측 정확도를 높이세요! 여러 모델을 결합하여 객체 감지, NLP 등의 성능을 향상시키는 방법을 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

머신 러닝에서 앙상블 방식은 여러 개별 모델의 예측을 결합하여 단일 모델이 단독으로 수행할 수 있는 것보다 더 정확하고 강력한 예측을 생성하는 기법입니다. 이 기법은 흔히'군중의 지혜'라고 불리는 원리에 따라 작동하며, 여러 가지 다양한 모델의 집단적 결정이 일반적으로 하나의 전문화된 모델의 결정보다 우수합니다. 이 접근 방식은 물체 감지, 이미지 분류, 자연어 처리와 같이 단일 관점에 의존하면 오류나 한계가 발생할 수 있는 인공 지능(AI) 내 복잡한 작업에서 특히 강력합니다.

앙상블 메서드의 핵심 개념

앙상블 방법은 여러 모델(기본 학습자 또는 약한 학습자라고도 함) 간의 다양성을 활용하여 예측 오류를 줄이고 전반적인 성능을 개선합니다. 핵심 아이디어는 서로 다른 모델이 데이터의 서로 다른 하위 집합에서 서로 다른 유형의 오류를 일으킬 수 있다는 것입니다. 예측을 결합함으로써 이러한 오류를 평균화하거나 서로 상쇄하여 보이지 않는 데이터에 대해 더 안정적이고 일반화된 최종 모델을 만들어낼 수 있습니다. 앙상블 방법의 성공의 열쇠는 기본 모델 간에 충분한 다양성을 확보하는 것입니다. 이러한 다양성은 다양한 학습 알고리즘 사용(예: 의사 결정 트리와 SVM 결합), 학습 데이터의 다른 하위 집합에 대한 모델 학습(예: 배깅), 동일한 알고리즘에 대해 다른 하이퍼파라미터 사용 등 다양한 전략을 통해 달성할 수 있습니다.

앙상블 메서드 사용의 이점

앙상블 방법을 사용하면 머신 러닝(ML)에서 몇 가지 중요한 이점을 얻을 수 있습니다:

  • 예측 정확도 향상: 앙상블은 종종 단일 기여 모델보다 더 높은 정확도를 달성합니다.
  • 견고성 및 안정성 향상: 최종 예측은 단일 모델의 특성이나 학습 데이터의 변동에 덜 민감합니다.
  • 과적합 위험 감소: 앙상블은 예측을 평균화함으로써 복잡한 모델이 학습 데이터에 과적합하는 경향을 완화할 수 있습니다.

앙상블 메서드의 유형

몇 가지 인기 있는 앙상블 기법이 존재하며, 각 기법에는 모델을 결합하는 고유한 접근 방식이 있습니다:

  • 배깅(부트스트랩 집계): 동일한 기본 알고리즘의 여러 인스턴스를 학습 데이터의 서로 다른 무작위 하위 집합(교체로 도출)에 대해 학습하고 예측의 평균을 구합니다. 랜덤 포레스트가 잘 알려진 예입니다.
  • 부스팅: 모델을 순차적으로 빌드하며, 새 모델은 이전 모델의 오류를 수정하는 데 중점을 둡니다. 예를 들어 AdaBoost, GBM(그라데이션 부스팅 머신), XGBoostLightGBM이 있습니다.
  • 스태킹(스택 일반화): 메타 모델(예: 로지스틱 회귀)을 학습하여 여러 다른 기본 모델(이기종 학습자)의 예측을 결합하여 그 결과물을 가장 잘 결합하는 방법을 학습합니다.

'모델 앙상블'이라는 용어는 종종 '앙상블'과 혼용되어 사용되며 여러 모델을 결합하는 동일한 개념을 의미합니다. YOLOv5 모델 앙상블을 위한 전략을 살펴볼 수 있습니다.

앙상블 메서드의 실제 적용 사례

앙상블 방법은 AI 시스템 성능을 향상시키기 위해 다양한 영역에서 널리 사용되고 있습니다:

  1. 컴퓨터 비전: 다음과 같은 모델을 사용하는 물체 감지와 같은 작업에서 Ultralytics YOLO와 같은 모델을 사용하는 물체 감지와 같은 작업에서 앙상블에는 다양한 증강 또는 여러 단계(체크포인트)에서 학습된 모델의 예측을 결합하는 작업이 포함될 수 있습니다. 이렇게 하면 다양한 기상 조건이나 물체 가려짐과 같은 까다로운 시나리오에서 감지 견고성이 향상되어 자율 주행 차량보안 시스템과 같은 애플리케이션에 매우 중요합니다.
  2. 의료 진단: 앙상블은 의료 이미지 분석에서 다양한 환자 데이터로 학습된 여러 알고리즘 또는 모델의 진단을 결합하는 데 사용됩니다. 예를 들어 CNN과 비전 트랜스포머(ViT) 의 출력을 결합하면 스캔에서 이상 징후를 감지하는 데 더 신뢰할 수 있는 예측을 제공하여 오진의 위험을 줄일 수 있습니다.

앙상블은 강력하지만 훈련 및 모델 배포를 위한 복잡성과 계산 요구 사항이 증가합니다. 그러나 중요한 애플리케이션에서는 성능의 상당한 향상으로 이러한 비용을 정당화할 수 있는 경우가 많습니다. Ultralytics HUB와 같은 플랫폼은 여러 모델의 관리와 훈련을 간소화하여 효과적인 앙상블을 쉽게 만들 수 있습니다.

모두 보기