자동화된 머신러닝(AutoML)은 머신러닝(ML) 모델 개발과 관련된 시간이 많이 걸리는 반복적인 작업을 자동화하는 프로세스를 말합니다. 데이터 과학자처럼 해당 분야의 전문가가 아닌 개인도 ML 기술에 더 쉽게 접근할 수 있도록 하고, 숙련된 실무자의 개발 프로세스를 가속화하는 것을 목표로 합니다. AutoML 도구와 플랫폼은 ML 파이프라인의 다양한 단계를 자동화하여 사용자가 최소한의 수동 개입으로 고품질 모델을 구축할 수 있도록 지원합니다.
AutoML의 주요 자동화된 작업
AutoML 시스템은 일반적으로 머신러닝 워크플로우의 여러 중요한 단계를 자동화합니다:
- 데이터 전처리: 누락된 값을 처리하고, 특징을 확장하고, 학습 데이터에 필요한 변환을 수행합니다. 이를 통해 데이터가 모델 학습에 적합하도록 합니다. 정규화와 같은 기술은 종종 자동화됩니다.
- 피처 엔지니어링: 기존 기능에서 새 기능을 자동으로 생성하거나 가장 관련성이 높은 기능을 선택하여 모델 성능을 개선하는 작업입니다. 여기에는 피처 엔지니어링 개념에서 다루는 기술이 포함될 수 있습니다.
- 모델 선택: 최적의 알고리즘 선택(예: 의사 결정 트리, 신경망과 같은 Ultralytics YOLO또는 서포트 벡터 머신 등) 주어진 작업과 데이터 세트에 가장 적합한 알고리즘을 선택합니다. AutoML 플랫폼은 종종 다양한 객체 감지 아키텍처 또는 분류 모델을 탐색합니다.
- 하이퍼파라미터 튜닝: 선택한 모델의 구성 설정(하이퍼파라미터)을 최적화하여 최상의 성능을 달성하는 것입니다. 이는 하이퍼파라미터 튜닝 가이드에 자세히 설명되어 있는 중요한 단계입니다.
AutoML의 이점
AutoML을 사용하면 몇 가지 장점이 있습니다:
- 효율성 향상: 반복적인 작업을 자동화하여 ML 모델 개발 및 배포에 필요한 시간을 크게 단축합니다.
- 접근성 향상: ML 전문 지식이 부족한 도메인 전문가와 개발자도 강력한 모델링 기술을 활용할 수 있습니다.
- 향상된 성능: 수동 접근 방식보다 더 넓은 범위의 모델과 하이퍼파라미터를 탐색할 수 있어 잠재적으로 더 정확하고 강력한 모델을 만들 수 있습니다. Ultralytics HUB와 같은 플랫폼은 학습 프로세스를 간소화하여 이러한 효율성에 기여합니다.
- 편향성 감소: 자동화는 AI 모델 선택 및 튜닝에서 인간의 편향성을 완화하는 데 도움이 될 수 있지만, 여전히 신중한 감독이 필요합니다.
실제 애플리케이션
AutoML은 다양한 산업 분야에 적용됩니다:
- 사기 탐지: 금융 기관은 AutoML을 사용하여 거래 데이터에서 다양한 알고리즘과 기능을 자동으로 테스트함으로써 사기 거래를 탐지하는 모델을 신속하게 구축하고 업데이트합니다. 이렇게 하면 수동 모델링보다 탐지율이 향상되고 새로운 사기 패턴에 더 빠르게 적응할 수 있습니다.
- 의료 이미지 분석: 의료 분야에서 AutoML은 엑스레이나 MRI에서 종양이나 이상 징후를 식별하는 등 의료 이미지 분석과 같은 작업을 위한 모델 개발을 지원합니다. AutoML은 복잡한 딥러닝 모델을 최적화하여 정확도를 높일 수 있습니다.
AutoML 도구 및 플랫폼
여러 도구와 플랫폼에서 AutoML 기능을 제공합니다:
AutoML과 MLOps 비교
AutoML은 모델 구축 프로세스(선택, 학습, 튜닝)를 자동화하는 데 중점을 두지만, 머신 러닝 운영(MLOps) 은 배포, 모니터링, 관리, 거버넌스 등 ML 모델의 전체 수명 주기를 포괄합니다. AutoML은 배포 및 모델 모니터링 파이프라인으로 넘기기 전에 초기 모델 생성 단계를 간소화하는 광범위한 MLOps 전략 내의 구성 요소로 간주할 수 있습니다.