용어집

머신 러닝 운영(MLOps)

ML 모델 배포 간소화, 워크플로 자동화, 안정성 보장, AI 성공의 효율적 확장 등 MLOps의 강력한 기능을 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

머신 러닝 운영(MLOps)은 프로덕션 환경에서 머신 러닝(ML) 모델을 안정적이고 효율적으로 배포하고 유지 관리하는 것을 목표로 하는 일련의 관행입니다. 데브옵스 원칙에서 영감을 얻은 MLOps는 모델 개발(데이터 과학자, ML 엔지니어)과 IT 운영(운영 엔지니어) 간의 격차를 해소하여 데이터 수집부터 모델 배포 및 모니터링에 이르는 전체 ML 수명 주기를 간소화합니다. 목표는 프로세스를 자동화하고 표준화하여 더 빠른 실험, 더 안정적인 배포, 프로덕션 환경에서의 ML 시스템의 지속적인 개선을 가능하게 하는 것입니다.

MLOps의 핵심 원칙

MLOps는 ML 시스템의 고유한 복잡성을 관리하기 위해 설계된 몇 가지 핵심 원칙을 기반으로 구축되었습니다:

  • 자동화: ML에 적합한 지속적 통합/지속 배포(CI/CD) 파이프라인을 사용하여 데이터 준비, 모델 학습, 유효성 검사 및 배포와 같은 반복적인 작업을 자동화합니다.
  • 협업: 협업: ML 수명 주기 전반에 걸쳐 데이터 과학, 소프트웨어 엔지니어링, 운영 팀 간의 커뮤니케이션과 협업을 촉진합니다.
  • 버전 관리: 재현성과 추적성을 보장하기 위해 데이터, 코드 및 모델에 대한 버전 관리를 구현합니다. DVC와 같은 도구는 종종 Git과 함께 사용됩니다.
  • 모델 모니터링: 프로덕션 환경에서 모델 성능, 데이터 품질 및 운영 상태를 지속적으로 추적하여 데이터 드리프트 또는 성능 저하와 같은 문제를 감지합니다.
  • 거버넌스 및 규정 준수: 모델이 데이터 프라이버시 및 보안에 관한 규제 요건, 윤리 지침(AI 윤리), 조직 정책을 충족하는지 확인합니다.

MLOps 수명 주기

MLOps 라이프사이클은 ML 모델의 전체 여정을 포괄합니다:

  1. 데이터 관리: 데이터 집합 수집, 유효성 검사, 정리(데이터 정리) 및 버전 관리(데이터 레이블 지정 및 준비 가이드는 Ultralytics 문서에서 찾을 수 있음).
  2. 모델 개발: 다양한 알고리즘, 기능 엔지니어링 및 아키텍처를 실험하며, 종종 다음과 같은 프레임워크를 사용합니다. PyTorch 또는 TensorFlow.
  3. 모델 트레이닝: 대규모 모델 훈련, 잠재적으로 분산 훈련을 사용하고 다음과 같은 도구로 실험을 관리할 수 있습니다. Weights & Biases 또는 MLflow와 같은 도구를 사용하여 실험을 관리합니다. 하이퍼파라미터 튜닝은 종종 자동화됩니다.
  4. 모델 유효성 검사: 유효성 검사 데이터에 대한 정확도 또는 맵과 같은 메트릭을 사용하여 모델 성능을 평가합니다.
  5. 모델 배포: 패키징( Docker를 사용한컨테이너화) 및 프로덕션 환경에 모델 배포(잠재적으로 Kubernetes와 같은 오케스트레이션 플랫폼 사용).
  6. 모델 모니터링 및 재교육: 실시간 성능을 추적하고, 드리프트 또는 감쇠를 감지하고, 필요한 경우 재교육 파이프라인을 트리거합니다. 여기서 관찰 가능성은 중요한 역할을 합니다.

MLOps와 관련 개념 비교

  • 자동화된 머신 러닝(AutoML)은 특히 모델 구축 단계(데이터 준비, 기능 엔지니어링, 모델 선택, 하이퍼파라미터 튜닝)를 자동화하는 데 중점을 둡니다. AutoML 도구는 MLOps 워크플로우 내의 구성 요소가 될 수 있습니다.
  • MLOps와 통합 가시성 비교: 통합 가시 성은 MLOps 전략에서 매우 중요한 역량입니다. 이는 배포된 ML 시스템의 내부 상태와 동작을 이해하는 데 필요한 도구와 관행(로깅, 메트릭, 추적)을 제공하여 효과적인 모니터링과 문제 해결을 가능하게 합니다.

실제 애플리케이션

MLOps 관행은 프로덕션에서 복잡한 ML 시스템을 관리하는 데 필수적입니다:

  1. 추천 시스템: 넷플릭스나 스포티파이 같은 기업들은 MLOps를 사용하여 새로운 사용자 상호작용 데이터를 기반으로 추천 모델을 지속적으로 재학습하고, 다양한 모델 버전을 A/B 테스트하고, 참여 지표를 모니터링하고, 실적이 저조한 모델을 신속하게 롤백합니다. 이를 통해 추천이 관련성 있고 개인화된 상태를 유지할 수 있습니다.
  2. 사기 탐지: 금융 기관은 사기 탐지 모델을 관리하기 위해 MLOps 파이프라인을 배포합니다. 여기에는 거래 데이터의 변동 모니터링, 새로운 사기 패턴으로 모델 자동 재교육, 실시간 탐지를 위한 짧은 추론 지연 시간 보장, 규제 준수를 위한 감사 추적 유지 등이 포함됩니다. Ultralytics YOLO 모델은 사기 탐지에 사용될 수 있는 시각적 검사 시스템에 사용될 때 배포 및 모니터링을 위한 MLOps의 이점도 누릴 수 있습니다.

도구 및 플랫폼

다양한 도구가 MLOps 라이프사이클의 여러 단계를 지원합니다:

MLOps 원칙을 구현하면 조직이 AI 시스템을 보다 효과적으로 구축, 배포 및 관리하여 실험적 연구와 안정적인 프로덕션 애플리케이션 간의 격차를 해소하는 데 도움이 됩니다.

모두 보기