Machine Learning Operations(MLOps)は、機械学習(ML)モデルを本番環境に確実かつ効率的にデプロイし、維持することを目的としたプラクティスのセットです。DevOpsの原則から着想を得たMLOpsは、モデル開発(データサイエンティスト、MLエンジニア)とIT運用(Opsエンジニア)のギャップを埋め、データ収集からモデルのデプロイ、監視に至るMLのライフサイクル全体を効率化する。その目的は、プロセスを自動化・標準化し、より迅速な実験、より信頼性の高いデプロイ、本番環境におけるMLシステムの継続的な改善を可能にすることです。
MLOpsの基本原則
MLOpsは、MLシステム特有の複雑さを管理するために設計された、いくつかの重要な原則に基づいて構築されている:
MLOpsと関連概念
- MLOpsとAutoMLの比較:MLOpsがエンドツーエンドのライフサイクル管理全体をカバーするのに対し、自動機械学習(AutoML)は特にモデル構築ステップ(データ準備、フィーチャーエンジニアリング、モデル選択、ハイパーパラメータチューニング)の自動化に重点を置いている。AutoMLツールはMLOpsワークフロー内のコンポーネントとなり得ます。
- MLOps対観測可能性: ObservabilityはMLOps戦略において重要な能力である。これは、デプロイされたMLシステムの内部状態と動作を理解するために必要なツールとプラクティス(ロギング、メトリクス、トレース)を提供し、効果的なモニタリングとトラブルシューティングを可能にする。
実世界での応用
MLOpsのプラクティスは、複雑なMLシステムをプロダクションで管理するために不可欠である:
- レコメンデーションシステム:NetflixやSpotifyのような企業は、MLOpsを使用して、新しいユーザーインタラクションデータに基づいてレコメンデーションモデルを継続的に再トレーニングし、異なるモデルのバージョンをA/Bテストし、エンゲージメントメトリクスを監視し、パフォーマンスの低いモデルを迅速にロールバックする。これにより、レコメンデーションは常に適切でパーソナライズされたものになる。
- 不正検知:金融機関はMLOpsパイプラインを導入し、不正検知モデルを管理する。これには、トランザクションデータのドリフト監視、新しい不正パターンによるモデルの自動再トレーニング、リアルタイム検知のための低推論レイテンシーの確保、規制遵守のための監査証跡の管理が含まれます。 Ultralytics YOLOモデルは、不正検出につながる可能性のある目視検査システムで使用される場合も、デプロイとモニタリングのためのMLOpsの恩恵を受ける。
ツールとプラットフォーム
さまざまなツールが、MLOpsのライフサイクルのさまざまな段階をサポートしている:
MLOpsの原則を導入することで、組織はAIシステムをより効果的に構築、デプロイ、管理することができ、実験的研究と信頼性の高いプロダクション・アプリケーションのギャップを埋めることができる。