用語集

機械学習オペレーション(MLOps)

MLモデルのデプロイを合理化し、ワークフローを自動化し、信頼性を確保し、AIの成功を効率的に拡大するMLOpsのパワーをご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

Machine Learning Operations(MLOps)は、機械学習(ML)モデルを本番環境に確実かつ効率的にデプロイし、維持することを目的としたプラクティスのセットです。DevOpsの原則から着想を得たMLOpsは、モデル開発(データサイエンティスト、MLエンジニア)とIT運用(Opsエンジニア)のギャップを埋め、データ収集からモデルのデプロイ、監視に至るMLのライフサイクル全体を効率化する。その目的は、プロセスを自動化・標準化し、より迅速な実験、より信頼性の高いデプロイ、本番環境におけるMLシステムの継続的な改善を可能にすることです。

MLOpsの基本原則

MLOpsは、MLシステム特有の複雑さを管理するために設計された、いくつかの重要な原則に基づいて構築されている:

  • 自動化: 継続的インテグレーション/継続的デプロイメント(CI/CD)パイプラインを使用して、データ準備、モデルトレーニング、検証、デプロイメントのような反復タスクを自動化する。
  • コラボレーションMLのライフサイクルを通じて、データサイエンス、ソフトウェアエンジニアリング、オペレーションチーム間のコミュニケーションとコラボレーションを促進する。
  • バージョン管理:再現性とトレーサビリティを確保するために、データ、コード、モデルのバージョン管理を行うこと。DVCのようなツールは、Gitと一緒に使われることが多い。
  • モデルのモニタリングモデルのパフォーマンス、データ品質、運用の健全性を継続的に追跡し、データ・ドリフトやパフォーマンス低下などの問題を検出します。
  • ガバナンスとコンプライアンス:モデルが規制要件、倫理ガイドライン(AI倫理)、データプライバシーとセキュリティに関する組織のポリシーを満たしていることを確認する。

MLOpsのライフサイクル

MLOpsのライフサイクルは、MLモデルの全行程を網羅する:

  1. データ管理:データセットの取り込み、検証、クリーニング(データクリーニング)、バージョン管理(データラベリングと準備ガイドはUltralytics Docsにあります)。
  2. モデル開発:さまざまなアルゴリズム、フィーチャーエンジニアリング、アーキテクチャの実験。 PyTorchまたは TensorFlow.
  3. モデルのトレーニング: 分散トレーニングを使用する可能性があり、以下のようなツールで実験を管理します。 Weights & BiasesMLflowのようなツールで実験を管理する。ハイパーパラメータのチューニングは自動化されていることが多い。
  4. モデルの検証: 検証データに対する 精度や mAPのような測定基準を用いてモデルの性能を評価する。
  5. モデルのデプロイメントパッケージング Dockerによるコンテナ化)と、Kubernetesのようなオーケストレーションプラットフォームを使用する可能性のある、本番環境へのモデルのデプロイ。
  6. モデルのモニタリングと再トレーニング:ライブパフォーマンスを追跡し、ドリフトや減衰を検出し、必要に応じて再トレーニングパイプラインを起動します。ここでは観測可能性が重要な役割を果たします。

MLOpsと関連概念

  • MLOpsとAutoMLの比較:MLOpsがエンドツーエンドのライフサイクル管理全体をカバーするのに対し、自動機械学習(AutoML)は特にモデル構築ステップ(データ準備、フィーチャーエンジニアリング、モデル選択、ハイパーパラメータチューニング)の自動化に重点を置いている。AutoMLツールはMLOpsワークフロー内のコンポーネントとなり得ます。
  • MLOps対観測可能性: ObservabilityはMLOps戦略において重要な能力である。これは、デプロイされたMLシステムの内部状態と動作を理解するために必要なツールとプラクティス(ロギング、メトリクス、トレース)を提供し、効果的なモニタリングとトラブルシューティングを可能にする。

実世界での応用

MLOpsのプラクティスは、複雑なMLシステムをプロダクションで管理するために不可欠である:

  1. レコメンデーションシステム:NetflixやSpotifyのような企業は、MLOpsを使用して、新しいユーザーインタラクションデータに基づいてレコメンデーションモデルを継続的に再トレーニングし、異なるモデルのバージョンをA/Bテストし、エンゲージメントメトリクスを監視し、パフォーマンスの低いモデルを迅速にロールバックする。これにより、レコメンデーションは常に適切でパーソナライズされたものになる。
  2. 不正検知:金融機関はMLOpsパイプラインを導入し、不正検知モデルを管理する。これには、トランザクションデータのドリフト監視、新しい不正パターンによるモデルの自動再トレーニング、リアルタイム検知のための低推論レイテンシーの確保、規制遵守のための監査証跡の管理が含まれます。 Ultralytics YOLOモデルは、不正検出につながる可能性のある目視検査システムで使用される場合も、デプロイとモニタリングのためのMLOpsの恩恵を受ける。

ツールとプラットフォーム

さまざまなツールが、MLOpsのライフサイクルのさまざまな段階をサポートしている:

MLOpsの原則を導入することで、組織はAIシステムをより効果的に構築、デプロイ、管理することができ、実験的研究と信頼性の高いプロダクション・アプリケーションのギャップを埋めることができる。

すべて読む