用語集

モデル・モニタリング

AIの精度を確保し、データドリフトを検出し、ダイナミックな実環境における信頼性を維持するためのモデルモニタリングの重要性をご覧ください。

モデルモニタリングとは、機械学習（ML）モデルが本番環境にデプロイされた後、そのパフォーマンスを追跡・評価する継続的なプロセスです。これには、モデルの精度、運用の健全性、およびデータ特性に関連する主要なメトリクスを観察し、モデルが長期にわたって期待どおりに動作することを確認することが含まれます。この実践は、機械学習運用（MLOps）ライフサイクルの重要な部分であり、デプロイされた人工知能（AI）システムが実環境で信頼性、有効性、および信頼性を維持することを保証します。モニタリングがなければ、モデルのパフォーマンスは無言のうちに低下し、予測精度の低下やビジネス上のマイナスの結果につながる可能性があります。

なぜモデル・モニタリングが重要なのか？

MLモデルは過去のデータに基づいてトレーニングされるが、現実の世界はダイナミックだ。データ・パターン、ユーザー行動、環境の変化は、デプロイ後にモデルのパフォーマンスを低下させる原因になり得る。モニタリングの主な理由は以下の通りです：

性能劣化の検出：モデルは時間の経過とともに精度が低下することがあります。モニタリングは、精度、リコール、F1スコアなどのパフォーマンス指標の低下を特定するのに役立ちます。YOLO パフォーマンス・メトリクスについては、ガイドをご覧ください。
データ・ドリフトの特定入力データの統計的特性が変化することがあり、これはデータ・ドリフトとして知られる現象である。これはデータドリフトとして知られる現象である。これは、モデルが本番で目にするデータがトレーニングデータと大きく異なる場合に起こり得る。入力特徴を監視することは、このようなシフトを検出するのに役立ちます。
コンセプトドリフトを発見する：入力特徴とターゲット変数の関係は、時間とともに変化することがある（コンセプトドリフト）。例えば、顧客の嗜好が進化し、古い予測パターンが時代遅れになるかもしれない。コンセプト・ドリフトはモデルの再トレーニングや適応を必要とする。
運用の健全性の確保：モニタリングは、推論レイテンシー、スループット、エラー率などの運用指標を追跡し、モデル提供インフラ（モデルサービング）が円滑に稼動していることを確認します。
公平性と倫理の維持：モニタリングは、異なる人口統計グループまたはデータセグメントにわたるパフォーマンスを追跡することにより、AIの偏りを検出し緩和するのに役立ち、AIの倫理を促進する。

どのような側面が監視されるのか？

効果的なモデル・モニタリングには、通常、いくつかのカテゴリーのメトリクスを追跡する必要がある：

予測パフォーマンス：精度、平均平均精度（mAP）、AUC、エラー率などの指標で、多くの場合、検証中に確立されたベンチマークと比較される。
データの品質と完全性：入力データの欠損値、データタイプの不一致、範囲違反の追跡。
入力データのドリフト：生産入力特徴の分布をトレーニングデータ分布と比較するための統計的尺度（母集団安定指数、コルモゴロフ・スミルノフ検定など）。
予測／出力ドリフト：モデル予測値の分布を監視し、有意なシフトを検出する。
運用指標：システムレベルのメトリクス CPU/GPU使用率、メモリ使用量、リクエストレイテンシー、スループットなどのシステムレベルのメトリクス。Prometheusのようなプラットフォームがよく使われます。
公平性とバイアスメトリクス：人口統計学的パリティや均等化オッズのような指標を用いて、敏感な属性（年齢、性別、民族性など）間のモデル性能の格差を評価する。