Ultralytics YOLO のようなAI/MLシステムを観測可能性がどのように強化するかをご覧ください。実世界のアプリケーションにおいて、洞察力を獲得し、パフォーマンスを最適化し、信頼性を確保します。
特に人工知能(AI)や機械学習(ML)のダイナミックな分野では不可欠です。Ultralytics YOLOような洗練されたモデルを扱うユーザーにとって、外部出力を通してデプロイされたアプリケーションの内部状態を理解することは、信頼性を維持し、パフォーマンスを最適化し、信頼性を確保するための鍵となります。
観測可能性とは、ログ、メトリクス、トレースなどの出力を調べることによって、システムの内部状態を測定し、理解する機能のことです。一般的に、事前に定義されたダッシュボードや既知の障害モード(CPU 使用率やエラー率など)に焦点を当てる従来のモニタリングとは異なり、観測可能性によって、チームはシステムの挙動をプロアクティブに探索し、開発中に予期しなかったような新しい問題を診断することができる。MLOpsのコンテキストでは、MLモデルの開発とデプロイの反復的な性質にとって重要な、システムが特定の方法で動作している理由について、より深い質問をすることができます。
ディープラーニング・モデルは複雑で、しばしば「ブラックボックス」的な性質を持つため、観測可能性が不可欠となる。主な理由は以下の通り:
関連はあるが、観測可能性とモニタリングは範囲と目的が異なる。モニタリングは、既知のベンチマークに照らしてシステムの健全性を追跡するために、事前に定義されたメトリクスに関するデータを収集・分析する。しかし、観測可能性は、データ出力(ログ、メトリクス、トレース-しばしば「観測可能性の3本柱」と呼ばれる)を使用して、より深い探索的分析を可能にし、システム状態、特に予期しない状態の背後にある「理由」を理解できるようにします。モニタリングとはダッシュボードを見ることであり、観測可能性とはダッシュボードやその他の場所に表示された異常を調査するツールを持つことである。
観測可能性を実装するには、多くの場合、様々なツールを統合する必要がある。Datadog、Grafana、Prometheusのような汎用プラットフォームは、メトリクスとログの収集と可視化に広く使われている。OpenTelemetryのような標準規格は、アプリケーションがトレースデータを生成するのに役立つ。MLの分野では Weights & BiasesやMLflow、Ultralytics HUBのようなプラットフォームは、実験を追跡し、モデルのパフォーマンスを監視し、MLのライフサイクルを管理するための特別な機能を提供し、モデルの監視と保守のための重要な観測可能性の原則を組み込んでいる。