用語集

隠れマルコフモデル(HMM)

隠れマルコフモデル(HMM)の原理、音声認識、バイオインフォマティクス、AIへの応用、隠れ状態の推測方法についてご紹介します。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

隠れマルコフモデル(HMM)は、時間の経過とともに状態間を遷移するシステムを記述するために使用される統計モデルであり、状態のシーケンスは直接観測できない(「隠れ」ている)が、観測可能な出力または排出のシーケンスから推測することができる。HMMは、人工知能(AI)機械学習(ML)の様々な領域において、シーケンシャルなデータや時系列をモデル化するために特に強力である。HMMは、確率的グラフィカル・モデルとして知られるモデルの一群に属する。

コア・コンセプト

HMMは主に2つの要素で定義される:

  1. 隠された状態:システムが取りうる観測不可能な状態の集合。プロセスはある確率に従ってこれらの状態間を遷移する。中核となる仮定はマルコフ特性である。次の状態に遷移する確率は、その前の一連の状態には依存せず、現在の状態にのみ依存する。
  2. 観測(放出):各隠れステートによって確率的に生成または「放出」される観測可能な出力またはシンボルのセット。特定のオブザベーションを放出する確率は、現在の隠れた状態にのみ依存する。

このモデルの特徴は

  • 遷移確率:ある隠れた状態から別の状態に移行する可能性。
  • 放出確率:システムが特定の隠れた状態にあるとき、特定の出力を観測する可能性。
  • 初期状態確率:システムが各隠れ状態で始まる可能性。

隠れマルコフモデルの仕組み

HMMを扱うには、一般的に3つの基本的な問題を解決する必要があり、多くの場合、[Rabinerのようなチュートリアル](https://web.ece.ucsb.edu/Faculty/Rabiner/ece259/Reprints/tutorial on hmm and applications.pdf)に詳述されている特定のアルゴリズムによって対処される:

  1. 尤度:モデルのパラメータが与えられたときに、観測されたシーケンスの確率を計算すること。これは、モデルがどの程度データに適合しているかを評価するのに役立つ。
  2. 復号:与えられた観測シーケンスを生成した隠された状態の最も可能性の高いシーケンスを見つける(多くの場合、ビタビアルゴリズムを使用)。
  3. 学習:観測されたシーケンスの集合からモデルパラメータ(遷移確率、放出確率、初期確率)を推定する(多くの場合、期待値最大化の一種であるBaum-Welchアルゴリズムを使用)。

実世界での応用

HMMは多くの分野で応用され、成功を収めている:

  1. 音声認識:隠れ状態は音素(音の基本単位)を表すことができ、観測は音声信号から抽出された音響特徴である。HMMは、音素がどのように遷移し、音を生成するかをモデル化し、CMU Sphinxのようなシステムが話し言葉をテキストに変換することを可能にします。これは、自然言語処理(NLP)の古典的なアプリケーションです。音声認識についてもっと知る。
  2. バイオインフォマティクス(遺伝子探索):隠れ状態はDNAの機能領域(例えば、コーディングエクソン、ノンコーディングイントロン)を表すことができ、オブザベーションはDNAの塩基対(A、C、G、T)である。HMMは長いDNA配列内の遺伝子構造を特定するのに役立ち、HMMERのようなツールで利用され、NCBI遺伝子データベースのようなリソースに貢献している。これは、パターン認識が鍵となる医療画像解析におけるより広範な応用と関連している。

その他の用途としては、自然言語処理における品詞タグ付け、コンピュータビジョンにおけるジェスチャー認識、金融時系列分析などがある。

関連概念との比較

HMMを他の配列モデルと区別することは重要だ:

  • マルコフ決定過程(MDP):どちらも状態と遷移を含むが、HMMは観測から隠れた状態を推測することに重点を置く。対照的に、MDPは 強化学習(RL)で使用され、状態が一般的に観測可能で、最適な方針(一連の行動)を見つけることが目標である意思決定プロセスをモデル化します。RLの基礎については、DeepMindの入門資料などを参照してください。
  • リカレント・ニューラル・ネットワーク(RNN):HMMとRNNLSTMのような変種を含む)はどちらもシーケンシャルなデータをモデル化する。しかし、HMMは、事前に定義された構造に基づいて、明示的で解釈可能な状態と遷移を持つ確率モデルである。ディープラーニング(DL)の一部であるRNNは、ネットワーク接続を通じて暗黙的な状態表現を学習し、複雑なパターンに対してより強力であることが多いが、解釈可能性は低い。LSTMを理解することで、RNNのメカニズムに対する洞察が得られる。以下のようなモデル Ultralytics YOLOのようなモデルは、オブジェクト追跡のようなタスクにDLを活用する。

新しいディープラーニング手法が最先端の結果を達成することが多い一方で、HMMは、特にデータが限られている場合やドメイン知識をモデル構造に組み込むことができる場合に、その解釈可能性と有効性の点で依然として価値があります。Ultralytics HUBのようなツールやプラットフォームは、しばしばDLモデルに焦点を当てますが、HMMのような基礎的な概念を理解することは、より広いMLの状況において貴重なコンテキストを提供します。

すべて読む