用語集

隠れマルコフモデル(HMM)

隠れマルコフモデル(HMM)の原理、音声認識、バイオインフォマティクス、AIへの応用、隠れ状態の推測方法についてご紹介します。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

隠れマルコフモデル(HMM)は機械学習で使われる統計モデルの一種で、時間とともに進化するシステムを記述するために使われる。ある出力を観測することはできるが、その出力を駆動している根本的な状態は隠されているシステムを想像してほしい。HMMは、観測された出力のシーケンスに基づいて、これらの隠された状態を推測するように設計されている。このため、データが逐次的で、システムの真の状態が直接観測できないようなシナリオで特に有用である。

隠れマルコフモデルの中核概念

HMMの中心には、2つの重要なコンポーネントがある:隠れた状態と観測である。隠れた状態とは、システムの動作に影響を与える観測不可能な要因のことである。これらは、直接測定されない内部的な働きや条件だと考えてほしい。一方、オブザベーションは、我々が実際に見たり測定したりできるデータポイントで、隠れた状態と確率的にリンクしている。

HMMは2つの基本的な仮定の下で動作する:

  • マルコフ仮定:現在の隠れた状態は前の隠れた状態にのみ依存し、状態の履歴全体には依存しない。この "メモリーレス "の特性はモデルを単純化し、計算を実行可能にする。例えば、HMMを使った天気予報では、今日の天気(隠れた状態)は昨日の天気にのみ依存し、1週間前の天気には依存しない。
  • 観測の独立性の仮定:現在の観測は現在の隠れた状態のみに依存し、過去の隠れた状態や、現在の隠れた状態を与えられた過去の観測とは独立である。天気の例を続けると、今日雨が降っているかどうか(観測)は今日の天候状態(隠れた状態、例えば「雨」「晴れ」)にのみ依存し、昨日の天候状態には依存しない。

これらの仮定により、いくつかの重要な確率分布を使ってHMMを定義することができる:

  • 遷移確率:これらの確率は、ある隠れた状態から別の状態に移行する可能性を定義する。例えば、天気の例では、「晴れ」の状態から「曇り」の状態に遷移する確率である。
  • 放出確率:これらの確率は、隠れた状態が与えられたときに特定の出力を観測する可能性を定義する。例えば、隠れた状態が「雨」のときに「雨」を観測する確率。
  • 初期状態の確率:これは、シーケンスの最初に起こりうる隠れ状態のそれぞれで開始する確率を定義する。

システムを理解するために、HMMは主に3つの問題を解決する:

  • 評価モデルと観測シーケンスが与えられたとき、そのシーケンスがモデルによって生成される確率を計算する。これはしばしばフォワード・アルゴリズムを用いて解かれる。
  • デコーディング:モデルと観測シーケンスが与えられたとき、観測を生成した隠された状態の最も可能性の高いシーケンスを見つける。これにはビタビアルゴリズムがよく使われる。
  • 学習:観測シーケンスが与えられたとき、観測データを最もよく説明するモデルパラメータ(遷移、放出、初期確率)を学習する。Baum-Welchアルゴリズム(Expectation-Maximizationの一種)がこの目的に使用される。

AIにおける隠れマルコフモデルの応用

HMMは人工知能の様々な分野、特に逐次的なデータや隠れたプロセスが関係する分野でうまく適用されてきた。以下はその顕著な例である:

  • 音声認識HMMの最も古典的で成功した応用例の1つは音声認識システムである。音声では、発話された音素または単語のシーケンス(隠れた状態)によって音響信号(観測値)が生成される。HMMは、音素と音響特徴間の確率的関係をモデル化するために使用され、これによってシステムは話し言葉をテキストに書き起こすことができる。現代の音声認識システムは、より複雑なディープラーニングモデルを使用することが多いが、HMMはこの分野で基礎的な役割を果たし、現在でもハイブリッドアプローチで使用されている。
  • バイオインフォマティクスHMMはバイオインフォマティクスにおいて、DNAやタンパク質配列などの生物学的配列の解析に広く用いられている。例えば、遺伝子予測では、DNA中のヌクレオチドの配列(オブザベーション)をモデル化して、コード領域や非コード領域などの遺伝子の基礎となる構造(隠れた状態)を推測することができる。HMMはこれらの配列のパターンやモチーフを特定することができ、遺伝子やタンパク質の機能や構造の理解に役立つ。

このようなコアな用途の他にも、HMMは様々な用途に使われている:

  • 自然言語処理(NLP):品詞タグ付けのようなタスクのために、文中の単語は観察であり、基礎となる文法タグは隠された状態である。自然言語処理(NLP)とAIにおけるその多様なアプリケーションについて、さらに詳しく調べることができます。
  • 金融モデリング:観測された株価が隠れた市場レジーム(例:強気市場、弱気市場)の影響を受けている金融時系列データの分析用。時系列分析は、時間の経過に伴うデータの傾向を理解する上で極めて重要な側面である。
  • 活動認識:コンピュータビジョンやセンサーベースのシステムにおいて、HMMはセンサーの読み取り値やビデオフレームのシーケンスから人間の活動を認識することができる。Ultralytics YOLO が個々のフレームにおけるリアルタイムの物体検出や 画像セグメンテーションに優れているのに対し、HMMは一連の行動を理解するために時間的な次元を加えることができる。

リカレントニューラルネットワーク(RNN)やトランスフォーマーのような新しい技術は、より長距離の依存関係を捕捉し、より複雑なパターンを扱うことができるため、現在では多くのシーケンスモデリング作業において支配的であるが、隠れマルコフモデルは、特に解釈可能性と計算効率が優先される場合や、マルコフ仮定が基礎となるシステムの合理的な近似である場合には、依然として貴重なツールである。隠れマルコフモデルは、逐次的なデータを理解し、隠れた構造を推測するための確率的な枠組みを提供し、機械学習や人工知能の分野における基礎となっている。

すべて読む