隠れマルコフモデル(HMM)は、時間とともに状態間を遷移するシステムを記述するために使用される統計モデルである。HMMでは、システムが通過する状態のシーケンスは直接観測できない(「隠れた」状態である)が、各状態によって生成される観測可能な出力または排出のシーケンスから推測することができる。HMMは、人工知能(AI)や機械学習(ML)の様々な領域において、逐次データや時系列分析のモデリングに特に強力である。HMMは確率的グラフィカル・モデルとして知られるモデルの一群に属し、動的システムにおける不確実性を扱うためのフレームワークを提供する。
コア・コンセプト
HMMは主に2つの確率(ランダム)過程によって定義される:
- 隠れた状態:観測不可能なマルコフ連鎖。システムは特定の確率に従ってこれらの隠れた状態間を遷移する。核となる仮定はマルコフ特性で、次の状態に遷移する確率は、それ以前の一連の状態には依存せず、現在の状態のみに依存する。
- 観測可能な放出:各隠れ状態は、ある確率分布に基づいて、観測可能な出力または放出を生成する。これらの放出は、我々が実際に観測するデータである。
このモデルの特徴は
- 状態:隠された状態の有限集合。
- 観測:可能な排出または観測の有限の集合。
- 遷移確率:ある隠れた状態から別の状態に移行する確率。
- 放出確率:システムが特定の隠された状態にあるとき、特定の放出が観測される確率。
- 初期状態分布:システムが各隠れ状態から始まる確率。
隠れマルコフモデルの仕組み
HMMを扱うには、通常3つの基本的な問題に取り組む必要があり、多くの場合、ラビナーのようなチュートリアルに詳述されている特定のアルゴリズムを使って取り組む:
- 評価問題:HMMとオブザベーションのシーケンスが与えられたとき,オブザベーションがモデルによって生成された確率は何であるか?(フォワード・アルゴリズムを用いて解く).
- 復号問題:HMMとオブザベーションのシーケンスが与えられたとき、これらのオブザベーションを生成した隠れた状態の最も可能性の高いシーケンスは何か?(ビタビアルゴリズムを用いて解く)。
- 学習問題:オブザベーションのシーケンス(または複数のシーケンス)が与えられたとき、どのようにHMMパラメータ(遷移確率と放出確率)を調整すれば、観察されたデータを最もよく説明できるか?(多くの場合、期待値最大化アルゴリズムのインスタンスであるBaum-Welchアルゴリズムを使って解決される)。これはモデル学習において非常に重要である。
実世界での応用
HMMは多くの分野で応用され、成功を収めている:
- 音声認識:これは古典的なアプリケーションである。隠れ状態は音素(音の基本単位)を表し、観測は音声信号から抽出された音響特徴である。HMMは、音声から最も可能性の高い音素列を解読し、単語認識の基礎を形成する。CMU Sphinxのようなツールは、歴史的にHMMに大きく依存しています。
- バイオインフォマティクスHMMは配列解析に広く使われている。例えば、遺伝子の発見では、隠れた状態はコード領域、非コード領域、または特定の遺伝子構造(開始コドン、エクソン、イントロンなど)を表すかもしれない。オブザベーションはDNA塩基対(A, C, G, T)である。このモデルは長いDNA配列内の遺伝子位置を特定するのに役立つ。HMMERのようなソフトウェアは、プロファイルHMMをタンパク質配列解析に使用し、NCBI遺伝子データベースのようなデータベースと配列を比較する。
- 自然言語処理(NLP):品詞タグ付けのようなタスクに使用され、隠れた状態は文法タグ(名詞、動詞、形容詞)であり、観測は文中の単語である。固有表現認識(NER)にも応用される。
- コンピュータビジョン(CV):ジェスチャー認識、ビデオからのアクティビティ認識、時には歴史的にオブジェクトトラッキングに応用されてきたが、カルマンフィルターやディープラーニングアプローチのような手法に取って代わられることも多い。
- ファイナンス観測可能な金融指標に基づく隠れた状態としての市場レジーム(強気市場対弱気市場など)のモデル化。
- 医用画像解析:医療画像や信号のシーケンスを経時的に分析する。
関連概念との比較
HMMを他の配列モデルと区別することは重要だ:
新しいディープラーニング手法が最先端の結果を達成することが多い一方で、HMMはその解釈可能性(明示的な状態と確率)と有効性、特にトレーニングデータが限られている場合やドメイン知識をモデル構造に組み込むことができる場合に、依然として価値があります。HMMのような基礎概念を理解することは、Ultralytics HUBのようなDLモデルの開発とデプロイを主に促進するプラットフォームを使用する場合でも、より広範なMLランドスケープにおける貴重なコンテキストを提供します。 YOLOv8や YOLO11.