术语表

隐马尔可夫模型(HMM)

了解隐马尔可夫模型(HMM)、其原理、在语音识别、生物信息学和人工智能中的应用,以及它们如何推断隐藏状态。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

隐马尔可夫模型(HMM)是机器学习中的一种统计模型,用于描述随时间演变的系统。想象一下,在一个系统中,您可以观察到某些输出,但驱动这些输出的基本状态是隐藏的。HMM 可以根据观察到的输出序列推断出这些隐藏状态。这使得它们在数据是连续的、系统的真实状态无法直接观察到的情况下特别有用。

隐马尔可夫模型的核心概念

HMM 的核心是两个关键部分:隐藏状态观测值。隐藏状态是影响系统行为的不可观测因素。可以将其视为无法直接测量的内部运作或条件。另一方面,观测点是我们可以实际看到或测量的数据点,这些数据点与隐藏状态存在概率联系。

HMM 有两个基本假设:

  • 马尔可夫假设:当前的隐藏状态只取决于之前的隐藏状态,而不是整个历史状态。这种 "无记忆 "特性简化了模型,使计算变得可行。例如,在使用 HMM 进行天气预测时,今天的天气(隐藏状态)只取决于昨天的天气,而不是一周前的天气。
  • 观测独立假设:当前的观察结果只取决于当前的隐藏状态,与过去的隐藏状态和给定当前隐藏状态的过去观察结果无关。继续以天气为例,今天是否下雨(观察结果)只取决于今天的天气状态(隐藏状态,如 "下雨"、"晴天"),而与昨天的天气状态无关。

有了这些假设,我们就可以使用一些关键的概率分布来定义 HMM:

  • 转换概率:这些概率定义了从一个隐藏状态转换到另一个隐藏状态的可能性。例如,在我们的天气示例中,从 "晴天 "状态过渡到 "多云 "状态的概率。
  • 发射概率:这些概率定义了在隐藏状态下观察到特定输出的可能性。例如,当隐藏状态为 "下雨 "时,观察到 "下雨 "的概率。
  • 初始状态概率:这些参数定义了序列开始时每个可能隐藏状态的起始概率。

为了了解系统,HMM 解决了三个主要问题:

  • 评估:给定一个模型和一个观测序列,计算该序列由模型生成的概率。通常使用前向算法来解决这个问题。
  • 解码:给定一个模型和一个观测序列,找出最有可能产生观测结果的隐藏状态序列。维特比算法通常用于此目的。
  • 学习:给定观测序列,学习最能解释观测数据的模型参数(过渡概率、发射概率和初始概率)。为此采用 Baum-Welch 算法(期望最大化的一种形式)。

隐马尔可夫模型在人工智能中的应用

HMM 已成功应用于人工智能的各个领域,尤其是涉及连续数据和隐藏过程的领域。下面是几个突出的例子:

  • 语音识别:HMM 最经典、最成功的应用之一是在语音识别系统中。在语音中,声学信号(观测值)是由语音音素或单词序列(隐藏状态)产生的。HMM 用于模拟音素和声学特征之间的概率关系,使系统能够将口语转录为文本。现代语音识别系统通常使用更复杂的深度学习模型,但 HMM 在这一领域发挥着奠基作用,并且仍在混合方法中使用。
  • 生物信息学HMM 在生物信息学中被广泛用于分析 DNA 和蛋白质序列等生物序列。例如,在基因预测中,可以对 DNA 中的核苷酸序列(观测值)进行建模,以推断基因的基本结构(隐藏状态),如编码区和非编码区。HMM 可以识别这些序列中的模式和主题,帮助了解基因和蛋白质的功能和结构。

除了这些核心应用外,HMM 还可用于以下领域

  • 自然语言处理(NLP):用于语音部分标记等任务,其中句子中的单词是观测值,而底层语法标记则是隐藏状态。您可以进一步了解自然语言处理(NLP)及其在人工智能中的各种应用。
  • 金融建模:用于分析金融时间序列数据,其中观察到的股票价格受隐性市场制度(如牛市、熊市)的影响。时间序列分析是了解数据长期趋势的一个重要方面。
  • 活动识别:在计算机视觉和基于传感器的系统中,HMM 可从传感器读数序列或视频帧中识别人类活动。Ultralytics YOLO 擅长单帧图像的实时物体检测图像分割,而 HMM 则可以增加时间维度来理解动作序列。

虽然诸如递归神经网络(RNN)变换器等较新的技术由于能够捕捉更长距离的依赖关系和处理更复杂的模式而在许多序列建模任务中占据主导地位,但隐马尔可夫模型仍然是一种有价值的工具,尤其是在优先考虑可解释性和计算效率,或者马尔可夫假设是底层系统的合理近似值时。它们为理解连续数据和推断隐藏结构提供了一个概率框架,使其成为机器学习和人工智能领域的基石。

阅读全部