Thuật ngữ

Mô hình Markov ẩn (HMM)

Khám phá Mô hình Markov ẩn (HMM), nguyên lý, ứng dụng của chúng trong nhận dạng giọng nói, tin sinh học và AI, cũng như cách chúng suy ra trạng thái ẩn.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Mô hình Markov ẩn (HMM) là một loại mô hình thống kê được sử dụng trong học máy để mô tả các hệ thống phát triển theo thời gian. Hãy tưởng tượng một hệ thống mà bạn có thể quan sát một số đầu ra nhất định, nhưng các trạng thái cơ bản thúc đẩy các đầu ra này bị ẩn. HMM được thiết kế để suy ra các trạng thái ẩn này dựa trên trình tự các đầu ra được quan sát. Điều này làm cho chúng đặc biệt hữu ích trong các tình huống mà dữ liệu là tuần tự và trạng thái thực sự của hệ thống không thể quan sát trực tiếp.

Các khái niệm cốt lõi của mô hình Markov ẩn

Trọng tâm của HMM là hai thành phần chính: trạng thái ẩnquan sát . Trạng thái ẩn là các yếu tố không thể quan sát được ảnh hưởng đến hành vi của hệ thống. Hãy coi chúng là hoạt động bên trong hoặc các điều kiện không được đo lường trực tiếp. Mặt khác, quan sát là các điểm dữ liệu mà chúng ta thực sự có thể nhìn thấy hoặc đo lường, có liên kết xác suất với các trạng thái ẩn.

HMM hoạt động theo hai giả định cơ bản:

  • Giả định Markov : Trạng thái ẩn hiện tại chỉ phụ thuộc vào trạng thái ẩn trước đó, không phụ thuộc vào toàn bộ lịch sử của các trạng thái. Thuộc tính "không nhớ" này đơn giản hóa mô hình và làm cho việc tính toán trở nên khả thi. Ví dụ, trong dự báo thời tiết sử dụng HMM, thời tiết hôm nay (trạng thái ẩn) chỉ phụ thuộc vào thời tiết hôm qua, không phụ thuộc vào thời tiết của một tuần trước.
  • Giả định quan sát độc lập : Quan sát hiện tại chỉ phụ thuộc vào trạng thái ẩn hiện tại và độc lập với các trạng thái ẩn trước đó và các quan sát trước đó dựa trên trạng thái ẩn hiện tại. Tiếp tục ví dụ về thời tiết, việc bạn thấy mưa hôm nay (quan sát) chỉ phụ thuộc vào trạng thái thời tiết hôm nay (trạng thái ẩn, ví dụ: 'mưa', 'nắng'), chứ không phụ thuộc vào trạng thái thời tiết hôm qua.

Những giả định này cho phép chúng ta xác định HMM bằng cách sử dụng một số phân phối xác suất chính:

  • Xác suất chuyển đổi : Các xác suất này xác định khả năng chuyển từ trạng thái ẩn này sang trạng thái ẩn khác. Ví dụ, xác suất chuyển từ trạng thái "nắng" sang trạng thái "mây" trong ví dụ thời tiết của chúng ta.
  • Xác suất phát xạ : Các xác suất này xác định khả năng quan sát một đầu ra cụ thể khi có trạng thái ẩn. Ví dụ, xác suất quan sát 'mưa' khi trạng thái ẩn là 'mưa'.
  • Xác suất trạng thái ban đầu : Xác định xác suất bắt đầu ở mỗi trạng thái ẩn có thể có ở đầu chuỗi.

Để hiểu hệ thống, HMM giải quyết ba vấn đề chính:

  • Đánh giá : Cho một mô hình và một chuỗi quan sát, hãy tính xác suất chuỗi đó được tạo ra bởi mô hình. Điều này thường được giải quyết bằng thuật toán Forward.
  • Giải mã : Cho một mô hình và một chuỗi quan sát, hãy tìm chuỗi trạng thái ẩn có nhiều khả năng nhất tạo ra các quan sát. Thuật toán Viterbi thường được sử dụng cho mục đích này.
  • Học : Cho một chuỗi quan sát, học các tham số mô hình (chuyển tiếp, phát xạ và xác suất ban đầu) giải thích tốt nhất dữ liệu quan sát được. Thuật toán Baum-Welch (một dạng của Expectation-Maximization) được sử dụng cho mục đích này.

Ứng dụng của mô hình Markov ẩn trong AI

HMM đã được áp dụng thành công trong nhiều lĩnh vực khác nhau trong Trí tuệ nhân tạo, đặc biệt là khi dữ liệu tuần tự và các quy trình ẩn có liên quan. Sau đây là một vài ví dụ nổi bật:

  • Nhận dạng giọng nói : Một trong những ứng dụng cổ điển và thành công nhất của HMM là trong các hệ thống nhận dạng giọng nói . Trong giọng nói, các tín hiệu âm thanh (quan sát) được tạo ra bởi chuỗi các âm vị hoặc từ được nói (trạng thái ẩn). HMM được sử dụng để mô hình hóa các mối quan hệ xác suất giữa các âm vị và các đặc điểm âm thanh, cho phép các hệ thống phiên âm ngôn ngữ nói thành văn bản. Các hệ thống nhận dạng giọng nói hiện đại thường sử dụng các mô hình học sâu phức tạp hơn, nhưng HMM đã đặt nền tảng cho lĩnh vực này và vẫn được sử dụng trong các phương pháp tiếp cận kết hợp.
  • Tin sinh học : HMM được sử dụng rộng rãi trong tin sinh học để phân tích các trình tự sinh học như trình tự DNA và protein. Ví dụ, trong dự đoán gen, trình tự các nucleotide trong DNA (quan sát) có thể được mô hình hóa để suy ra các cấu trúc gen cơ bản (trạng thái ẩn), chẳng hạn như vùng mã hóa và vùng không mã hóa. HMM có thể xác định các mẫu và họa tiết trong các trình tự này, giúp hiểu chức năng và cấu trúc của gen và protein.

Ngoài các ứng dụng cốt lõi này, HMM có thể được tìm thấy trong:

  • Xử lý ngôn ngữ tự nhiên (NLP) : Dành cho các tác vụ như gắn thẻ loại từ, trong đó các từ trong câu là quan sát và các thẻ ngữ pháp cơ bản là trạng thái ẩn. Bạn có thể khám phá thêm về Xử lý ngôn ngữ tự nhiên (NLP) và các ứng dụng đa dạng của nó trong AI.
  • Mô hình tài chính : Để phân tích dữ liệu chuỗi thời gian tài chính, trong đó giá cổ phiếu quan sát được chịu ảnh hưởng của chế độ thị trường ẩn (ví dụ: thị trường tăng giá, thị trường giảm giá). Phân tích chuỗi thời gian là khía cạnh quan trọng để hiểu xu hướng dữ liệu theo thời gian.
  • Nhận dạng hoạt động : Trong hệ thống thị giác máy tính và cảm biến, HMM có thể nhận dạng hoạt động của con người từ chuỗi các chỉ số cảm biến hoặc khung hình video. Trong khi Ultralytics YOLO Nổi trội trong việc phát hiện đối tượng theo thời gian thực và phân đoạn hình ảnh trong từng khung hình, HMM có thể bổ sung thêm chiều thời gian để hiểu chuỗi hành động.

Trong khi các kỹ thuật mới hơn như Mạng nơ-ron hồi quy (RNN)Transformers hiện đang chiếm ưu thế trong nhiều tác vụ mô hình hóa chuỗi do khả năng nắm bắt các phụ thuộc tầm xa hơn và xử lý các mẫu phức tạp hơn, Mô hình Markov ẩn vẫn là một công cụ có giá trị, đặc biệt là khi khả năng diễn giải và hiệu quả tính toán được ưu tiên hoặc khi giả định Markov là một phép xấp xỉ hợp lý của hệ thống cơ bản. Chúng cung cấp một khuôn khổ xác suất để hiểu dữ liệu tuần tự và suy ra các cấu trúc ẩn, khiến chúng trở thành nền tảng trong lĩnh vực học máy và trí tuệ nhân tạo.

Đọc tất cả