Mô hình Markov ẩn (HMM) là một mô hình thống kê được sử dụng để mô tả các hệ thống chuyển đổi giữa các trạng thái theo thời gian. Trong HMM, trình tự các trạng thái mà hệ thống trải qua không thể quan sát trực tiếp (nó "ẩn"), nhưng có thể suy ra từ trình tự các đầu ra hoặc phát xạ có thể quan sát được do mỗi trạng thái tạo ra. HMM đặc biệt mạnh mẽ để mô hình hóa dữ liệu tuần tự và phân tích chuỗi thời gian trên nhiều miền khác nhau trong Trí tuệ nhân tạo (AI) và Học máy (ML) . Chúng thuộc về một lớp mô hình được gọi là mô hình đồ họa xác suất , cung cấp một khuôn khổ để xử lý sự không chắc chắn trong các hệ thống động.
Các khái niệm cốt lõi
HMM được xác định bởi hai quá trình ngẫu nhiên chính:
- Trạng thái ẩn: Chuỗi trạng thái Markov cơ bản, không thể quan sát được. Hệ thống chuyển đổi giữa các trạng thái ẩn này theo các xác suất cụ thể. Giả định cốt lõi là thuộc tính Markov: xác suất chuyển sang trạng thái tiếp theo chỉ phụ thuộc vào trạng thái hiện tại, không phụ thuộc vào chuỗi trạng thái trước đó.
- Phát xạ quan sát được: Mỗi trạng thái ẩn tạo ra một đầu ra hoặc phát xạ quan sát được dựa trên một phân phối xác suất nhất định. Những phát xạ này là dữ liệu mà chúng ta thực sự quan sát được.
Mô hình được đặc trưng bởi:
- Trạng thái: Một tập hợp hữu hạn các trạng thái ẩn.
- Quan sát: Một tập hợp hữu hạn các phát xạ hoặc quan sát có thể xảy ra.
- Xác suất chuyển đổi: Xác suất chuyển từ trạng thái ẩn này sang trạng thái ẩn khác.
- Xác suất phát xạ: Xác suất quan sát một phát xạ cụ thể khi hệ thống ở trạng thái ẩn cụ thể.
- Phân phối trạng thái ban đầu: Xác suất hệ thống bắt đầu ở mỗi trạng thái ẩn.
Mô hình Markov ẩn hoạt động như thế nào
Làm việc với HMM thường liên quan đến việc giải quyết ba vấn đề cơ bản, thường được giải quyết bằng các thuật toán cụ thể được nêu chi tiết trong các hướng dẫn như của Rabiner :
- Bài toán đánh giá: Với một HMM và một chuỗi quan sát, xác suất các quan sát đó được tạo ra bởi mô hình là bao nhiêu? (Giải bằng thuật toán Forward).
- Bài toán giải mã: Cho một HMM và một chuỗi quan sát, chuỗi trạng thái ẩn có nhiều khả năng tạo ra các quan sát này nhất là gì? (Giải bằng thuật toán Viterbi).
- Bài toán học tập: Với một chuỗi quan sát (hoặc nhiều chuỗi), làm thế nào chúng ta có thể điều chỉnh các tham số HMM (xác suất chuyển tiếp và phát xạ) để giải thích tốt nhất cho dữ liệu quan sát được? (Thường được giải quyết bằng thuật toán Baum-Welch, một ví dụ của thuật toán Expectation-Maximization). Điều này rất quan trọng đối với việc đào tạo mô hình .
Ứng dụng trong thế giới thực
HMM đã được ứng dụng thành công trong nhiều lĩnh vực:
- Nhận dạng giọng nói : Đây là một ứng dụng cổ điển. Các trạng thái ẩn có thể biểu diễn các âm vị (đơn vị cơ bản của âm thanh), trong khi các quan sát là các đặc điểm âm thanh được trích xuất từ tín hiệu giọng nói. HMM giải mã trình tự âm vị có khả năng xảy ra nhất khi có âm thanh, tạo thành cơ sở để nhận dạng các từ. Các công cụ như CMU Sphinx trước đây chủ yếu dựa vào HMM.
- Tin sinh học: HMM được sử dụng rộng rãi để phân tích trình tự. Ví dụ, trong việc tìm kiếm gen, các trạng thái ẩn có thể biểu thị các vùng mã hóa, vùng không mã hóa hoặc các cấu trúc gen cụ thể (như codon bắt đầu, exon, intron). Các quan sát là các cặp bazơ DNA (A, C, G, T). Mô hình giúp xác định vị trí gen trong một trình tự DNA dài. Phần mềm như HMMER sử dụng HMM hồ sơ để phân tích trình tự protein, so sánh các trình tự với các cơ sở dữ liệu như cơ sở dữ liệu Gene NCBI .
- Xử lý ngôn ngữ tự nhiên (NLP) : Được sử dụng cho các tác vụ như gắn thẻ từ loại, trong đó trạng thái ẩn là các thẻ ngữ pháp (danh từ, động từ, tính từ) và quan sát là các từ trong câu. Cũng được áp dụng trong Nhận dạng thực thể có tên (NER) .
- Thị giác máy tính (CV) : Được áp dụng trong nhận dạng cử chỉ, nhận dạng hoạt động từ video và đôi khi được sử dụng trong theo dõi đối tượng , mặc dù thường bị thay thế bởi các phương pháp như Bộ lọc Kalman hoặc phương pháp học sâu.
- Tài chính: Mô hình hóa các chế độ thị trường (ví dụ, thị trường tăng giá so với thị trường giảm giá) như các trạng thái ẩn dựa trên các chỉ số tài chính có thể quan sát được.
- Phân tích hình ảnh y tế : Phân tích chuỗi hình ảnh hoặc tín hiệu y tế theo thời gian.
So sánh với các khái niệm liên quan
Điều quan trọng là phải phân biệt HMM với các mô hình trình tự khác:
Trong khi các phương pháp học sâu mới hơn thường đạt được kết quả tiên tiến, HMM vẫn có giá trị vì khả năng diễn giải (trạng thái và xác suất rõ ràng) và hiệu quả, đặc biệt là khi dữ liệu đào tạo bị hạn chế hoặc kiến thức về miền có thể được kết hợp vào cấu trúc mô hình. Hiểu các khái niệm cơ bản như HMM cung cấp bối cảnh có giá trị trong bối cảnh ML rộng hơn, ngay cả khi sử dụng các nền tảng như Ultralytics HUB, chủ yếu tạo điều kiện thuận lợi cho việc phát triển và triển khai các mô hình DL như YOLOv8 hoặc YOLO11 .