Thuật ngữ

Mô hình Markov ẩn (HMM)

Khám phá Mô hình Markov ẩn (HMM), nguyên lý, ứng dụng của chúng trong nhận dạng giọng nói, tin sinh học và AI, cũng như cách chúng suy ra trạng thái ẩn.

Mô hình Markov Ẩn (HMM) là một loại mô hình AI thống kê được sử dụng để phân tích dữ liệu tuần tự, trong đó hệ thống cơ bản được giả định là một quy trình Markov với các trạng thái không quan sát được (ẩn). Ý tưởng cốt lõi là đưa ra suy luận về một chuỗi các trạng thái ẩn dựa trên một chuỗi các đầu ra quan sát được. HMM được xây dựng dựa trên thuộc tính Markov, phát biểu rằng xác suất của một trạng thái trong tương lai chỉ phụ thuộc vào trạng thái hiện tại, chứ không phải toàn bộ lịch sử của các trạng thái. Điều này khiến HMM trở thành một công cụ mạnh mẽ cho các tác vụ trong các lĩnh vực như Xử lý Ngôn ngữ Tự nhiên (NLP) và tin sinh học.

Mô hình Markov ẩn hoạt động như thế nào

HMM bao gồm một số thành phần chính hoạt động cùng nhau để mô hình hóa dữ liệu tuần tự:

Trạng thái ẩn: Đây là những trạng thái không thể quan sát được của hệ thống mà mô hình cố gắng suy ra. Ví dụ, trong dự báo thời tiết, các trạng thái ẩn có thể là "Nắng", "Mây" hoặc "Mưa".
Đầu ra quan sát được (Phát xạ): Đây là các điểm dữ liệu hiển thị mà mỗi trạng thái ẩn có thể tạo ra. Theo ví dụ về thời tiết, các quan sát có thể là "Nhiệt độ cao", "Nhiệt độ thấp" hoặc "Độ ẩm cao".
Xác suất chuyển tiếp: Các xác suất này chi phối khả năng chuyển từ trạng thái ẩn này sang trạng thái ẩn khác. Ví dụ, có một xác suất nhất định rằng một ngày "Nắng" sẽ được tiếp nối bằng một ngày "Mây".
Xác suất phát xạ: Các xác suất này biểu thị khả năng quan sát một đầu ra cụ thể khi hệ thống ở trạng thái ẩn cụ thể. Ví dụ, xác suất quan sát "Độ ẩm cao" có thể cao hơn nếu trạng thái ẩn là "Mưa".

Để đưa ra dự đoán, HMM sử dụng các thuật toán đã được thiết lập. Thuật toán Viterbi thường được sử dụng để tìm chuỗi trạng thái ẩn có khả năng xảy ra cao nhất dựa trên một chuỗi quan sát. Để huấn luyện mô hình và tìm hiểu phân phối xác suất của nó từ dữ liệu huấn luyện , thuật toán Baum-Welch thường được sử dụng.

Ứng dụng trong thế giới thực

HMM đã được ứng dụng thành công trong nhiều lĩnh vực khác nhau trong nhiều thập kỷ. Dưới đây là một vài ví dụ nổi bật:

Nhận dạng giọng nói : Trong các hệ thống nhận dạng giọng nói cổ điển, HMM đóng vai trò như một công cụ. Các trạng thái ẩn tương ứng với các âm vị (đơn vị âm thanh cơ bản trong một ngôn ngữ), và đầu ra quan sát được là các đặc điểm âm thanh được trích xuất từ giọng nói đã ghi âm. Nhiệm vụ của HMM là xác định trình tự âm vị có khả năng xảy ra nhất từ tín hiệu âm thanh, sau đó được sử dụng để nhận dạng các từ được nói.
Tin sinh học: HMM là nền tảng của sinh học tính toán, đặc biệt là trong việc tìm kiếm gen. Trong bối cảnh này, các trạng thái ẩn có thể đại diện cho các phần của gen, chẳng hạn như "exon" (vùng mã hóa) hoặc "intron" (vùng không mã hóa), trong khi các quan sát là trình tự các bazơ DNA (A, C, G, T). Bằng cách phân tích một trình tự DNA dài, HMM có thể xác định vị trí có khả năng xảy ra nhất của các gen. Trung tâm Thông tin Công nghệ Sinh học Quốc gia (NCBI) đã trình bày chi tiết các phương pháp này.

So sánh với các khái niệm liên quan

Điều quan trọng là phải phân biệt HMM với các mô hình trình tự khác:

Quy trình Quyết định Markov (MDP) : Mặc dù cả hai đều liên quan đến trạng thái và chuyển đổi, MDP giả định trạng thái có thể quan sát được đầy đủ và tập trung vào việc ra quyết định (tìm ra hành động tối ưu) trong khuôn khổ Học Tăng cường (RL) . HMM tập trung vào việc suy ra các trạng thái ẩn từ các quan sát. Các tài nguyên như tài liệu giới thiệu của DeepMind đề cập đến RL và MDP.
Mạng nơ-ron hồi quy (RNN) và Bộ nhớ dài hạn ngắn hạn (LSTM) : Đây là các mô hình Học sâu (DL) cũng được thiết kế cho dữ liệu tuần tự. Không giống như các trạng thái xác suất rõ ràng của HMM, RNN/LSTM duy trì một vectơ trạng thái ẩn nội bộ, phát triển ngầm định khi chúng xử lý các chuỗi. Chúng có thể nắm bắt các phụ thuộc phức tạp hơn và có phạm vi dài hơn, thường đạt được độ chính xác cao hơn trong các tác vụ như dịch máy và nhận dạng giọng nói nâng cao. Việc hiểu LSTM cung cấp một cái nhìn tổng quan tốt. Các mô hình thị giác hiện đại như Ultralytics YOLO sử dụng kiến trúc DL, thường được xây dựng với các khung như PyTorch hoặc TensorFlow , cho các tác vụ như phát hiện đối tượng và phân đoạn thực thể .

Mặc dù các phương pháp học sâu mới hơn thường đạt được kết quả tiên tiến, HMM vẫn có giá trị nhờ khả năng diễn giải (trạng thái và xác suất rõ ràng) và hiệu quả, đặc biệt khi dữ liệu huấn luyện bị hạn chế hoặc kiến thức chuyên môn có thể được tích hợp vào cấu trúc mô hình. Việc hiểu các khái niệm nền tảng như HMM cung cấp bối cảnh giá trị trong bối cảnh học máy rộng lớn hơn, ngay cả khi sử dụng các nền tảng như Ultralytics HUB , vốn chủ yếu hỗ trợ phát triển và triển khai các mô hình học sâu như YOLOv8 hoặc YOLO11 .

Mô hình Markov ẩn (HMM)

Giải pháp cấp phép doanh nghiệp linh hoạt để thúc đẩy sự đổi mới của bạn

Đào tạo các mô hình AI trong vài giây với Ultralytics YOLO

Đào tạo mô hình YOLO một cách đơn giản với Ultralytics HUB

Mô hình Markov ẩn hoạt động như thế nào

Ứng dụng trong thế giới thực

So sánh với các khái niệm liên quan

Đọc thêm trong danh mục này

Khám phá GPT-5 của OpenAI: Một hệ thống thống nhất thông minh

Google AlphaEarth sử dụng dữ liệu quan sát để lập bản đồ toàn cầu

FastVLM: Apple giới thiệu mô hình ngôn ngữ tầm nhìn nhanh mới

Tham gia cộng đồng Ultralytics