Glossario

Modello di Markov nascosto (HMM)

Scopri i Modelli di Markov Nascosti (HMM), i loro principi, le applicazioni nel riconoscimento vocale, nella bioinformatica e nell'IA e come si deducono gli stati nascosti.

Un Modello di Markov Nascosto (HMM) è un modello statistico utilizzato per descrivere sistemi che passano da uno stato all'altro nel tempo. Negli HMM, la sequenza di stati che il sistema attraversa non è direttamente osservabile (è "nascosta"), ma può essere dedotta da una sequenza di uscite o emissioni osservabili prodotte da ogni stato. Gli HMM sono particolarmente potenti per la modellazione di dati sequenziali e per l'analisi delle serie temporali in vari domini dell'Intelligenza Artificiale (AI) e del Machine Learning (ML). Appartengono a una classe di modelli noti come modelli grafici probabilistici, che forniscono un quadro per gestire l'incertezza nei sistemi dinamici.

Concetti fondamentali

Gli HMM sono definiti da due processi stocastici (casuali) principali:

Stati nascosti: Una catena di Markov di stati sottostante, non osservabile. Il sistema passa da uno stato nascosto all'altro in base a specifiche probabilità. Il presupposto fondamentale è la proprietà di Markov: la probabilità di passare allo stato successivo dipende solo dallo stato corrente, non dalla sequenza di stati che lo ha preceduto.
Emissioni osservabili: Ogni stato nascosto genera un'uscita o un'emissione osservabile basata su una certa distribuzione di probabilità. Queste emissioni sono i dati che osserviamo.

Il modello è caratterizzato da:

Stati: Un insieme finito di stati nascosti.
Osservazioni: Un insieme finito di possibili emissioni o osservazioni.
Probabilità di transizione: Le probabilità di passare da uno stato nascosto a un altro.
Probabilità di emissione: Le probabilità di osservare una particolare emissione se il sistema si trova in uno specifico stato nascosto.
Distribuzione dello stato iniziale: Le probabilità che il sistema inizi in ogni stato nascosto.

Come funzionano i modelli di Markov nascosti

Lavorare con gli HMM comporta in genere la risoluzione di tre problemi fondamentali, spesso affrontati con algoritmi specifici descritti in tutorial come quello di Rabiner:

Problema di valutazione: Data una HMM e una sequenza di osservazioni, qual è la probabilità che le osservazioni siano state generate dal modello? (Risolto utilizzando l'algoritmo Forward).
Problema di decodifica: data una HMM e una sequenza di osservazioni, qual è la sequenza più probabile di stati nascosti che ha prodotto queste osservazioni? (Risolto utilizzando l'algoritmo di Viterbi).
Problema di apprendimento: data una sequenza di osservazioni (o sequenze multiple), come possiamo regolare i parametri dell'HMM (probabilità di transizione e di emissione) per tenere conto al meglio dei dati osservati? (Spesso viene risolto utilizzando l'algoritmo di Baum-Welch, un'istanza dell'algoritmo di Expectation-Maximization). Questo aspetto è fondamentale per l'addestramento del modello.

Applicazioni del mondo reale

Gli HMM sono stati applicati con successo in numerosi campi:

Riconoscimento vocale: Si tratta di un'applicazione classica. Gli stati nascosti possono rappresentare fonemi (unità di base del suono), mentre le osservazioni sono caratteristiche acustiche estratte dal segnale vocale. L'HMM decodifica la sequenza più probabile di fonemi in base all'audio, costituendo la base per il riconoscimento delle parole. Strumenti come CMU Sphinx si sono storicamente basati molto sugli HMM.
Bioinformatica: Gli HMM sono ampiamente utilizzati per l'analisi delle sequenze. Ad esempio, nella ricerca dei geni, gli stati nascosti possono rappresentare regioni codificanti, regioni non codificanti o strutture geniche specifiche (come i codoni di inizio, gli esoni e gli introni). Le osservazioni sono le coppie di basi del DNA (A, C, G, T). Il modello aiuta a identificare le posizioni dei geni all'interno di una lunga sequenza di DNA. Un software come HMMER utilizza i profili HMM per l'analisi delle sequenze proteiche, confrontando le sequenze con database come quello dei geni dell'NCBI.
Elaborazione del linguaggio naturale (NLP): Utilizzato per compiti come il part-of-speech tagging, dove gli stati nascosti sono i tag grammaticali (nome, verbo, aggettivo) e le osservazioni sono le parole di una frase. Si applica anche al Named Entity Recognition (NER).
Visione artificiale (CV): Si applica al riconoscimento dei gesti, al riconoscimento delle attività dai video e talvolta, storicamente, al tracciamento degli oggetti, anche se spesso è stata superata da metodi come i filtri di Kalman o gli approcci di deep learning.
Finanza: Modellare i regimi di mercato (ad esempio, mercati toro o orso) come stati nascosti basati su indicatori finanziari osservabili.
Analisi delle immagini mediche: Analisi di sequenze di immagini o segnali medici nel tempo.

Confronto con concetti correlati

È importante distinguere gli HMM da altri modelli di sequenza:

Processi decisionali di Markov (MDP): Sebbene entrambi coinvolgano stati e transizioni, gli MDP presuppongono che gli stati siano completamente osservabili e si concentrano sul processo decisionale (trovare le azioni ottimali) nell'ambito del Reinforcement Learning (RL). Gli HMM si concentrano sulla deduzione di stati nascosti dalle osservazioni. Risorse come il materiale introduttivo di DeepMind coprono RL e MDP.
Reti neurali ricorrenti (RNN) e memorie a breve termine (LSTM): Si tratta di modelli di apprendimento profondo (DL) progettati anche per dati sequenziali. A differenza degli stati probabilistici espliciti degli HMM, le RNN/LSTM mantengono un vettore di stato nascosto interno che si evolve implicitamente durante l'elaborazione delle sequenze. Possono catturare dipendenze più complesse e a lungo raggio, ottenendo spesso una maggiore precisione in compiti come la traduzione automatica e il riconoscimento vocale avanzato. La comprensione degli LSTM offre una buona panoramica. I moderni modelli di visione come Ultralytics YOLO utilizzano architetture DL, spesso realizzate con framework come PyTorch o TensorFlowper compiti come il rilevamento di oggetti e la segmentazione di istanze.

Sebbene i metodi di deep learning più recenti raggiungano spesso risultati all'avanguardia, gli HMM rimangono preziosi per la loro interpretabilità (stati e probabilità esplicite) ed efficacia, soprattutto quando i dati di formazione sono limitati o la conoscenza del dominio può essere incorporata nella struttura del modello. La comprensione di concetti fondamentali come gli HMM fornisce un contesto prezioso nel più ampio panorama del ML, anche quando si utilizzano piattaforme come Ultralytics HUB che facilitano principalmente lo sviluppo e l'implementazione di modelli DL come YOLOv8 o YOLO11.

Modello di Markov nascosto (HMM)

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Una soluzione flessibile di licenze aziendali per alimentare la tua innovazione

Addestra i modelli di intelligenza artificiale in pochi secondi con Ultralytics YOLO

Addestra i modelli di YOLO in modo semplice con Ultralytics HUB

Concetti fondamentali

Come funzionano i modelli di Markov nascosti

Applicazioni del mondo reale

Confronto con concetti correlati

Leggi altri blog

Unisciti alla comunità di Ultralytics

Modello di Markov nascosto (HMM)

Addestra i modelli YOLO semplicementecon Ultralytics HUB

Una soluzione flessibile di licenze aziendali per alimentare la tua innovazione

Addestra i modelli di intelligenza artificiale in pochi secondi con Ultralytics YOLO

Addestra i modelli di YOLO in modo semplice con Ultralytics HUB

Concetti fondamentali

Come funzionano i modelli di Markov nascosti

Applicazioni del mondo reale

Confronto con concetti correlati

Leggi altri blog

Unisciti alla comunità di Ultralytics

Addestra i modelli YOLO semplicemente
con Ultralytics HUB