Glossar

Verstecktes Markov-Modell (HMM)

Entdecken Sie Hidden Markov Models (HMMs), ihre Prinzipien, Anwendungen in der Spracherkennung, Bioinformatik und KI und wie sie verborgene Zustände ableiten.

Ein Hidden Markov Model (HMM) ist ein statistisches KI-Modell, das für die Analyse sequenzieller Daten verwendet wird, wobei das zugrunde liegende System als Markov-Prozess mit unbeobachteten (versteckten) Zuständen angenommen wird. Die Kernidee besteht darin, auf der Grundlage einer Folge von beobachtbaren Ausgaben Rückschlüsse auf eine Folge von verborgenen Zuständen zu ziehen. HMMs beruhen auf der Markov-Eigenschaft, die besagt, dass die Wahrscheinlichkeit eines zukünftigen Zustands nur vom aktuellen Zustand abhängt, nicht aber von der gesamten Geschichte der Zustände. Dies macht HMMs zu einem leistungsstarken Werkzeug für Aufgaben in Bereichen wie der natürlichen Sprachverarbeitung (NLP) und der Bioinformatik.

Wie Hidden Markov Modelle funktionieren

Ein HMM besteht aus mehreren Schlüsselkomponenten, die zusammenarbeiten, um sequentielle Daten zu modellieren:

Verborgene Zustände: Dies sind die nicht beobachtbaren Zustände des Systems, auf die das Modell zu schließen versucht. Bei der Wettervorhersage könnten die verborgenen Zustände zum Beispiel "sonnig", "bewölkt" oder "regnerisch" sein.
Beobachtbare Outputs (Emissionen): Dies sind die sichtbaren Datenpunkte, die jeder verborgene Zustand erzeugen kann. In Anlehnung an das Wetterbeispiel könnten die Beobachtungen "hohe Temperatur", "niedrige Temperatur" oder "hohe Luftfeuchtigkeit" sein.
Übergangswahrscheinlichkeiten: Diese Wahrscheinlichkeiten bestimmen die Wahrscheinlichkeit des Übergangs von einem verborgenen Zustand zu einem anderen. So besteht zum Beispiel eine gewisse Wahrscheinlichkeit, dass auf einen "sonnigen" Tag ein "bewölkter" Tag folgt.
Emissionswahrscheinlichkeiten: Diese Wahrscheinlichkeiten stellen die Wahrscheinlichkeit dar, eine bestimmte Ausgabe zu beobachten, wenn sich das System in einem bestimmten verborgenen Zustand befindet. Beispielsweise ist die Wahrscheinlichkeit der Beobachtung von "hoher Luftfeuchtigkeit" wahrscheinlich höher, wenn der verborgene Zustand "regnerisch" ist.

Um Vorhersagen zu treffen, verwenden HMMs bewährte Algorithmen. Der Viterbi-Algorithmus wird üblicherweise verwendet, um die wahrscheinlichste Abfolge von verborgenen Zuständen bei einer Reihe von Beobachtungen zu finden. Um das Modell zu trainieren und seine Wahrscheinlichkeitsverteilungen aus Trainingsdaten zu lernen, wird häufig der Baum-Welch-Algorithmus verwendet.

Anwendungen in der realen Welt

HMMs werden seit Jahrzehnten erfolgreich in verschiedenen Bereichen eingesetzt. Hier sind ein paar prominente Beispiele:

Spracherkennungssysteme: In klassischen Spracherkennungssystemen wurden HMMs eingesetzt. Die verborgenen Zustände entsprechen den Phonemen (den grundlegenden Lauteinheiten einer Sprache), und die beobachtbaren Ausgaben sind akustische Merkmale, die aus der aufgezeichneten Sprache extrahiert werden. Die Aufgabe des HMM besteht darin, die wahrscheinlichste Phonemfolge aus dem Audiosignal zu bestimmen, die dann zur Identifizierung der gesprochenen Wörter verwendet wird.
Bioinformatik: HMMs sind ein Eckpfeiler der computergestützten Biologie, insbesondere bei der Suche nach Genen. In diesem Zusammenhang können die verborgenen Zustände Teile eines Gens darstellen, wie z. B. "Exon" (kodierender Bereich) oder "Intron" (nicht kodierender Bereich), während die Beobachtungen die Sequenz der DNA-Basen (A, C, G, T) sind. Durch die Analyse einer langen DNA-Sequenz kann ein HMM die wahrscheinlichsten Standorte von Genen ermitteln. Das National Center for Biotechnology Information (NCBI) beschreibt diese Methoden im Detail.

Vergleich mit verwandten Konzepten

Es ist wichtig, HMMs von anderen Sequenzmodellen zu unterscheiden:

Markov-Entscheidungsprozesse (MDPs): Während beide Zustände und Übergänge beinhalten, gehen MDPs davon aus, dass die Zustände vollständig beobachtbar sind, und konzentrieren sich auf die Entscheidungsfindung (Finden optimaler Aktionen) im Rahmen des Reinforcement Learning (RL). HMMs konzentrieren sich auf die Ableitung verborgener Zustände aus Beobachtungen. Ressourcen wie die Einführungsmaterialien von DeepMind behandeln RL und MDPs.
Rekurrente Neuronale Netze (RNNs) und Langes Kurzzeitgedächtnis (LSTMs): Hierbei handelt es sich um Deep-Learning-Modelle (DL), die ebenfalls für sequenzielle Daten entwickelt wurden. Im Gegensatz zu den expliziten probabilistischen Zuständen von HMMs behalten RNNs/LSTMs einen internen verborgenen Zustandsvektor bei, der sich implizit entwickelt, während sie Sequenzen verarbeiten. Sie können komplexere und weitreichendere Abhängigkeiten erfassen und erreichen oft eine höhere Genauigkeit bei Aufgaben wie maschineller Übersetzung und fortgeschrittener Spracherkennung. Das Verständnis von LSTMs bietet einen guten Überblick. Moderne Bildverarbeitungsmodelle wie Ultralytics YOLO verwenden DL-Architekturen, die häufig mit Frameworks wie PyTorch oder TensorFlow für Aufgaben wie Objekterkennung und Instanzsegmentierung erstellt werden.

Während neuere Deep-Learning-Methoden häufig Ergebnisse auf dem neuesten Stand der Technik erzielen, bleiben HMMs aufgrund ihrer Interpretierbarkeit (explizite Zustände und Wahrscheinlichkeiten) und Effektivität wertvoll, insbesondere wenn die Trainingsdaten begrenzt sind oder Fachwissen in die Modellstruktur integriert werden kann. Das Verständnis grundlegender Konzepte wie HMMs bietet einen wertvollen Kontext in der breiteren ML-Landschaft, selbst wenn Plattformen wie Ultralytics HUB verwendet werden, die in erster Linie die Entwicklung und Bereitstellung von DL-Modellen wie YOLOv8 oder YOLO11 erleichtern.

Verstecktes Markov-Modell (HMM)

Flexible Lizenzierungslösung für Unternehmen zur Förderung Ihrer Innovation

Trainieren Sie AI-Modelle in Sekundenschnelle mit Ultralytics YOLO

Trainieren Sie YOLO-Modelle einfach mit Ultralytics HUB

Wie Hidden Markov Modelle funktionieren

Anwendungen in der realen Welt

Vergleich mit verwandten Konzepten

Lesen Sie mehr in dieser Kategorie

Erkundung des GPT-5 von OpenAI: Ein intelligentes, einheitliches System

Google AlphaEarth nutzt Beobachtungsdaten für die globale Kartierung

FastVLM: Apple stellt sein neues schnelles Bildsprachmodell vor

Werden Sie Mitglied der Ultralytics-Gemeinschaft