용어집

숨겨진 마르코프 모델(HMM)

숨겨진 마르코프 모델(HMM)과 그 원리, 음성 인식, 생물 정보학 및 AI에서의 적용, 숨겨진 상태를 추론하는 방법에 대해 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

숨겨진 마르코프 모델(HMM)은 머신 러닝에서 시간에 따라 진화하는 시스템을 설명하는 데 사용되는 통계 모델의 일종입니다. 특정 출력을 관찰할 수 있지만 이러한 출력을 유도하는 기본 상태는 숨겨져 있는 시스템을 상상해 보세요. HMM은 관찰된 출력의 순서를 기반으로 이러한 숨겨진 상태를 추론하도록 설계되었습니다. 따라서 데이터가 순차적이고 시스템의 실제 상태를 직접 관찰할 수 없는 시나리오에서 특히 유용합니다.

히든 마르코프 모델의 핵심 개념

HMM의 핵심은 숨겨진 상태와 관측이라는 두 가지 핵심 구성 요소입니다. 숨겨진 상태는 시스템 동작에 영향을 미치는 관찰할 수 없는 요소입니다. 직접 측정할 수 없는 내부 작동 또는 조건이라고 생각하면 됩니다. 반면에 관찰은 우리가 실제로 보거나 측정할 수 있는 데이터 포인트로, 숨겨진 상태와 확률적으로 연결되어 있습니다.

HMM은 두 가지 기본 가정 하에 작동합니다:

  • 마르코프 가정: 현재 숨겨진 상태는 전체 상태 히스토리가 아닌 이전 숨겨진 상태에만 의존합니다. 이 '메모리 없는' 속성은 모델을 단순화하고 계산을 가능하게 합니다. 예를 들어, HMM을 사용한 날씨 예측에서 오늘의 날씨(숨겨진 상태)는 일주일 전의 날씨가 아니라 어제의 날씨에만 의존합니다.
  • 관측 독립성 가정: 현재 관측은 현재 숨겨진 상태에만 의존하며, 현재 숨겨진 상태가 주어졌을 때 과거의 숨겨진 상태 및 과거 관측과는 독립적입니다. 날씨 예시를 계속 이어서, 오늘 비가 올지 여부(관측)는 오늘의 날씨 상태(숨겨진 상태, 예: '비', '맑음'과 같은)에만 의존하고 어제의 날씨 상태에는 의존하지 않습니다.

이러한 가정을 통해 몇 가지 주요 확률 분포를 사용하여 HMM을 정의할 수 있습니다:

  • 전환 확률: 이 확률은 숨겨진 상태에서 다른 상태로 이동할 가능성을 정의합니다. 예를 들어 날씨 예시에서 '맑음' 상태에서 '흐림' 상태로 전환될 확률을 말합니다.
  • 방출 확률: 이 확률은 숨겨진 상태가 주어졌을 때 특정 출력을 관찰할 가능성을 정의합니다. 예를 들어, 숨겨진 상태가 '비'일 때 '비'가 관측될 확률을 말합니다.
  • 초기 상태 확률: 시퀀스 시작 시 가능한 각 숨겨진 상태에서 시작할 확률을 정의합니다.

시스템을 이해하기 위해 HMM은 세 가지 주요 문제를 해결합니다:

  • 평가: 모델과 관측 시퀀스가 주어졌을 때, 해당 시퀀스가 모델에 의해 생성될 확률을 계산합니다. 이 문제는 포워드 알고리즘을 사용하여 해결하는 경우가 많습니다.
  • 디코딩: 모델과 관찰 시퀀스가 주어지면 관찰을 생성한 숨겨진 상태의 가장 가능성이 높은 시퀀스를 찾습니다. 이를 위해 비터비 알고리즘이 일반적으로 사용됩니다.
  • 학습하기: 관찰 시퀀스가 주어지면 관찰된 데이터를 가장 잘 설명하는 모델 파라미터(전이, 방출 및 초기 확률)를 학습합니다. 이를 위해 바움-웰치 알고리즘(기대 최대화의 한 형태)이 사용됩니다.

AI에서 숨겨진 마르코프 모델의 응용

HMM은 인공지능의 다양한 분야, 특히 순차적 데이터와 숨겨진 프로세스가 관련된 분야에서 성공적으로 적용되었습니다. 다음은 몇 가지 대표적인 예시입니다:

  • 음성 인식: HMM의 가장 고전적이고 성공적인 응용 분야 중 하나는 음성 인식 시스템입니다. 음성에서 음향 신호(관찰)는 음소 또는 발화된 단어의 시퀀스(숨겨진 상태)에 의해 생성됩니다. HMM은 음소와 음향 특징 사이의 확률적 관계를 모델링하는 데 사용되어 시스템이 음성 언어를 텍스트로 변환할 수 있게 해줍니다. 최신 음성 인식 시스템은 종종 더 복잡한 딥러닝 모델을 사용하지만, HMM은 이 분야에서 기초적인 역할을 했으며 여전히 하이브리드 접근 방식에서 사용되고 있습니다.
  • 생물정보학: HMM은 DNA 및 단백질 서열과 같은 생물학적 서열을 분석하기 위해 생물정보학에서 널리 사용됩니다. 예를 들어, 유전자 예측에서는 DNA의 뉴클레오타이드 서열(관찰)을 모델링하여 코딩 영역과 비코딩 영역과 같은 기본 유전자 구조(숨겨진 상태)를 추론할 수 있습니다. HMM은 이러한 서열에서 패턴과 모티프를 식별하여 유전자와 단백질의 기능과 구조를 이해하는 데 도움을 줄 수 있습니다.

이러한 핵심 애플리케이션 외에도 HMM은 다양한 분야에서 활용되고 있습니다:

  • 자연어 처리(NLP): 문장의 단어는 관찰 대상이고 기본 문법 태그는 숨겨진 상태인 품사 태깅과 같은 작업에 사용됩니다. 자연어 처리(NLP) 와 AI의 다양한 응용 분야에 대해 자세히 알아볼 수 있습니다.
  • 재무 모델링: 관측된 주가가 숨겨진 시장 체제(예: 강세장, 약세장)의 영향을 받는 금융 시계열 데이터를 분석하는 데 사용됩니다. 시계열 분석은 시간에 따른 데이터 추세를 이해하는 데 있어 매우 중요한 측면입니다.
  • 활동 인식: 컴퓨터 비전 및 센서 기반 시스템에서 HMM은 일련의 센서 판독값 또는 비디오 프레임에서 사람의 활동을 인식할 수 있습니다. Ultralytics YOLO 은 개별 프레임에서 실시간 객체 감지이미지 분할에 탁월하지만, HMM은 시간적 차원을 추가하여 일련의 동작을 이해할 수 있습니다.

순환 신경망(RNN)트랜스포머와 같은 최신 기술이 장거리 종속성을 포착하고 더 복잡한 패턴을 처리할 수 있기 때문에 현재 많은 시퀀스 모델링 작업에서 지배적이지만, 숨겨진 마르코프 모델은 특히 해석 가능성과 계산 효율성이 우선시되거나 마르코프 가정이 기본 시스템에 대한 합리적인 근사치인 경우 여전히 유용한 도구로 사용되고 있습니다. 숨겨진 마르코프 모델은 순차적 데이터를 이해하고 숨겨진 구조를 추론하기 위한 확률적 프레임워크를 제공하여 머신러닝과 인공 지능 분야의 초석이 되고 있습니다.

모두 보기