AI VIDEO BRIEFING

은닉 마르코프 모델(HMM) 원리: 숨은 상태와 관측, 마르코프 가정으로 보는 추론

직접 볼 수 없는 교수님의 기분을 셔츠 색으로 추리하는 예시로 은닉 마르코프 모델의 전이 확률과 방출 확률, 마르코프 가정, 그리고 가장 가능성 높은 숨은 상태를 찾는 추론 과정을 쉽게 풀어 설명한다.

출처: ritvikmath2020년 6월 15일AI 보조 요약

은닉 마르코프 모델(HMM): 교수님 기분으로 배우는 숨은 상태 추론의 원리 영상 대표 이미지

핵심 메시지

HMM은 직접 관측할 수 없는 숨은 상태가 관측 가능한 데이터를 만들어낸다고 보는 확률 모델이다.
전이 확률은 숨은 상태 사이의 이동을, 방출 확률은 숨은 상태가 특정 관측을 낼 가능성을 나타낸다.
마르코프 가정 덕분에 복잡한 결합 확률이 단순한 곱으로 분해되어 계산이 쉬워진다.
관측된 순서가 주어지면 가장 가능성 높은 숨은 상태 순서를 찾는 것이 추론의 목표다.
자연어 처리의 품사 태깅처럼 순서가 있는 데이터를 다루는 문제에 널리 쓰인다.

쉽게 이해하기

영상은 수학 기호 대신 친숙한 상황으로 시작한다. 한 교수님이 매일 행복하거나 슬픈 두 가지 기분 중 하나이고, 어떤 날의 기분은 바로 전날의 기분에만 영향을 받는다고 가정한다.

기분 사이의 이동은 전이 확률로 표현된다. 예컨대 전날 행복했다면 오늘도 행복할 확률은 0.7, 슬플 확률은 0.3이며, 전날 슬펐다면 행복·슬픔이 각각 0.5다. 강의 첫날처럼 이전 정보가 없을 때를 위한 시작 확률(행복 0.4, 슬픔 0.6)도 주어진다.

여기에 방출 확률이 더해진다. 교수님은 매일 빨강·초록·파랑 셔츠 중 하나를 입는데, 그 색은 그날의 기분에 따라 분포가 다르다. 행복하면 빨강 0.8·초록 0.1·파랑 0.1, 슬프면 빨강 0.2·초록 0.3·파랑 0.5다. 학생은 셔츠 색(관측 상태)만 볼 수 있고 기분(숨은 상태)은 알 수 없다.

추론의 핵심은 관측된 순서로부터 숨은 순서를 되짚는 것이다. 사흘간 초록·파랑·빨강 셔츠를 봤다면, 가능한 8가지(2의 3제곱) 기분 조합 중 관측과 기분이 함께 나타날 결합 확률을 최대로 만드는 조합을 찾는다. 두 가정(셔츠 색은 당일 기분에만, 기분은 전날 기분에만 의존) 덕분에 이 확률은 방출·전이 확률의 단순한 곱으로 분해되며, 예시에서는 슬픔·슬픔·행복이 가장 가능성 높은 순서로 나온다.

마지막으로 실제 응용을 든다. 자연어 처리의 품사 태깅에서 문장의 각 단어는 관측 상태, 각 단어의 품사(명사·동사 등)는 숨은 상태로 두면 HMM이 그대로 쓰인다. 이처럼 HMM은 순서가 있는 데이터를 모델링하는 데 중요한 도구다.

주요 인사이트

숨은 상태와 관측 상태를 분리해 모델링하는 발상이 HMM의 핵심이다.
두 가정(방출은 당일 상태에만, 전이는 전날 상태에만 의존)이 복잡한 확률을 계산 가능하게 만든다.
최적의 숨은 상태 순서는 가능한 조합의 결합 확률을 최대화해 찾으며, 수가 많을 때를 위한 효율적 알고리즘도 존재한다.
동일한 틀이 품사 태깅 같은 시퀀스 문제에 거의 그대로 적용된다.

자주 묻는 질문

은닉 마르코프 모델에서 '숨은 상태'와 '관측 상태'는 어떻게 다른가요?

영상의 예에서 교수님의 기분(행복/슬픔)은 우리가 직접 볼 수 없는 숨은 상태이고, 교수님이 입은 셔츠 색(빨강/초록/파랑)은 직접 볼 수 있는 관측 상태다. 숨은 상태가 관측 상태에 영향을 준다.

마르코프 가정이란 무엇인가요?

어떤 날의 상태가 바로 전날의 상태에만 의존하고 그 이전 날들에는 직접 의존하지 않는다는 가정이다. 이 가정 덕분에 복잡한 결합 확률을 단순한 곱의 형태로 분해할 수 있다.

HMM은 실제로 어디에 쓰이나요?

자연어 처리의 품사 태깅이 대표적이다. 문장의 각 단어를 관측 상태로, 각 단어의 품사(명사·동사 등)를 숨은 상태로 두고 단어 순서로부터 품사 순서를 추론한다.

원문과 출처

이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.

YouTube 원본 영상 보기 ↗