AI VIDEO BRIEFING
베이지안 네트워크 완벽 정리: 방향성 비순환 그래프(DAG)와 조건부확률로 불확실성 다루기
베이지안 네트워크는 방향성 비순환 그래프(DAG)와 조건부확률표로 불확실한 사건을 추론하는 확률적 그래프 모델입니다. 노드와 부모-자식 관계, 결합확률 분해, 몬티 홀 문제 예제까지 차근차근 풀어 설명합니다.

핵심 메시지
쉽게 이해하기
베이지안 네트워크는 제한된 정보만으로도 불확실성을 다루기 위해 확률 개념을 사용하는 확률적 그래프 모델(PGM)이다. 신념망(belief network) 또는 인과망(causal network)이라고도 불리며, 변수들 사이의 관계와 불확실한 값을 방향성 비순환 그래프로 표현한다.
그래프는 노드와 링크로 이루어지는데, 노드는 확률 변수를 나타내고 화살표는 변수 간의 의존 관계를 나타낸다. 어떤 노드로 화살표가 향하면 그 노드는 출발 노드(부모)에 의존하는 자식 노드가 된다. 이런 부모-자식 구조 덕분에 그래프만 봐도 어떤 변수가 무엇에 영향을 받는지 한눈에 파악할 수 있다.
핵심 수학은 결합확률과 조건부확률이다. 결합확률은 둘 이상의 사건이 동시에 일어날 확률이고, 조건부확률은 어떤 사건이 이미 일어났다는 조건에서 다른 사건이 일어날 확률이다. 영상에서는 학생의 시험 점수를 예로 들어, 점수가 시험 난이도와 IQ에 의존하고, 점수는 다시 대학 합격 여부에, IQ는 적성 점수에 영향을 주는 구조를 DAG와 조건부확률표로 나타낸다.
실습으로는 파이썬으로 몬티 홀 문제를 푼다. 참가자가 고른 문, 상품이 있는 문, 진행자가 여는 문을 노드로 두는데 진행자가 여는 문은 앞의 두 문에 의존한다. 진행자는 참가자가 고른 문도, 상품이 있는 문도 열 수 없기 때문이다. 베이지안 네트워크로 계산하면 선택을 바꿨을 때 상품이 있는 문일 확률이 약 66%로, 바꾸는 편이 유리하다는 결과가 나온다.
베이지안 네트워크는 질병 진단, 웹 검색 정확도 개선, 스팸 필터링(지메일은 나이브 베이즈와 함께 사용), 유전자 조절망 분석, 바이오 모니터링 등 다양한 분야에 쓰인다. 제한된 정보로도 많은 예측을 수행할 수 있다는 점이 큰 강점이다.
주요 인사이트
- 베이지안 네트워크의 본질은 단순한 확률이다. 복잡해 보여도 결국 "어떤 변수의 확률은 그 부모 노드의 확률에 의존한다"는 규칙으로 정리된다.
- DAG는 변수 간 의존 구조를 시각적으로 보여주므로, 문제를 그래프로 그리는 것이 베이지안 네트워크를 만드는 첫 단계다.
- 결합확률을 부모 조건부확률들의 곱으로 분해할 수 있어, 변수가 많아도 계산을 다룰 수 있는 형태로 쪼갤 수 있다.
- 몬티 홀 문제는 사람의 직관(50%일 것이라는 생각)과 실제 확률(66%)이 다른 대표적 사례로, 확률 모델이 직관의 오류를 바로잡아 주는 예다.
자주 묻는 질문
베이지안 네트워크는 무엇을 모델링하나요?
각 확률 변수의 조건부확률 분포를 바탕으로, 제한된 정보 속에서 어떤 사건이 일어날 불확실성을 계산합니다. 방향성 비순환 그래프(DAG)로 변수 간 의존 관계를 표현합니다.
몬티 홀 문제에서 선택을 바꾸면 왜 유리한가요?
진행자는 참가자가 고른 문도, 상품이 있는 문도 열 수 없습니다. 이 조건을 반영해 계산하면 선택을 바꿨을 때 상품이 있는 문일 확률이 약 66%가 되어, 바꾸는 편이 약 3분의 2의 확률로 유리합니다.
베이지안 네트워크는 어디에 활용되나요?
질병 진단, 웹 검색 정확도 개선, 지메일 같은 스팸 필터링, 유전자 조절망 분석, 약물 용량 바이오 모니터링 등 불확실성을 다뤄야 하는 여러 분야에 쓰입니다.
원문과 출처
이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.
YouTube 원본 영상 보기 ↗