AI VIDEO BRIEFING
베이즈 정리 쉽게 이해하기: 사전확률·가능도·사후확률과 사서 스티브 사례로 보는 원리
확률에서 가장 중요한 공식인 베이즈 정리를 직관으로 풀어냅니다. 새 증거가 믿음을 결정하지 않고 갱신한다는 핵심, 사서 스티브 사례와 기저율 무시, 사전확률·가능도·사후확률, 넓이로 생각하는 그림까지 짚었습니다.

핵심 메시지
쉽게 이해하기
3Blue1Brown은 확률에서 가장 중요한 공식 중 하나인 베이즈 정리를 직관 중심으로 설명한다. 이 공식은 과학적 발견과 머신러닝·AI의 핵심 도구이며, 1980년대 토미 톰슨이 이끈 팀이 베이즈 탐색 기법으로 150년 전 가라앉은 배와 오늘날 가치로 약 7억 달러어치 금을 찾아낸 일화처럼 실제 보물찾기에도 쓰였다. 영상은 공식을 분해하기 전에, '언제 이 공식이 필요한지 알아보는 능력'이 가장 중요하다고 강조한다.
출발점은 '스티브' 사례다. 스티브는 수줍고 정돈을 좋아하며 디테일에 열정적인 사람으로 묘사된다. 사람들은 대개 그를 농부보다 사서로 본다. 카너먼과 트버스키의 연구에 따르면 이는 비합리적인데, 거의 아무도 농부와 사서의 비율을 판단에 넣지 않기 때문이다. 미국에서 그 비율이 약 20대 1이라면, 묘사에 들어맞는 정도를 고려해도 결론은 달라진다.
직관적 계산은 이렇다. 농부 200명과 사서 10명의 대표 표본을 떠올리고, 그 묘사에 사서의 40%·농부의 10%가 맞는다고 보자. 그러면 묘사에 맞는 사서는 약 4명, 농부는 약 20명이다. 따라서 묘사에 맞는 사람 중 사서일 확률은 4/24, 약 16.7%다. 사서가 묘사에 맞을 가능성이 4배 높아도 농부가 훨씬 많다는 사실을 이기지 못한다. 핵심 교훈은 증거가 사전 믿음을 갱신할 뿐 결정하지 않는다는 것이다.
이 추론을 일반화하면 베이즈 정리가 된다. 어떤 가설(스티브는 사서다)과 새 증거(그 성격 묘사)가 있을 때, 증거가 참이라는 조건에서 가설이 성립할 확률을 구한다. 증거를 보기 전 가설의 확률이 사전확률(prior), 가설이 참일 때 증거가 나타날 비율이 가능도(likelihood)이며, 증거를 본 뒤 갱신된 믿음이 사후확률(posterior)이다. 분모인 증거의 전체 확률 P(E)는 보통 가설이 참인 경우와 아닌 경우로 나눠 계산한다.
영상은 확률을 직관적으로 만드는 두 가지 도구로 마무리한다. 하나는 대표 표본으로 세는 것이다. '린다' 사례에서 사람들의 85%가 '은행원'보다 '은행원이면서 페미니스트'를 더 가능성 높다고 답하는 결합 오류를 범하지만, '100명 중 몇 명'으로 바꿔 물으면 오류가 0으로 사라진다. 다른 하나는 전체 가능성을 1×1 정사각형으로 보고 사건을 넓이로 생각하는 것이다. 증거를 보면 가능성의 공간이 좁아지고, 그 좁아진 영역에서 가설이 차지하는 비율이 곧 새 확률이다. 발표자는 공식을 외우지 말고 이 그림을 그리라고 권한다.
주요 인사이트
- 합리성은 사실을 많이 아는 것이 아니라 '어떤 사실이 관련 있는지'를 알아보는 능력이라는 점이 베이즈식 사고의 출발점이다.
- 강한 인상을 주는 증거라도 기저율(사전확률)을 무시하면 판단이 크게 어긋날 수 있다.
- '40%'보다 '100명 중 40명'이라는 표현이 직관을 더 정확히 작동시킨다는 점은 확률 소통과 교육에 실용적 시사점을 준다.
- 베이즈 정리는 결국 비율에 관한 진술이어서, 넓이로 그려 보면 '증거가 참인 경우 중 가설도 참인 비율'이라는 본질이 자명해진다.
자주 묻는 질문
베이즈 정리의 가장 중요한 교훈은 무엇인가요?
새로운 증거가 믿음을 진공 상태에서 결정하는 것이 아니라, 기존의 사전 믿음을 갱신해야 한다는 것입니다. 증거는 가능성의 공간을 좁히고, 그 안에서 가설이 차지하는 비율로 믿음을 다시 계산하게 합니다.
사서 스티브 사례에서 사람들이 왜 틀리나요?
성격 묘사가 사서라는 고정관념에 들어맞아 사서라고 판단하지만, 농부가 사서보다 약 20배 많다는 비율을 고려하지 않기 때문입니다. 묘사에 맞을 확률이 사서가 4배 높아도 사서일 확률은 약 16.7%에 그칩니다.
사전확률, 가능도, 사후확률은 무엇인가요?
사전확률은 증거를 보기 전 가설의 확률, 가능도는 가설이 참일 때 그 증거가 나타날 비율, 사후확률은 증거를 본 뒤 갱신된 가설의 확률입니다. 베이즈 정리는 이 셋을 연결해 믿음의 변화를 계산합니다.
확률을 더 직관적으로 다루는 방법이 있나요?
'40%'처럼 추상적으로 말하기보다 '100명 중 40명'처럼 대표 표본으로 세면 직관이 잘 작동합니다. 또 전체 가능성을 1×1 정사각형으로 보고 사건을 넓이로 그리면 비율을 쉽게 가늠할 수 있습니다.
원문과 출처
이 글은 원본 영상의 자막을 바탕으로 한국어 독자를 위해 요약했습니다. 전체 맥락과 최신 정보는 원문에서 확인하세요.
YouTube 원본 영상 보기 ↗