Dr. R Notes – 70퍼센트 확신이 새 정보를 만나도 그대로라면, 당신은 베이지안 추론을 거부한 겁니다

당신이 어떤 사건에 대해 70퍼센트 확신한다고 칩시다. 그런데 새로운 정보가 하나 들어왔습니다. 이 정보를 본 뒤에도 여전히 70퍼센트라면, 그건 정보를 못 받아들인 겁니다. 60퍼센트로 내려가야 하거나, 80퍼센트로 올라가야 합니다. 그 조정이 정확히 얼마여야 하는지를 18세기 영국 목사 토머스 베이즈가 250년 전에 풀어 두었습니다. 베이지안 추론은 그 공식 위에 서 있는 단 하나의 사고법입니다.

왜 인간은 베이즈처럼 생각하지 않는가

다음 문제를 풀어 보십시오. 어떤 질병의 유병률은 1퍼센트입니다. 진단 키트의 정확도는 99퍼센트입니다. 양성이 나왔습니다. 당신이 실제로 질병에 걸렸을 확률은 얼마입니까. 대부분의 사람이 95퍼센트 이상이라고 답합니다. 정답은 50퍼센트입니다. 의사들조차 자주 틀립니다. 카네만과 트버스키가 1970년대에 했던 유명한 실험입니다.

왜 이런 일이 일어나는가. 인간의 뇌는 베이즈 공식을 직관적으로 처리하지 못하도록 진화했습니다. 우리는 사전 확률(prior)을 무시하고 새 정보에만 반응합니다. 99퍼센트 정확도라는 인상적인 숫자가 사전 확률 1퍼센트라는 거의 무시되는 숫자를 압도해 버립니다. 이걸 기저율 무시(base rate neglect)라고 부릅니다.

베이즈가 풀어낸 한 줄짜리 공식

베이지안 추론의 핵심은 단순합니다. 사후 확률 = 사전 확률 × 우도비. 우도비는 새 정보가 가설을 지지하는 정도입니다. 위 질병 문제로 돌아가 봅시다. 진짜 환자 100명 중 99명이 양성, 진짜 환자가 아닌 9,900명 중 99명이 양성. 양성 198명 중 진짜 환자는 99명. 99 나누기 198은 정확히 0.5입니다.

이 공식이 위력을 발휘하는 영역은 의학 진단만이 아닙니다. 형사 재판의 증거 평가, 금융 시장의 가격 형성, 스팸 필터의 학습, 자율주행차의 객체 인식까지 모두 베이즈입니다. 한 가지 공통점이 있습니다. 모든 사례에서 인간이 직관으로 풀려고 하면 거의 반드시 틀린다는 것입니다.

업데이트의 비대칭

흥미로운 비대칭이 하나 있습니다. 사람들은 자신의 믿음을 지지하는 정보가 들어오면 강하게 업데이트하고, 반박하는 정보가 들어오면 약하게 업데이트합니다. 베이즈 공식은 양쪽에 똑같은 가중치를 요구합니다. 이 비대칭을 확증 편향(confirmation bias)이라고 부릅니다. 정치 토론에서 양쪽 모두가 같은 자료를 보고 정반대 결론에 도달하는 이유가 여기 있습니다.

이 비대칭은 학습된 행동입니다. 어린아이는 새 정보를 양쪽 방향으로 비교적 균형 있게 받아들입니다. 정체성이 강해질수록 한쪽으로만 업데이트하는 경향이 생깁니다. 베이즈를 안다는 것은 자기 자신의 업데이트 곡선을 의심하기 시작한다는 뜻입니다.

반복 게임에서의 베이즈

한 판짜리 결정에서 베이즈의 효용은 제한적입니다. 사전 확률을 모르면 사후 확률도 의미가 흐려집니다. 그러나 반복 게임에서는 다릅니다. 각 라운드의 결과가 다음 라운드의 사전 확률을 만듭니다. 사전이 점점 정확해지면서 사후도 정확해집니다. 반복 게임 게임이론을 다룬 인터뷰에서 다룬 협력의 진화도 본질적으로 베이즈 업데이트의 누적입니다. 상대가 협력했다 = 협력형일 사전이 올라간다. 배신했다 = 협력형일 사전이 내려간다.

게임이론의 형식적 분석은 영문 자료 중에서는 스탠퍼드 철학백과의 게임이론 항목이 가장 체계적입니다. 폰 노이만과 모르겐슈테른의 1944년 원본 논의부터 현대의 진화 게임이론까지 분량은 길지만 모든 핵심 개념을 다룹니다. 베이지안 게임은 그 글의 후반부에 등장합니다.

실전에서의 적용 한계

베이즈가 만능은 아닙니다. 두 가지 큰 한계가 있습니다.

한계 1, 사전 확률을 어떻게 정할 것인가

전문가도 사전 확률을 정확히 알기 어려운 영역이 많습니다. 모르면 정직하게 “균등 분포”로 가야 하는데, 그러면 충분한 데이터가 쌓이기 전까지는 사후 확률이 거의 의미가 없습니다. 사전을 자의적으로 정하면 사후도 자의적입니다.

한계 2, 우도비 추정의 오차

새 정보가 가설을 얼마나 지지하는지를 정확히 수치화하기 어렵습니다. “이 증거는 가설 A를 가설 B보다 3배 강하게 지지한다”는 진술은 직관이지 측정이 아닙니다. 정밀하게 보이려고 숫자를 붙여도 결국은 추정입니다.

이 두 한계가 베이즈를 실용에서 어렵게 만들지만, 그렇다고 베이즈를 버릴 이유는 아닙니다. 베이즈의 핵심 가치는 정답을 주는 것이 아니라 사고의 비대칭을 드러내는 것입니다. 새 정보를 받았을 때 내 사후가 사전과 같다면, 어딘가에서 무언가를 무시했다는 신호입니다. 그 신호를 잡아내는 것만으로도 의사결정의 질은 평균을 넘어섭니다.

Dr. R의 메모

제가 베이즈를 가르칠 때 가장 자주 받는 질문은 “그래서 사전을 어떻게 정합니까”입니다. 답은 단순합니다. 가능한 한 데이터가 많이 쌓일 때까지 사전을 정하지 마십시오. 그게 안 되면, 사전을 의식적으로 명시하고 그것이 사후에 얼마나 영향을 주는지 따로 계산해 보십시오. 사전의 영향이 크면 결론도 사전에 종속됩니다. 그게 사전 분포 분석(prior sensitivity analysis)의 출발점입니다.

마지막으로, 베이즈는 행동의 정답을 주지 않습니다. 베이즈는 확신의 정도에 대한 정답을 줄 뿐입니다. 70퍼센트 확신이 80퍼센트로 올라갔다고 해서 행동을 바꿔야 한다는 뜻은 아닙니다. 확신과 행동 사이에는 비용, 변동성, 자금 규모 같은 변수가 생기시만 그 다음단계는 그변수를 다루는 법입니다