기대값이 같아도 결과 분포가 다르면 선택이 달라져야 합니다

기대값 계산은 의사결정의 출발점이지 종착점이 아닙니다. 기대값이 동일한 두 선택지가 있을 때, 실제로 어떤 선택이 더 나은지는 기대값 외부의 정보에서 옵니다. 분산, 왜도, 파산 가능성이 그것입니다. 기대값 하나만 보고 결정하는 것은 도로 사정을 무시하고 목적지 좌표만 보고 운전하는 것과 같습니다.

기대값

기대값과 중앙값이 갈라지는 구조

다음 두 선택지를 비교합니다. A는 50퍼센트 확률로 1,000을 받고, 50퍼센트 확률로 0을 받습니다. B는 99퍼센트 확률로 500을 받고, 1퍼센트 확률로 50,500을 받습니다. 두 선택지의 기대값은 모두 500으로 같습니다. 그러나 결과 분포는 완전히 다릅니다. A의 중앙값은 500이고, B의 중앙값은 500입니다. 그런데 실제로 여러 번 반복하면 B는 대부분의 경우 500을 받고 드물게 50,500을 받습니다. A는 절반의 경우 아무것도 받지 못합니다.

이 구조에서 반복 횟수가 핵심 변수가 됩니다. 한 번만 선택한다면 개인의 필요 현금과 리스크 선호에 따라 A와 B 중 어느 것이 나을지 달라집니다. 수천 번 반복한다면 두 선택지의 결과는 기대값으로 수렴하므로 차이가 줄어듭니다. 선택의 반복 가능성이 최적 전략을 결정합니다.

로그 수익률과 산술 수익률의 차이

투자 수익률 표기에서 이 문제가 구체적으로 드러납니다. 1년 차에 50퍼센트 수익, 2년 차에 50퍼센트 손실이 났다고 합시다. 산술 평균 수익률은 0퍼센트입니다. 실제 자산은 어떻게 됐을까요. 1,000 × 1.5 × 0.5 = 750입니다. 25퍼센트 손실입니다. 산술 평균이 0을 말할 때 실제 자산은 25퍼센트 줄었습니다. (Khan Academy의 기대값 기초 강의)

로그 수익률(geometric return)이 실제 자산 변화를 정확하게 반영합니다. 위 예시의 로그 평균 수익률은 -13.4퍼센트입니다. 산술 0퍼센트와 로그 -13.4퍼센트의 차이는 변동성에서 옵니다. 변동성이 클수록 산술 수익률과 로그 수익률의 차이가 벌어집니다. 장기 투자에서 변동성을 관리해야 하는 수학적 이유가 여기 있습니다.

왜도(skewness)가 기대값 해석을 바꾼다

미국 가구 평균 소득과 중앙 소득은 다릅니다. 2023년 기준 미국 가구 평균 소득은 약 105,000달러이지만, 중앙 소득은 약 74,000달러입니다. 차이는 오른쪽 꼬리, 즉 매우 높은 소득을 가진 소수가 평균을 끌어올리기 때문입니다. 평균이 “일반적인 미국 가구의 소득”을 대표하지 않습니다. Khan Academy의 기대값 기초 강의가 이 구조를 상세히 보여줍니다.

의사결정에서 같은 문제가 생깁니다. 기대값을 보고 선택했지만 실제로 경험하는 것은 중앙값에 가까운 결과입니다. 극단적으로 긍정적인 결과가 기대값을 높여놓은 경우, 대부분의 실제 경험은 기대값보다 낮습니다. 기대값이 높아도 대부분의 경우 기대값보다 낮은 결과를 받는다면, 그 선택이 정말 좋은 선택인지를 다시 물어야 합니다. (CFA Institute의 확률 개념 심화)

파산 조건이 전략을 바꾼다

기대값이 아무리 높아도 파산 가능성이 있으면 전략이 달라집니다. 한 번의 결과가 회복 불가능한 상태를 만들 수 있다면, 기대값 최적화는 의미를 잃습니다. 파산하면 이후의 모든 기대값을 실현할 기회가 없어집니다. (우위의 의미)

나심 탈렙이 강조하는 에르고딕성(ergodicity) 문제가 이것입니다. 100명이 각자 한 번씩 리스크를 감수하는 앙상블 확률과, 한 사람이 100번 반복하는 시간 확률은 다릅니다. 앙상블에서 평균적으로 좋은 결과가 나온다 해도, 한 개인이 반복할 때는 파산 구간을 거치면 이후 회복이 불가능합니다. 이 차이를 무시하고 앙상블 기대값으로 개인의 반복 전략을 설계하면 장기적으로 파괴적입니다.

실용적 적용: 기대값 외에 봐야 할 것들

어떤 선택을 평가할 때 기대값 외에 세 가지를 추가로 확인합니다. 첫째, 최악의 결과가 회복 가능한가. 자산의 50퍼센트 이상 손실은 회복에 필요한 수익률이 기하급수적으로 커집니다. 이 선을 넘지 않는 것이 최우선입니다. 둘째, 이 선택을 얼마나 반복할 수 있는가. 반복 횟수가 많을수록 기대값이 현실화될 가능성이 높아집니다. 셋째, 결과의 분산이 허용 범위 안인가. 분산이 크면 기대값이 높아도 실제 경험 결과는 크게 다를 수 있습니다.

기대값 계산을 생략하는 것이 문제가 아닙니다. 기대값만 보고 다른 것을 생략하는 것이 문제입니다. 두 선택지의 기대값이 같을 때 무엇이 더 나은지를 판단하는 능력이 정교한 의사결정과 단순한 의사결정의 차이입니다.

실전에서 분포를 직접 시각화하는 방법

어떤 선택의 결과 분포를 손으로 그려보는 것이 의외로 효과적입니다. 최솟값, 최댓값, 가장 가능성 높은 값, 그리고 그 사이 몇 가지 구간을 직접 적어보는 것입니다. 이 과정에서 자신이 기대값만 보고 분포를 무시하고 있었음을 발견하는 경우가 많습니다. CFA Institute의 확률 개념 심화는 이 시각화 접근을 실생활 의사결정에 적용하는 구체적 방법을 다루고 있습니다.

기대값 계산 기초에서 출발하는 것이 맞지만, 기대값은 도구입니다. 모든 도구가 그렇듯, 이것이 측정하지 못하는 것을 아는 사람이 더 잘 씁니다.

분포 사고를 훈련하는 구체적 방법

분포 사고는 훈련 가능한 기술입니다. 다음 단계로 익힐 수 있습니다. 어떤 수치 예측을 할 때 단일 값 대신 90퍼센트 신뢰 구간을 말하는 습관을 만듭니다. “내년 매출은 10억이 될 것이다”가 아니라 “내년 매출의 90퍼센트 신뢰 구간은 7억에서 15억이다”처럼 말합니다. 이 습관이 정착하면 자신이 실제로 얼마나 불확실한 상태에 있는지를 인식하게 됩니다.

슈퍼예측자 연구에서 일관되게 나타나는 특징이 이것입니다. 정확한 예측자들은 단일 값이 아니라 분포로 생각합니다. 틀린 것이 아니라 분포 추정이 어긋난 것으로 결과를 해석합니다. 그리고 어긋난 방향을 분석해 다음 예측의 분포를 조정합니다. 이 과정 자체가 베이지안 업데이트의 실용적 형태입니다.

분포를 보는 눈이 생기면 기대값이 좋아 보이는 선택에 숨겨진 꼬리 위험이 보이기 시작합니다. 그리고 기대값이 평범해 보이는 선택에서 하방이 제한된 안정적 구조가 보입니다. 그 차이를 읽는 것이 의사결정의 실질적인 기술입니다. 기대값 자체는 누구나 계산합니다. 분포를 보는 능력은 훈련이 필요합니다.