'내가 우산을 들고 간 날은 비가 안온다'라는 경험에서 나온 믿음과 그것이 실제로도 그대로 적용될 확률은 원론적으로 별개의 문제이다.적절한 관계 설정 없이 임의적이고 추상적으로 활용하는 확률과 통계는 잘못된 판단의 지름길이다.
우리 모두는 자신을 둘러싼 주변의 상황들이 순조롭게 풀려주기를 기대한다. 하지만 실제는 자신에게 유리한 방향으로 일이 진행되는 것을 당연하게 생각한다. 그래서 사람들은 자신이 바라는 대로 잘 진행된 일은 쉽게 잊지만 순조롭게 풀리지 않았던 일은 오랫동안 뇌 속 깊숙이 남긴다.
몇년 전부터 사람들에게 공감을 얻고 있는 ‘자신에게 나쁜 쪽으로만 일이 발생한다’는 ‘머피의 법칙’이 있다. 이것은 사실 부정적인 방향에 치우친 통계자료만을 활용해서 얻어낸 결론이다. 예를 들면 ‘못을 박다가 망치를 떨어뜨리면 항상 발등 위에 떨어진다’는 머피의 법칙을 생각해보자. 못을 박을 때 운동 중인 망치가 떨어질 수 있는 면적은 팔의 운동에 따라 대략 1만3천㎠이다. 그런데 사람의 발이 차지하는 면적은 두쪽 다 합해봐야 8백㎠내외이므로 정말로 망치가 내 발등에 떨어질 확률은 (800 / 13,000) x 100 ≒ 6%가 된다. 이 결과값은 일반적으로 거의 발생하기 어려운 확률이다. 그런데 왜 사람들은 이런 비합리적인 주장들을 너그럽게 수용하는 것일까.
모든 확률은 통계자료와 밀접한 관계를 갖고 있다. 좀더 정확히 말하면 올바른 확률 계산은 정확한 통계자료를 토대로 했을 때 가능하다. 그런데 생활 속의 경험을 통해 쌓아온 개인적 통계 자료들은 객관적이지 못하다. 위에서 말한 머피의 법칙처럼 모든 일이 순조롭게 풀리기를 바라는 마음과 모종의 피해의식이 적절하게 결합돼 개개인의 통계자료들은 각기 특정 방향으로 편향돼 있는 것이다. 이를 잘못 활용하면 손해와 이득이 분명하게 드러나는 현실 속에서 엉뚱한 판단을 내리게 된다.
에이즈 오진의 가능성은 99.9%?
어느 평범한 회사원이 정기 건강 검진을 받는 중에 이상 징후가 발견됐다. 그래서 정밀검사를 실시했는데 에이즈(AIDS)에 걸렸다는 진단결과가 나왔다. 이때의 정밀 검사 신뢰도가 99%라고 할 때,이 사람은 정말로 에이즈에 감염됐을까. 대부분의 사람들은 감염됐다고 판정하며 그 확률을 99%라고 생각한다. 그래서 에이즈라는 판결을 받은 사람은 구체적인 증세가 나타나기도 전에 애인과 헤어지고 재산을 처분하는 등 인생을 포기하는 행동을 벌이기 쉽다.
그러나 여기에 확률에 대한 치명적인 오류가 숨어 있다. 우리나라에서 에이즈는 희귀한 병이어서 감염자보다는 정상인의 수가 압도적으로 많다. 현재 국내에서는 5만명에 한명 꼴로 에이즈에 감염된 상태다. 99%의 정밀검사 신뢰도로 10만명을 정밀 검사해서 에이즈 감염여부를 파악해보면 1천2명이 에이즈 양성반응자로 판정된다. 그러나 이들 중 진짜 에이즈 환자는 통계로부터 예상되는 2명뿐이고, 나머지 1천명은 1%의 오진에 의해 날벼락을 맞는 멀쩡한 사람들이다.
에이즈 양성반응자 = 잘못된 진단확률 x (전체 인원 - 전체인원 x 에이즈 감염확률) + 바른진단확률 x (전체인원 x 실제 에이즈 감염확률) = 0.01 x (100,000 - 100,000 x 0.00002) + (0.99 x 100,000 x 0.00002)= 1,002
어째서 우리의 상식과 이렇게 다른 결과가 나타나는 것일까? 일반적으로 99%를 높게 신뢰하는 경우는 어떤 일이 발생하는 경우와 그렇지 않은 경우의 확률이 동일하다는 전제에서 비롯한다. 하지만 에이즈처럼 표본 집단이 특정방향으로 심하게 편중돼 확률이 균등하게 적용되지 못할 경우에 이런 상식은 깨지게 된다. 앞으로 에이즈 바이러스가 더욱 기승을 부려서 국민 2명중 1명 꼴로 에이즈에 감염되는 살벌한 세상이 온다면, 그때 비로소 99%라는 검사의 신뢰도를 액면 그대로 믿을 수 있게 될 것이다.
일확천금의 함정
사람들의 확률에 대한 부정확한 직관을 활용하는 대표적인 사업이 복권이다. 한장에 1천원을 주고 사는 연식추첨복권은 확률적으로 볼 때 약 5백원을 손해보게 된다. 복권 한장을 샀을 때 기대되는 값이 5백원이기 때문이다. 전체 기대값은 각각의 당첨금액에 당첨될 확률을 곱해서 더한 값이다. 이 전체 기대값에서 가장 큰 비중을 차지하는 것이 가장 낮은 당첨금액을 받는 꼴찌들의 기대값이다. 그런데 3백60원의 기대값을 가지는 5등과 6등에 당첨된 복권을 환전소에 가져가면 당첨금을 현금으로 주지 않고 새 복권으로 바꿔 준다. 여기서 우리는 복권의 함정에 다시금 빠지게 된다.
복권을 좋아하는 사람들에게는 1등에 당첨될 기회가 한번 더 생겼다는 기대감을 가질 것이다. 하지만 앞서 말한바와 같이 복권의 기대값은 항상 액면가보다 적으므로 6등에 당첨되면 결국 1천원으로 5백원짜리 물건을 강매당한 셈이 된다. 뿐만 아니라 이 복권으로 다시 6등에 당첨되면 역시 똑같은 감소형 사이클이 반복되면서 결국 6등에 해당되는 기대값은 0으로 수렴하게 된다. 1천원짜리 복권의 수학적인 기대값은 5백원이지만 6등에 당첨된 복권을 다른 복권으로 바꿔주는 방식에 의해 실제의 기대값은 훨씬 적어진다.
구입한 즉시 당첨 여부를 알 수 있는 소위 즉석식 복권도 이와 동일한 형식으로 판매되므로 확률에 비해 소비자가 더 불리해지기는 마찬가지다. 이 즉석식 복권에는 또다른 함정이 숨어 있다. ‘자동차 그림이 3개 나오면 자동차를 준다’는 복권. 동전으로 복권을 긁으며 2개의 자동차를 발견하는 순간, 우리는 침을 삼키며 아직 벗겨지지 않은 나머지 칸들을 경건한 자세로 응시한다. 나올 수 있는 그림의 종류가 10개라고 하면 마지막 3번째 칸에 자동차 그림이 나올 확률은 언뜻 볼 때 10%, 과연 그럴까.
앞서 보았던 에이즈 판정의 경우를 상기해 보라. 통계 자료가 특정 방향으로 편향되어 있는 한 확률에 관한 우리들의 직관은 결코 맞을 수 없다. 이 경우에도 애초에 복권을 발행할 때부터 자동차 그림 3개가 숨어있는 수가 6백만매 중에 딱 하나라서 도저히 10%의 확률을 기대할 수 없다. 이 복권은 기본적으로 2개의 자동차가 인쇄돼 있는 경우가 총매수 6백만매 중에 5백90만매 이상이다. “그렇다면 복권에 어차피 꽝이나 다름없는 자동차를 아예 그려넣지나 말지…”라고 원망하고 싶은가. 당신이 복권업자라면 그렇게 하겠는가. 물론 복권사업에서 생긴 이익 중 상당부분은 공공의 이익을 창출하거나 불우한 사람들을 돕는데 사용되므로 무조건 부정적으로 볼 수는 없다. 하지만 복권사업은 소비자의 사행심과 성급한 마음을 교묘하게 이용하고 있음은 틀림없다.
도박은 심리 게임
확률에 관한 이야기를 할 때 빼놓을 수 없는 것이 도박이다. 화투의 ‘섰다’와 카드의 ‘포커’ 등 무작위로 나누어 받은 패로 승패를 가리는 도박에는 소위 ‘족보’라는 서열이 있어서 높은 족보를 손에 넣은 사람이 이기게 된다. 그렇다면 게임의 공정성을 위해 높은 족보는 그만큼 나올 확률이 작아야 한다. 크게 보면 카드의 경우에는 어느 정도 이 법칙에 충실해 가장 높은 족보인 로열 스트레이트 플러쉬(Royal Straight Flush)는 1천만번 게임을 했을 때 15번밖에 나타나지 않을 확률로, 포커게임을 평소 즐기지 않는 이상 평생 한번을 잡아보기가 힘들다. 반면 화투로 하는 섰다게임은 좀 다르다. 단 2장으로 승패를 가리는 화투게임은 높은 족보(10-10)와 낮은 족보(1-1)가 나올 확률이 1/190의 확률로 동일하다.
실제 포커에서도 족보의 우열차이는 있지만 확률은 동일한 경우가 더 많이 존재한다. 포커에서 우열의 차이를 보이는 에이스원페어와 투원페어는 같은 원페어로 동일하게 약 3%의 확률을 가진다. 총 13가지 원페어를 더하면 각자 개인별로 원페어가 나올 확률은 42%가 된다. 아무것도 안될 확률은 50%이다(표2 참조). 그러다보니 확률적으로 서로 원페어이면서 경쟁하게 되는 경우가 많이 나타나게 된다. 특히 원페어와 투페어가 아닌 그 이상의 좋은 족보가 나올 확률이 매우 낮기 때문에 이보다 좋은 족보에 의해 승패가 갈리기보다는 같은 확률을 가지는 족보내에서 우열을 가리게 된다.
그러다보니 결국 도박의 승패는 확률보다는 베팅으로 상대방을 압도하는 심리적인 요인이 훨씬 더 중요하게 작용하게 된다. 즉 같은 확률일 가능성이 크므로 확률적으로 나오기 힘든 확실히 좋은 족보가 아니면 상대방의 배짱있는 베팅에 맞서기 어려워진다. 이런 특성으로 장시간 게임을 진행하다보면 심리 조절을 잘하고 요령에 능한 사람이 결국 승리하게 된다. 도박이 확률에 의해 공정성이 유지되는 것이라기보다는 고도의 심리게임임을 알 수 있다.
중세 시대에 수학은 인기있는 분야가 아니었다. 숫자에 민감한 사람들은 주로 상인들이었고, 이들은 자신들만의 독특한 계산법을 비밀스럽게 간직하고 있었다. 특히 확률과 통계는 주로 도박사들의 노력으로 그 기틀이 형성됐다. 이 분야는 철저히 음지에서만 활용돼 발전하기 어려웠다. 예를 들면 3개의 주사위를 굴려서 눈의 합을 알아맞추는 도박은 고대 로마시대부터 널리 통용되고 있었지만 모든 경우의 수에 대한 구체적인 확률값은 13세기가 돼서야 비로소 세상에 공개됐다.
현대에는 확률 개념이 초등학교 교과서에도 나올 정도로 대중화됐다. 이것은 과거에 불확실했던 개념들이 수학의 도움을 받아 깔끔하게 정립됐기 때문이다. 이와 더불어 인간의 생활 속에 숨어 있으면서 우리의 삶을 좌우하는 요인들이 대부분 확률적 성격을 갖고 있다는 사실도 드러났다.
아이스크림과 범죄는 동일?
사건을 일으키는 요인이 몇개로 한정될 때에는 원인과 결과라는 인과관계에 따라 사건의 전말을 파악할 수 있고, 또 앞으로 다가올 결과들을 예견할 수도 있다. 그러나 원인의 종류가 다양해지면 이런 식의 문제 해결이 불가능하기 때문에 우리는 알아내기 어려운 인과관계를 뒤로 제쳐두고 통계자료에 의존할 수밖에 없다.
그리고 바로 이곳에서 확률이라는 역설적 개념이 그 모습을 드러낸다. 언뜻 보기에는 제법 논리적이고 설득력이 있어 보이지만 인과관계가 완전하게 배제된 통계자료는 결코 남용돼서는 안될 것이다.
미국의 한 연구자가 통계자료를 연구하다가 아이스크림과 범죄에 관한 통계자료를 보고 특이한 사실을 발견했다. 아이스크림의 판매가 많을 때는 범죄 발생 건수도 많았고, 아이스크림의 판매가 적을 때는 범죄 발생 건수도 적었다. 그래서 이 연구자는 ‘아이스크림이 판매가 증가할수록 범죄도 증가한다’는 결론을 내렸다. 통계자료는 분명 사실이다. 그럼 아이스크림을 사먹지 않아서 판매가 줄면 범죄도 자연히 줄어든단 말인가. 이 사례는 서로 관련성 없는 통계자료를 가지고 무의미한 인과관계를 도출한 대표적인 예다. 잘못된 확률적 직관을 갖고 있는 것도 문제지만 더욱 심각한 것은 이처럼 의미없는 통계자료를 맹신하는 태도다.
또다른 예를 들어보자. 여러분들은 어렸을 때부터 꿈과 현실의 상관관계에 대한 이야기들을 많이 들어왔을 것이다. ‘돼지꿈을 꾸면 운이 좋기 때문에 복권을 사면 당첨된다’는 말과 ‘개꿈을 꾸면 그날은 하루가 불행하다’는 식의 꿈과 관련된 많은 이야기들이 있다. 실제 개꿈 꾼 사람과 돼지꿈을 꾼 사람을 따로 나눠서 실험을 했더니 위와 같은 결과가 나왔다고 하자. 비록 결과가 그렇게 나왔다하더라도 꿈 때문에 그렇게 됐다고 할 수 없는 문제들이다. 즉 상관관계라는 관계성이 꿈보다는 다른 곳, 예를 들면 그 전날 일을 열심히 해서 다음날 그 결과를 얻게 되는 것이지 그것이 꿈 때문에 그렇게 됐다고 할 수는 없다.
현대인의 일상 생활은 다양성이 무한하기 때문에 우리는 확률과 통계에 의존할 수밖에 없다. 그러나 이것은 믿음을 대신할 뿐 진리가 될 수는 없다. 일기예보가 틀려서 비에 젖었을 경우에는 옷을 말려 입으면 되지만, 그릇된 통계로 인해 한번 잘못 인식된 선입견은 좀처럼 바로잡기가 힘들다. 만일 그 통계의 대상이 사물이 아닌 사람이라면 문제는 더욱 심각해진다. 우리 현실에는 실제로 잘못 인식된 선입견이 너무나도 많이 존재한다는 것을 이 글을 읽으며 충분히 인식했을 것이다. 그릇된 통계로 인한 잘못된 생각의 틀을 과감히 깨뜨리면 세상을 보는 눈이 달라질 것이다.