d라이브러리









“전 정말 억울하다고요~!”
 
국내 유일! 세계 유일! 확률 사건만을 해결하는 ‘확률 법정’은 오늘도 억울한 사연을 가진 사람들로 떠들썩하다. 수학 사건 전담인 ‘나해법’ 판사가 법봉을 두들기며 재판 시작을 알리자, 첫 번째 소송을 제기한 ‘공내기’ 씨가 침을 튀기며 억울함을 호소했다.


'권위에 호소하는 오류’에 빠진 공내기 씨

판사님! 저 사기꾼에게 엄벌을 내려 주세요~. 저 사람 때문에 빈털터리가 됐다고요~.
어디 보자 …. 승부 예측 사기 사건이라 ~. 쯧쯧 …. 공내기 씨, 어쩌다 이런 실수를 하셨소? 확률만 제대로 계산 했어도 여기 올 일은 없었을 텐데 말이요. 이 사건은 보나마나 공내기 씨의 패소!


축구광인 공내기 씨는 어느 날 자신이 활동하는 온라인 축구 동호회 회원에게 이메일을 받았다. 닉네임이 ‘예측의 신’이라고 하는 이 사람은 “내일 열릴 경기에서 ‘잘차네 팀’이 ‘오대빵 팀’을 이길 것”이라며, 앞으로 계속 경기 결과를 예측하겠다고 했다.

메일을 읽은 공내기 씨는 콧방귀를 뀌며 삭제해 버렸다. 그런데 이게 웬일? 이튿날 뉴스에서 잘차네 팀이 이겼다는 소식이 들려왔다. 실제로 경기 예측이 들어맞자 깜짝 놀란 공내기 씨는 승부 예측 메일에 관심을 갖게 됐다. 게다가 그 뒤로 일주일간 계속 날아온 예측이 모두 맞아 떨어지는 게 아닌가! 이렇게 되자 공내기 씨는 이 정보를 이용해서 내기에 돈을 걸어 한몫 챙길 생각을 하게 됐다. 하지만 정작 내기에 돈을 건 8번째 예측은 보기 좋게 틀렸고, 큰 돈을 잃은 공내기 씨는 예측의 신을 사기꾼으로 고발한 것이다.

나해법 판사가 확률만 제대로 계산했어도 속지 않았을 거라고 말한 이유는 다음과 같다. 한 게임의 승패를 알아맞힐 확률은 50%이다. 각 게임은 독립적인 사건이므로, 일곱 번 연속으로 승패를 알아맞힐 확률은 ${(0.5)}^{7}$=0.0078125, 즉 0.78% 정도로 매우 낮다. 공내기 씨는 이렇게 낮은 확률을 알아맞힌 점 때문에 예측의 신을 신뢰하게 된 것이다.

하지만 조금만 생각해 보면 아무 정보 없이 승패를 연속으로 예측한 방법을 추측할 수 있다. 예를 들어 동호회 회원 수가 1만 명이고, 예측의 신이 모든 회원의 이메일 주소를 알고 있다고 하자. 1만 명에게 절반씩 다른 팀이 이길 것이라고 예측한 메일을 보내면 적어도 5000명에게는 맞는 예측을 보내게 된다. 이렇게 일곱 번 이메일을 보내면 약 78명에게는 모든 경기 결과를 알아맞힌 메일을 보낼 수 있다. 즉, 공내기 씨는 78명 중 한 사람인 것이다.

결국 이 사건은 확률적인 판단을 잘못한 공내기 씨의 탓이다. 이렇게 잘못된 권위에 무작정 따르는 것을 ‘권위에 호소하는 오류’라고 한다.


심슨의 역설 : 어느 대학 낙방생의 하소연

땅땅! 그럼 다음 사건을 심리하겠소. 흠~, 이번엔 대학 입시 부정 사건이라고?
흑흑~, 판사님! 전 정말 제가 떨어질 줄은 몰랐어요. 이건 분명히 대학에서 일부러 여학생에게 불이익을 준 거라고요. 여기 이 통계 자료를 보세요. 이보다 더 명백한 증거가 어디 있겠어요?

 

작년에 수능시험을 친 안재수 양은 자신이 지원한 ‘유명한 대학’에서 불합격 통보를 받았다. 속상한 마음에 대학이 공개한 합격자 통계를 살펴보던 안재수 양은 대학에서 학생을 공정하게 선발하지 않았다는 의심을 품게 됐다. 남학생 지원자의 합격률이 여학생에 비해 무려 10%나 높았기 때문이다. 안재수 양은 이 통계자료를 근거로 대학을 고발했다. 과연 안재수 양은 대학의 비리를 밝히고 당당히 합격증을 받을 수 있을까?

안타깝게도 이번 사건은 안재수 양의 패소입니다. 안재수 양 역시 확률과 통계 자료를 잘못 해석하는 오류를 범했기 때문입니다. 납득이 잘 안 된다고요? 그럼 안재수 양이 고발한 대학에서 발표한 합격자 통계를 좀 더 자세히 살펴 봅시다.
 

이 통계를 보면 놀랍게도 경영학과와 한의예과를 제외한 모든 학과에서 여학생 합격률이 더 높다. 뿐만 아니라 경영학과와 한의예과의 여학생 합격률도 남학생에 비해 아주 조금 낮은 수치로, 오히려 남학생이 불이익을 받았다고 생각할 수도 있다.

통계 자료를 꼼꼼히 들여다보면 이런 차이가 나타난 이유를 알 수 있다. 합격자 수를 기준으로 보면 가장 많은 학생을 뽑은 학과는 물리학과다. 화학과와 수학과, 경영학과, 의예과, 한의예과가 그 뒤를 잇는다. 그런데 남학생들은 가장 많은 학생을 뽑는 물리학과에 가장 많이 지원했고, 다음으로 수학과, 화학과에 많은 수가 지원했다. 하지만 여학생들은 가장 적은 수를 뽑는 한의예과와 의예과에 전체 중 약 42%나 되는 학생이 지원했다.

즉, 들어가기 어려운 과에 많이 지원했기 때문에 전체 합격률이 떨어지는 것이지 여학생에게 불이익을 준 것이 아니다. 합격자 수만 보면 경쟁이 치열한 한의예과와 경영학과 모두 남자보다 여자 합격자가 더 많다.

이처럼 전체 통계와 세부 통계가 일치하지 않는 현상을 ‘심슨의 역설’이라고 한다.

대통령 선거에서도 일어나는 심슨의 역설

심슨의 역설은 영국 통계학자 에드워드 심슨의 연구 결과에서 비롯된 것으로, 실제로 많은 분야에서 일어난다. 가장 대표적인 사례는 대통령 선거다.
전 국민이 투표한 결과 가장 많은 표를 얻은 사람이 당선되는 우리나라와 달리, 미국 대통령 선거는 ‘간선제’라는 방식을 택한다. 간선제는 각 지역마다 대통령 선거에 참여할 수 있는 선거인단 숫자를 배정하고, 주민 투표 결과 더 많은 표를 얻는 정당의 선거인단이 그 지역을 대표해 투표하는 방식이다.
그런데 지역별 선거인단 숫자는 인구 수에 비례해 결정된다. 캘리포니아주처럼 인구가 많은 주는 선거인단이 55명(2000년 당시에는 54명)이나 되지만, 와이오밍주 같이 인구가 적은 지역은 3명밖에 안 된다. 따라서 A정당이 두 지역을 합쳐 2000만 표를 얻고 B정당이 1990만 표를 얻었어도, B정당이 캘리포니아주에서 더 많은 표를 얻었다면 선거인단 수는 3대 55가 된다.
지난 2000년 미국에서는 상대 후보보다 무려 53만 표나 적게 득표하고도 대통령이 되는 상황이 일어났다. 주인공은 미국 43대 대통령인 조지 부시 대통령으로, 이 사건은 지금까지도 미국 대통령 선거 제도가 합리적인지를 따질 때 중요한 예로 언급된다.


앞뒤를 못 가리는 ‘검사의 오류’

이제 오늘의 마지막 사건이로군. 흠…. 끔찍한 살인사건이라…. 게다가 피의자는 유명한 스포츠 스타라고?
재판장님. 이 사건의 범인은 명백합니다. 사건 현장에서 발견된 머리카락의 유전자 정보를 분석한 결과, 피고 누명한 씨와 일치했습니다. 유전자 검사 결과의 신뢰도는 99.999%인 만큼, 의심의 여지가 없습니다.


까다롭기로 유명한 검사 ‘수상한’은 사건 현장에서 발견된 머리카락의 유전자 분석 결과가 일치한다는 것을 결정적인 증거로 내세우며 피고측 변호사를 몰아세웠다. 하지만 베테랑 수학 판사 나해법은 수상한 검사에게 주의를 주었다. 다양한 분야에서 신원 확인 수단으로 활용하는 정확도 99.999%의 유전자 검사에 무슨 문제라도 있는 걸까?

문제는 0.001%에 있다. 즉, 10만 번 검사했을 때 한 번은 잘못된 결과가 나올 수 있다는 말이다. 만약 피고가 사는 지역 주민 수가 100만 명이라면, 유전자 검사를 했을 때 그 중 10명은 잘못된 결과로 유전자가 범인과 일치한다는 판정을 받을 수 있다. 그렇다면 유전자 검사 결과만 놓고 봤을 때 용의자는 10명이나 되는 것이고, 피고가 그 중 한 명일 확률은 10%밖에 안 된다. 따라서 다른 증거가 없는 한 피고가 나머지 9명보다 범인일 확률이 더 높다고 볼 수는 없는 것이다.

‘검사의 오류’라고 부르는 이 문제는 1987년 미국 사회생태학자 윌리엄 톰슨과 에드워드 슈만이 재판에서 통계 자료를 남용한 사례를 조사하면서 제기한 조건부 확률 문제다.

조건부 확률은 어떤 사건이 일어났다는 조건 아래 다른 사건이 일어날 확률을 말하는 것으로, 이 경우에는 피고가 범인인 것(A)과, 유전자 검사에서 일치가 나오는 것(B)의 상관관계를 고려해야 한다. 여기서 99.999%라는 유전자 검사 정확도는 피고가 범인이었을 때 검사 정확도를 나타내는 확률(P(A|B)★)일 뿐이다. 검사 결과가 일치됐을 때 피고가 범인이라는 것을 말해 주는 확률(P(B|A)★)이 아닌 것이다.

즉, 이 사건은 검사가 유전자 검사의 확률적인 의미를 잘못 해석했기 때문에 생긴 오류다.
 

제멋대로 해석하는 ‘변호사의 오류’

감사합니다, 재판장님. 저야말로 수학적인 증거로 피고의 무죄를 밝히겠습니다. 유전자 검사 결과는 물론, 검사측에서 제시한 발자국 증거나 피고가 평소 아내를 자주 때렸다는 증언 역시 확률적으로 보면 증거라고 할 수 없습니다.


맡은 사건을 모두 승리로 이끌기로 유명한 변호사 ‘무고한’은 검사측이 제출한 유전자 검사 결과와 발자국 증거, 그리고 이웃 주민의 증언을 반박하는 확률적인 계산을 제시했다.

무고한 변호사는 우선 검사의 오류에서 지적한 것처럼 유전자 검사 결과가 일치할 때 범인일 확률은 고작 10%이므로, 피고가 무죄일 확률은 90%나 된다고 주장했다. 또 발자국 크기가 같은 사람은 수없이 많기 때문에, 1000명에 한 명 꼴로 발자국 크기가 같다고 해도 주민 100만 명 중에서 1000명이나 되는 사람이 발자국 크기가 같다고 강조했다. 마지막으로 남편에게 폭행 당하는 아내 중에서 남편에게 살해당하는 경우 역시 1000명 당 한 명 꼴이기 때문에 모두 증거로서 의미가 없다고 강조했다.

하지만 나해법 판사는 이런 변호사의 주장도 기각했다. 변호사가 판사와 배심원들의 무죄 판결을 이끌어내기 위해, 확률적인 증거를 피고에게 유리하도록 교묘하게 해석했다는 이유에서다. 비록 유전자 검사 결과만으로는 범인을 단정할 수 없지만, 10%라는 확률은 도시에 사는 100만 명 중에서 피고가 범인일 확률인 0.01%보다 무려 1000배나 높은 확률을 가진 증거다. 즉, 유력한 증거임에는 분명하다.

또 한 가지는 자료가 많을수록 확률이 높아진다는 점이다. 비록 각각의 경우가 가지는 확률은 작을지라도 유전자 검사 결과가 일치하고, 발자국 크기까지 같을 확률은 결코 낮지 않다. 거기에 평소 남편에게 폭행당하던 부인이 남편에게 살해당할 확률까지 더하면 피고가 범인일 확률은 크게 높아진다.

하지만 변호사는 이런 확률을 함께 고려하지 못하게 유도했다. 톰슨과 슈만은 이와 같은 상황을 ‘변호사의 오류’라고 지적했다. 그리고 실제 재판에서 검사의 오류뿐 아니라 다양한 증거가 가지는 확률을 무시하는 오류가 자주 발생한다고 주장했다.

에헴! 최종 판결을 내리도록 하겠습니다. 확률과 통계는 이처럼 일상생활의 사소한 결정뿐 아니라 중요한 재판의 판결까지 좌우하는 근거로 쓰이곤 한답니다. 마치 양 날의 검처럼 제대로 사용하면 유익하지만, 잘못 활용하면 위험하지요. 오늘 오류를 저지른 분들은 모두 이번호 수학동아 확률 기사를 10번씩 읽어 오세요! 땅땅!

이 기사의 내용이 궁금하신가요?

기사 전문을 보시려면500(500원)이 필요합니다.

2013년 02월 수학동아 정보

  • 최영준 기자
  • 글 및 사진

    안승철 교수
  • 사진

    동아일보, 위키미디어 외
  • 일러스트

    소슬랑

🎓️ 진로 추천

  • 수학
  • 통계학
  • 법학
이 기사를 읽은 분이 본
다른 인기기사는?