d라이브러리 2015년 10월 과학동아

선선한 바람이 불기 시작하던 9월의 어느 금요일 오후, 고등과학원에서 엄상일 카이스트 수리과학과 교수와 이승진 고등과학원 수학부 연구원이 기자를 반겼다. 이번 호에는 이들과 함께 ‘더 지니어스’의 생존법을 분석해봤다.

(고등과학원 1호관 엄상일 교수의 연구실. 학창시절 수학포기자(수포자)였던 기자가 제일 먼저 말문을 연다.)

송준섭 기자(이하 송) : 이번 달에는 꼭 포커 게임을 분석해보고 싶다. MIT 수학자들이 블랙잭 확률을 분석해 카지노를 터는 영화를 재밌게 봤는데, 우리도 포커게임을 분석해볼 순 없을까. 지금까지 더 지니어스에 등장한 포커만 시드포커, 인디언포커, 협동홀덤, 양면포커 등 대여섯 가지다.

엄상일 교수(이하 엄) : 포커라면 이승진 박사의 전문분야다. 미국에서 학위를 딸 때 취미삼아 포커 공부
도 많이 했다고 한다.

이승진 박사(이하 이) : 그럼 간단한 포커게임부터 소개해 보겠다. AKQ 포커라는 게임이다.

송 : 카드가 세 장뿐이기 때문에 분석할 것도 없고, 운도 크게 작용할 것 같다.

엄 : 내쉬균형으로 분석할 수 있을 것 같다. 영화 ‘뷰티풀 마인드’로 유명한 수학자 존 내쉬가 제안한 개념이다. 내쉬균형을 찾으면 상대가 어떤 전략을 취하든 항상 똑같은 결과를 얻을 수 있다.

송 : (이미 넋이 나간 표정) 그게 무슨 말인가? 수포자를 위해서 좀 더 자세히 설명해줘야 한다. 이러다가 정말로 기사가 못나갈지 모른다.

이 : 실제 계산 과정을 보면 이해에 도움이 될 것이다. 먼저 철수의 입장에서 전략을 고민해보자. 만약 철수가 A를 받았다면 영희가 K든 Q든 반드시 이긴다. 따라서 무조건 배팅하는 게 좋다. 두 번째로 K를 받았다면 체크를 하는 게 좋다.

송 : 50% 확률로 영희가 가장 낮은 Q일 수도 있다. 배팅을 해도 되지 않을까.

이 : 영희가 Q라면 내가 배팅을 해도 따라오지 않는다. 자기가 가장 낮은 카드를 들고 있으니 당연히 죽는
다. 반대로 영희가 A라면 철수가 배팅을 하면 반드시 배팅을 따라온다. 제일 높은 카드니까. 결국 K를 들고 있을 때는 배팅을 해도 아무 이득을 못 얻고 손해를 볼 수밖에 없다.

송 : 그렇다면 가장 낮은 Q를 받았을 때도 체크하는 게 좋겠다.

엄 : 영희의 입장에서 생각해보자. 철수는 A를 들었을 때는 반드시 배팅을 하고, K를 받았을 때는 반드시 체크하는 게 유리하다. 그런데 여기서 Q일 때도 체크한다면 어떻게 될까. 전략이 단순해지기 때문에 게임을 시작하고 몇판이 지나지 않아 영희는 철수가 A를 들었을 때만 배팅한다는 것을 눈치 챌 것이다. 철수의 전략을 모두 알게 되니 영희가 유리할 수 밖에 없다. 그런데 만약 철수가 Q를 받았을 때 일정한 확률 x로 거짓말(블러핑)을 한다면 어떨까. 가장 높은 A를 들고 있다면 당연히 배팅을 따라오겠지만, K를 들고 있을 때는 문제가 복잡하다. K를 들고 있는 영희는 철수가 A인지, Q인지 알 수 없다. 영희는 y의 확률로 배팅을 따라 가거나 포기할 수밖에 없다. 여기까지 생각했을 때 최선의 전략은 이렇다.

이 : 이제부터 할 일은 x와 y를 계산하는 일이다.

만약 철수가 거짓말을 자주 한다면(x값이 크다면) 영희는 상대의 허풍을 눈치 채고 배팅을 선택해 더 많
은 칩을 딸 것이다. 반대로 철수가 거짓말을 적게 한다면(x값이 작으면) 상대의 거짓말을 잡아내는 것을 포기하고 자신의 칩을 지킬 수 있다. 어느 쪽이든 영희가 유리하다. 이를 막기 위해서 철수가 해야 하는 일은 영희포기와 영희콜을 같게 만들어 최선의 전략을 없애는 것이다. 이를 만족하는 x의 값은 3분의 1이고, 이것을(철수 기준에서) 내쉬균형이라고 부른다.

엄 : 철수가 Q를 가지고 있을 때 영희의 최선의 전략도 이렇게 구할 수 있을 것 같다.

이 : 그렇다. 철수의 기댓값을 계산해보자. 만약 철수가 Q를 가지고 거짓말을 했을 때 영희가 지레 겁을 먹고 포기하면 기본배팅인 칩 2개를 얻을 수 있다(+2). 하지만 거짓말이 들통나면 칩 1개를 잃는다(-1). 철수는 거짓말이 1번 성공하고, 2번 실패해도 본전이다. 따라서 철수는 거짓말을 했을 때 딸 확률이 3분의 1이상이면 무조건 거짓말을 하는 게 좋다. 그 이하이면 거짓말을 하지 않는 게 이득이다. 역시 어느 경우든 철수의 선택에 따라 더 좋은 전략이 생긴다. 영희는 이것을 막기 위해 철수가 어떤 선택을 하든 똑같은 결과를 얻게 하면 된다.

엄 : 철수가 Q라면 영희는 2분의 1 확률로 A 또는 K를 가지고 있다. A를 가지고 있을 때는 100% 콜을 하고, K일 때 확률 y로 콜하면 된다. 철수가 블러핑을 했을 때 영희가 3분의 2로 콜하면 철수의 블러핑 여부와 상관 없이 기댓값이 같다.

이를 만족하는 y 값은 3분의 1이다. 영희가 K를 받았을 때 33%의 확률로 배팅을 따라가면 철수의 거짓말 비율에 상관없이 최선의 결과를 얻을 수 있는 것이다.

송 : 벌써 한 시간이 흘렀다. 그새 한 분이 더 오셨다.

정승조 박사(이하 정) : 고등과학원 수학부 정승조다. 평소에 지니어스 팬이다. TV를 볼 때 진지하게 분석하는 스타일이 아니라 생존법을 생각해본 적은 없다
(웃음).

송 : 지니어스 게임 중에 인디언포커를 분석할 수 있을 것 같다. 인디언포커도 결국은 얼마나 거짓말을 잘 하냐의 싸움이다.

이 : 방송에서 사용했던 게임을 조금 단순하게 만들어 보자. 실제 인디언포커는 영희 같은 후플레이어가 배팅 금액을 늘릴 수 있어서 수십 번 배팅이 오갈 수 수 있다. 그럴 경우엔 경우의 수가 거의 무한대에 가
깝게 커져 계산이 어렵다. AKQ처럼 영희는 칩 개수를 늘릴 수 없다고 가정하자. 송 : 인디언포커는 자신의 카드를 못보고 상대의 카드만 볼 수 있는 것이 핵심인데 이것은 차이가 없나.

정 : 결국 내가 아는 정보의 양은 동일하다. 상대편의 머리 위에 있는 카드가 내 카드라고 생각하고 플레이해도 결과가 똑같을 것 같다.

엄 : 영희의 내쉬균형을 구하는 방법도 AKQ와 똑같다. 앞서 게임과 마찬가지로 철수가 거짓말을 할 때 딸 수 있는 확률을 영희가 3분의 1로 맞추면, 거짓말하든 하지 않든 기댓값은 같을 것이다. 따라서 나에게 유리한(숫자가 낮은 카드) 3분의 2인 카드에는 콜을 하고, 불리한(숫자가 높은 카드) 3분의 1 카드에는 포기하는 게 좋다. 다시 말해, 철수가 1부터 6까지의 카드를 가졌을 때는 콜을 하고, 8~10이라면 포기한다. 7일 경우에는 3분의 2 확률로 콜을 하고, 3분의 1 확률로 포기하면 된다.

이 : 철수도 비슷한 추론으로 영희의 전략을 알아냈다고 가정하자. 그때 철수의 최선의 전략은 무엇일까. 배팅으로 판을 키울 때는 승리 확률이 50% 이상인 것이 좋다. 밸류(value) 배팅이라고 불리는 포커의 기본전략이다. 영희가 본인에게 유리한 3분의 2에만 콜을 하므로, 철수는 그 카드를 50% 이상의 확률로 이길 수 있는 상위 3분의 1 카드에 배팅을 하면 밸류 배팅이 된다. 영희가 1, 2, 3을 가지고 있을 때 배팅을 하고 4일 경우에는 3분의 1 확률로 배팅을 하는 게 좋다.

정 : 하지만 영희도 곧 이 전략을 눈치 채고 배팅을 따라 오는 범위를 줄여 이득을 볼 수 있을 것 같다. 철수의 전략에 따라 더 좋은 전략이 있으니 내쉬균형이 아니다. 내쉬균형을 맞추려면 인디언포커에서도 거짓말을 해야 될 것 같은데….

이 : 좋은 지적이다. 내쉬균형을 맞추려면 블러핑을 해야 된다. AKQ 포커처럼 블러핑과 밸류 배팅의 비율이 1:3일 때 내쉬균형이 된다. 철수가 상위 3분의 1카드인 1, 2, 3과 4의 일부에 배팅을 하고 있으므로, 그것의 3분의 1인 하위 9분의 1에 블러핑하면 된다. 영희가 10일 때는 무조건 배팅(블러핑)을 하고, 9를 들고 있을 때는 11% 확률로 거짓말을 하는 것이 좋다.

수학자들을 고민에 빠지게 한 인디언포커의 벌칙

송 : 그런데 한 가지 궁금한 점이 있다. 인디언 포커에는 독특한 규칙이 있는데 만약 내가 10을 들고 상대의 거짓말에 속아 배팅을 포기하면 추가로 벌금을 낸다. 그래서 상대의 10 카드를 보고도 일부러 큰 숫자의 칩을 걸어 상대가 포기하게 유도하곤 한다. 혹시 상대의 10을 잡기 위한 거짓말 확률도 구할 수 있을까.

엄 : 일단 10×10 행렬을 그려서 각 상황별로 철수와 영희가 받는 보상을 계산해서 … (이때부터 기자는 아무것도 알아듣지 못했다.)

정 : 그건 어려울 것 같은데, 식 개수보다 변수가 더 많다. 이 : 아. 분명히 구할 수 있는데….(그렇게 난상토론이 한 시간 가량 이어졌다.)

이 : 10으로 졌을 때 벌칙이 너무 크다. 실제 인디언포커는 총 50개의 칩을 가지고 게임을 하는데, 벌칙으로 내야 하는 칩이 무려 10개다. 때문에 직관적으로는 상대가 10을 가지고 있으면 100% 확률로 거짓말을 하는 게 유리한 것 같다.

정 : 1부터 9인 경우와 10인 경우를 나눠서 계산하는 건 어떨까.

엄 : 좋은 생각이다. 10일 경우에 상수 C를 도입해서…. (외계어, 외계어, 외계어)

이 : 그것도 어렵다. 둘 다 10을 가졌을 때, 철수가 10일 때, 영희가 10일 때 등 경우의 수가 너무 많다.
(또 한 시간. 토론을 시작한지 벌써 세 시간 반이 넘었다. 기자는 이미 두 시간 전부터 말이 없다.)

송 : 벌써 퇴근시간이 한참 지났다. 이렇게 오래 할 줄 몰랐다.

이 : 나는 오래할 줄 알았다. 원래 수학자들이 독하다. 엄 : 이게 수학자들 연구방식이다. 이러다가 해답을 찾으면 그게 바로 논문이 되는 거다.

송 : 이 정도 했으면 독자들도 우리를 인정해줄 것 같다. 웃자고 시작한 일을 죽자고 달려드는 여러분이 무섭다. 이제 그만하고 저녁 먹으러 가자. 오늘은 과학동아가 쏜다.

엄 : 점심엔 한식을 먹어서, 저녁은 중식을 먹고 싶다. 탕수육으로. 송 : 무엇이든 좋다. 제발 그만 끝내자.
(독한 수학자들의 토론은 중국집에서도 이어졌다. 식사를 마치고 이승진 박사가 기자를 집 근처에 데려
다 줬는데 차안에서도 지니어스 이야기를 했다. 집 근처의 지하철역에 내려서야 기자의 길고긴 금요일 밤이 끝이 났다.)

[Knowledge] 더 지니어스의 생존법 : 인디언포커