d라이브러리









양자 감옥에서 사라지는 죄수 딜레마

배신과 협력 넘어서는 윈-윈 전략

심문을 받고 있는 죄수는 딜레마에 빠진다. 같이 붙잡혀 다른 방에서 심문을 받고 있는 동료를 배신할지 말지를 고심한다. 만약 자신은 입을 다물었는데 친구가 배신하면 어떻게 될까. 그런데 이같은 죄수 딜레마는 양자세계에서 사라진다.
 

양자 감옥에서 사라지는 죄수 딜레마


일제 시대 한 남자가 시낭송 모임 장소로 가는 기차 안에서 그날 밤 낭송할 시들을 대강 훑어보고 있었다. 두 사람의 일본 비밀경찰이 이를 유심히 지켜보고 시 속에 무언가 비밀 암호가 있지 않을까 의심했다. 곧이어 그들은 그를 간첩 협의로 체포했다. 그 남자는 단순히 윤동주의 ‘서시’라고 항의했지만 받아들여지지 않았다. 감옥에 갇힌 지 이틀째 되는 날 취조원이 들어와서 말했다. “숨김없이 말하는 것이 좋을 거야! 당신 친구 윤동주도 우리들에게 이미 체포됐어. 그리고 이미 다 털어놓았지!”

고전적으로 게임참가자는 배신 선택

이렇게 해서 ‘죄수 딜레마’라고 하는 유명한 게임 이야기가 시작된다.

일본 비밀경찰은 그저 이름이 윤동주라는 이유만으로 체포된 다른 사람에 대해서도 시낭송인과 똑같은 심문을 다른 방에서 했다. 만약 무고한 이 두 사람이 심문을 잘 견딘다면 두 사람은 3년형을 선고받는다. 그런데 시낭송인이 공범자가 있다고 거짓 자백하고 윤동주는 어떠한 자백도 하지 않으면 시낭송인은 1년형, 윤동주는 반항적이라 해서 25년의 중형을 선고받는다. 반대로 시낭송인이 자백하지 않고 윤동주가 거짓 자백을 한다면 형량은 반대로 된다. 또한 두 사람이 모두 자백을 하면 둘다 10년형을 선고받는다.

그렇다면 여기에서 시낭송인은 어떻게 생각할까. 윤동주가 자백했다고 생각할까 그렇지 않았다고 생각할까. 자백하는 것을 전제로 할 때 자신이 자백하면 10년, 그렇지 않으면 25년형을 선고받는다. 때문에 자신은 자백하는 편이 좋다고 생각한다. 반대로 윤동주가 자백하지 않는 것을 전제로 할 때 자신이 자백하면 1년형, 자백하지 않으면 3년형이 되기 때문에 역시 자백하는 편이 좋다고 생각한다.

따라서 시낭송인 입장에서는 자백하는 것이 최선책임이 자명해보인다. 조선총독부 어느 지하 취조실에 있는 윤동주도 동일한 결론에 도달했다. 결국 두 사람 모두 자백하고 말았다. 나중에 그들은 감옥에서 만나게 됐고 서로의 이야기를 비교해본 결과 자신들이 실수했음을 알아차렸다. 두 사람 모두 자백하지 않았다면 가장 짧은 형기로 끝마칠 수 있었는데….

만약 심문을 받기 전에 서로 만나 의논할 수 있는 기회가 있었다면 어땠을까. 두 사람 모두 자백하지 않을 것을 약속했을 것이다. 그러나 결국 이와 같은 합의와 협력은 그다지 잘 지켜지지 않으리라는 것을 알 수 있다. 일단 그들이 따로따로 다른 방에 나눠져 모진 심문을 받게 되면 상대야 어찌되든 짧은 감옥살이로 끝내려는 자신만의 이기주의에 지배되는 것이다. 과연 서로의 입장에 따라 가장 좋은 결과를 가져오는 신뢰와 협력을 끝까지 이룰 수 있을까.

두 사람이 절친한 친구 사이였다고 하더라도 이 죄수 딜레마를 피해갈 수는 없다. 올 상반기에 개봉돼 화제를 모은 영화 ‘뷰티풀 마인드’의 실존 주인공인 천재 수학자 존 내시는 이 상호 배신과 같은 불쾌한 결과를 ‘내시 평형’이라고 했다. 그는 죄수 딜레마 게임의 참가자들이 논리적으로 경기를 한다면 안정한 ‘내시 평형’이 만들어진다는 것을 처음으로 밝혔다. 상호 협력이 상호 배신보다 더 좋은 결과를 가져온다는 것을 알면서도, 이성적인 참가자는 반드시 배신을 선택한다는 것이다. 그 후 수십년 동안 이 단순한 게임을 연구한 수학자들의 결론도 역시 마찬가지였다.

기묘한 중첩과 얽힘 현상

그러나 이제는 꼭 그렇게만 되지는 않을 것 같다. ‘고전 전략’ 대신 ‘양자 전략’을 채용함으로써 다른 결론에 도달할 수 있다는 연구 결과가 발표되고 있다. 양자역학적으로 게임을 하면 죄수 딜레마에서 벗어날 수 있다는 말이다. ‘양자 전략’에 관한 이론적 연구에 따르면 고전 세계에서는 게임참가자가 비이성적으로 생각했던 ‘협력’을 완전한 양자 세계에서는 가장 좋은 전략으로 선택한다.

그렇다면 어떻게 양자 규칙에 따라 게임을 할 수 있을까. 고전적인 죄수 딜레마에서는 협력 또는 배신만이 유일한 선택이었다. 그러나 신기하게도 양자 시스템은 협력 또는 배신 상태보다는 그것들의 ‘중첩’(superposition) 상태에 있을 수 있다. 협력하면서도 배신하고 배신하면서도 협력하는 상태에 있을 수 있다는 말이다.

양자 규칙과 관련해 ‘중첩’보다 훨씬 더 기묘한 양자 현상이 또 있다. 게임 참가자들의 선택이 서로 ‘얽혀있을’ 수 있다는 것이다. 한 사람의 선택이 다른 사람에게 영향을 준다는 말이다. 두 사람이 아무리 멀리 떨어져 있더라도 한 사람의 선택이 즉각적으로 다른 사람의 선택을 결정해버린다. 이러한 양자 현상을 ‘양자 얽힘’(quantum entanglement)이라고 한다. 예를 들어 광자와 같은 두개의 양자 입자가 얽힌 상태에 있다고 가정해보자. 한 광자의 편광 상태를 측정하면 ‘양자 얽힘’ 현상에 따라 다른 광자의 편광 상태가 자동으로 정해진다.

이제 양자 세계에서 일어나는 두명의 죄수 딜레마 게임을 생각해보자. 이들은 큐빗(qubit)을 갖고 게임을 한다. 큐빗은 컴퓨터의 0과 1처럼 2진수 디지털 값을 가질 뿐 아니라 두값을 동시에 가질 수도 있는 양자 비트(quantum bit)다. 큐빗으로는 ‘위’나 ‘아래’ 방향의 스핀을 갖는 전자로 생각할 수 있다. 전자는 양자역학적이기 때문에 ‘위’와 ‘아래’ 방향의 스핀의 중첩 상태에 있을 수 있다. 이 기묘한 중첩 상태는 누군가 전자의 스핀 상태가 ‘위’인지 ‘아래’인지를 측정하려고 할 때 깨진다.
 

고전 세계에서는 심문을 받는 죄수는 딜레마에 빠진다. 동료를 배신할지 아니면 입을 꾹 다물어 야 할지를 고민하게 된다.


1/2협력 1/2배신할 때 기대값 판결

이제 죄수들이 가질 수 있는 큐빗의 상태를 생각해보자. 전자의 스핀이 위 방향일 경우 협력, 아래일 경우를 배신이라고 한다면 두 죄수의 큐빗 상태는 몇가지나 될까.

두 죄수 A와 B의 상태를 나열해보면 4가지뿐이다. (협력A, 협력B), (협력A, 배신B), (배신A, 협력B), (배신A, 배신B) 이렇게 4가지다.

그러나 양자 게임에서는 중첩 상태가 가능하기 때문에 큐빗의 상태는 무척 많다. 양자적으로 (1/2협력A1/2배신A, 협력B), (1/3협력A2/3배신A, 배신B)처럼 수많은 조합이 가능해 컴퓨터를 이용해 먼저 조사한다. 이때 큐빗의 상태에 따라 각 죄수가 받는 판결이 결정된다. 만약 큐빗이 협력과 배신의 어떤 중첩 상태에 있다면, 판결은 협력과 배신에 대한 판결의 평균값(또는 기대값)으로 한다. 예를 들어 (2/3협력A1/3배신A, 협력B)일 경우 1/3(협력A, 협력B)+2/3(배신A, 협력B)와 같다. 둘다 협력하면 3년형, 한명이 배신하고 다른 사람이 협력하는 경우 배신한 쪽이 1년형, 협력한 쪽이 25년형이라면 A는 약 1.7년(3/3+2/3)형을, B는 약 17.7년(3/3+50/3)형을 받는다. 이처럼 양자 세계에서는 고전 세계에 없던 판결이 나온다. 양자역학은 기본적으로 확률 이론이므로, 결국 판결은 그 기대값을 의미한다.

만약 두 죄수들이 모두 ‘협력’ 방향의 큐빗으로 게임을 시작한다고 하자. 그 큐빗들을 양자적으로 서로 얽히게 해 어떤 중첩 상태에 놓이게 한다. 이 상태는 누군가가 큐빗들 상태를 측정하면 모두 ‘협력’이거나 모두 ‘배신’이 되도록 할 수 있다. 이 경우 두개의 큐빗들 중에 하나만 측정하면 된다. 한 큐빗이 ‘협력’ 상태라면, 나머지 큐빗들은 양자 얽힘에 의해 순간적으로 ‘협력’ 상태가 되기 때문이다. 따라서 이 양자 얽힘을 적절히 활용한다면, 게임 참가자들은 큐빗이 측정될 때 관찰되는 상태를 변화시킬 수 있다. 가령 한 큐빗은 ‘협력’ 나머지 큐빗은 ‘배신’ 또는 한 큐빗은 ‘배신’ 나머지 큐빗은 ‘협력’과 같은 식으로 말이다.

일단 큐빗들이 얽히게 되면, 각 죄수는 의도한 작전대로 자신의 큐빗 상태를 조정한다. 즉 큐빗의 상태를 바꾸지 않고 그대로 놔두거나 큐빗을 뒤집어서 배신하거나 협력과 배신의 중첩 상태로 만들어버린다. 죄수들의 선택이 끝나면 취조원이 얽힘 과정을 역으로 추적해서 각 큐빗의 상태를 측정한다.

연구에 따르면 이 양자 게임에서 ‘중첩’과 ‘얽힘’ 정도에 따라 배신과 협력 사이의 어떤 양자 전략을 취하는 것이 최선이라고 한다. 그 양자 전략을 고전적인 언어로 설명하기는 어렵다. 다만 그 양자 전략을 사용할 때 가장 가벼운 형량의 판결을 받게 될 수도 있다는 것뿐이다. 다시 말해서 그 양자 전략은 양자 감옥에서는 가장 이성적일 뿐만 아니라 가장 유용하다는 말이다. 또한 더이상 어떠한 딜레마도 존재하지 않는다.

최근 중국의 과학기술대학 연구자들이 내놓은 두 사람의 양자 게임에 관한 실험 결과는 무척 고무적이다. 그들은 양자 게임을 핵자기공명 양자컴퓨터에 실험적으로 구현했다. 이 실험의 기본 원리를 잠깐 들여다보자. 자기장 내에 놓인 원자핵은 자기모멘트에 따라 몇개의 정해진 방향만을 향하게 된다. 이 허용된 방향에 따라 각각 미소한 에너지 차(差)가 있는데, 이 차에 해당되는 에너지는 마이크로파(전자기파 스펙트럼 중, 주파수 3백MHz-3백GHz 전자기파) 정도다. 마이크로파의 진동수, 즉 에너지를 바꾸면서 원자핵에 조사하면 그 방향(또는 상태)을 바꿀 수 있다.
 

완전히 얽혀있는 양자 게임에서는 죄수들이 고전적인 딜레마에 빠지 지 않고 모두가 좋은 결과를 얻을 수 있다.


이기적 행동으로 운명 바꿀 수 없다

여기에서 한쌍의 원자 상태는 두명의 게임 참가자들이 선택한 전략을 뜻한다. 이 원자들은 어떤 조건 하에서 양자적으로 얽힐 수 있다. 원자핵 사이의 상호작용에 의해 어떤 신호가 발생되는데, 이것이 여러가지 상태의 원자들이 만들어내는 판결이라고 해석된다.

그들의 연구 결과에 따르면 고전 게임에서는 두 사람 모두 이성적으로 게임을 하면(이성적 논리에 의해 배신을 선택한다면) 그 어느 누구도 이길 수 없지만, 양자 게임에서는 양자 전략을 사용하면 두 사람 모두 이길 수 있다. 이것은 양자 얽힘 정도를 변화시키면서 게임의 양상이 어떻게 변하는지 살펴봄으로써 알 수 있다. 양자 얽힘 정도가 작을수록 고전적이고 높을수록 양자적이기 때문이다. 양자 얽힘 정도가 0에서 점점 증가할 때, 게임의 양상이 두번 바뀐다. 처음에는 두 사람 모두 나쁜 결과를 얻는 대신 한 사람이 다른 사람보다 더 좋은 결과를 얻는 양상으로 변한다. 그러다가 양자 얽힘이 더 증가해 완전한 양자 게임이 되면 두 사람 모두 좋은 결과를 얻는다. 즉 양자 게임에서는 고전적인 딜레마에 빠지지 않고 모두에게 ‘윈윈’인 결과만을 얻을 수 있다는 말이다. 양자적으로 완전히 얽혀있을 때는 두 참가자 모두 상호협력하게 되는 새로운 내시 평형이 나타나기 때문이다.

고전적인 죄수 딜레마 게임에서는 참가자들이 사전에 아무리 오랫동안 의논하더라도 이기심으로 말미암아 서로가 서로를 배신한다. 결국 모두 오랜 세월을 감옥에 갇혀서 보내게 된다. 그들은 고전 게임에서와 마찬가지 행동을 양자 게임에서 할 수 있다. 그러나 중첩과 얽힘에 의해 훨씬 더 괜찮은 결과를 얻을 수도 있다. 양자 게임에서는 참가자들 중 누구도 이기적으로 행동한다고 해서 자신의 운명을 개선할 수는 없다. 그들의 궁극적인 운명은 고전 게임에서와는 다른 방식으로 서로 얽혀있기 때문이다.

이 기사의 내용이 궁금하신가요?

기사 전문을 보시려면500(500원)이 필요합니다.

2002년 10월 과학동아 정보

  • 진행

    박현정
  • 정순신 선임연구원

🎓️ 진로 추천

  • 물리학
  • 컴퓨터공학
  • 철학·윤리학
이 기사를 읽은 분이 본
다른 인기기사는?