d라이브러리









Part 1. 알파고가 우리에게 남긴 것들


“예순 아홉. 일흔. 아, 더 없나? 이러면 안되는데….”

3월 9일 광화문 포시즌스호텔 6층. 이세돌 9단과 알파고의 대결이 펼쳐지는 대국실과 복도 하나를 사이에 두고 마주한 기자실에 모인 수백 명의 기자들이 웅성거렸다. 해설을 맡은 김성룡 9단은 바둑판의 집을 세고는 이마에 손을 가져다 대며 혼잣말을 중얼거렸다. 고기를 찾아낸 하이에나 떼처럼, 카메라 수십 대가 김 9단 앞으로 달려들었다. 플래시가 잔뜩 터졌고, 그는 자리에 주저앉았다. 대국을 중계하는 커다란 화면 한쪽의 디지털시계가 오후 4시 18분에서 19분으로 넘어가고 있었다. 그로부터 정확히 10분 뒤에 이 9단이 돌을 던졌다.김 9단이 집을 세기 5분 전까지만 해도 해볼 만하다는 분위기였다. 바둑리그의 감독이자 해설자로 유명한 그가 이 지경이 될 때까지 판세를 파악하지 못했다는 것이 잘 이해가 되지 않았다. 비슷한 일은 다음 경기에서도 이어졌다. 알파고가 파죽지세로 몰아붙이며 3승 0패로 승부를 결정지을 때도 해설자들의 형세판단은 한발씩 늦었다. 반면 알파고를 개발한 딥마인드는 1국이 끝나기 30분 전에, 알파고로부터 승리를 보고 받았다고 발표했다. 마지막 대국이 열린 지난 3월 15일, 같은 장소에서 다시 해설에 나선 김 9단은 알파고를 ‘알신(알파고와 신의 합성어)’이라고 불렀다. 불과 일주일 사이에 많은 것들이 바뀌었다.


고수는 뒷맛을 남기지 않고, 알파고는 맛이 없다

바둑은 인간이 만든 가장 복잡한 보드게임이다. 경우의 수가 너무나 많아 어떤 정형화된 공식으로 바둑을 잘 두는 법을 쉽게 설명할 수 없다. 프로기사들은 보통 이를 직관으로 해결하는데, 이 직관을 말로 표현한 것이 격언처럼 구전돼 내려온다. ‘궁하면 손을 빼라’, ‘중앙으로 한 칸 띈 수에 악수없다’ 등 간단한 검색만으로도 수많은 격언을 찾을 수 있다. 이 조언이 항상 들어맞는 것은 아니지만, 대개는 유효하다. 하지만 알파고는 바둑의 오랜 정석을 비웃기라도 하듯 파격적인 수를 많이 선보였다. 해설자들이 판세를 따라잡는 데 시간이 걸린 것도 알파고의 새로운 기풍 탓이 컸다.
 
이번 대국에서 가장 체면을 구긴 바둑의 정석은 ‘맛’이다. ‘고수는 뒷맛을 남기지 않는다’라는 격언에서 따와, 바둑 해설에서도 맛이란 표현을 많이 쓴다. 맛이란 당장 모양을 결정하기보다는 여지를 남겨두는 것을 뜻한다. 국지적인 전투에서 당장 승부를 보기보다는 주변의 형세가 대략 정해지면 그제야 내 전략을 정하는 것이다.

반면에 알파고는 대국 내내 맛을 남기지 않았다. 4국의 23수를 살펴보자(위 그림). 알파고는 23수로 왼쪽 아래에 백의 강한 돌 옆으로 자신의 돌을 붙였다. 만약 사람이었다면 중앙과 좌변의 형세가 정해진 뒤에 자신이 침투할 위치를 고민했을 터였다. 나중에 필요에 따라 A나 B로 붙이는 게 더 유리할 수 있기 때문이다. 하지만 알파고는 그러지 않았다. 승부가 기운 5국 후반부에서도 알파고는 맛을 남기지 않고 무조건 모양을 정하는 특유의 기풍을 보여줬다. 알파고의 이해되지 않는 행동은 이뿐만이 아니다. 알파고는 2국 종반에도 어처구니없는 선택을 했다. 우측 상단의 흑돌 여섯 개(알파고)와 중앙의 백돌 네 개(이세돌)를 바꿔치기 한 것. 사람들 간의 대결에서는 대악수라고 불리는, 소위 ‘떡수’다. 집으로만 두 집은 손해를 봤다. 그럼에도 2국에서 알파고는 넉넉히 승리를 거뒀고, 유리한 장면에서 악수를 두는 알파고가 사람을 조롱하는 것 같다는 이야기도 나왔다.

전문가들은 경우의 수에서 해답을 찾고 있다. 유리한 국면에서 상대와 치고받고 싸우면 내가 조금은 이득을 볼 수 있겠지만, 알파고는 이 이득을 과감히 포기해 경기가 뒤집힐 수 있는 변수를 줄인다. 20집 차이로 이기나 반집 차이로 이기나 똑같은 승리다. 이를 위해서는 내가 몇 집을 앞서고 있는지 정확히 계산할 수 있어야 한다. 자신이 지지 않는 선에서 경우의 수를 줄여나가야 하기 때문이다. 인간의 능력으로는 쉽지 않다.

알파고가 경우의 수를 줄여 궁극적으로 하고 싶은 일은 ‘해결된 문제(solved game)’를 만드는 것이다. 해결된 문제가 되면 상대가 어떤 수를 두더라도 반드시 이길 수 있는 필승법이 나온다. 오목의 경우엔 먼저 시작하는 흑이 반드시 이길 수 있는 방법이 알려져 있고, 체스는 이동시킬 수 있는 기물의 숫자가 몇 개 이하로 줄어들었을 때 필승법이 계산돼 있다. 알파고도 바둑판의 돌들을 채워 경우의 수를 줄인 뒤 완벽한 승리를 노린 것이다. 감동근 아주대 전자공학과 교수는 “알파고가 1국이 끝나기 30분 전에 승리 메시지를 보고했다고 하는데, 그 시점에 바둑이 해결된 문제에 접어 들어갔다는 것을 의미한다”고 말했다.

알파고의 단조로운 학습 구조가 문제라는 의견도 있다. 알파고는 오직 승리와 패배만을 고려해 자가학습을 했는데, 보상을 조금 더 세분화하면 후반의 떡수를 막을 수 있다는 것이다. 집수에 따라 가산치를 주면 알파고가 더 많은 집 차이로 이기도록 전략을 수정할 것이다. 이런 점을 수정한 알파고의 다음 버전이 나온다면, 이세돌 9단이 불리한 상황에서 보여줬던 ‘눈부신 추격’을 다시는 못보게 될 것이다.



직관의 공식화, 또 다른 직관을 낳는다

알파고는 신비의 영역이라고 불리는 중앙 싸움에서도 계산 능력으로 유리한 고지를 점거했다. 바둑에서는 확실히 집을 낼 수 있는 변과 귀가 요충지다. 변과 귀는 다른 지역과 분리돼 있고, 모서리를 끼고 있어 전투를 벌일 수 있는 공간이 한정돼 있다. 반면 중앙은 천지사방의 돌들과 소통하고 공간도 넓어, 웬만한 고수가 아니고는 중앙에서 어떤 전투가 일어날지 예측하기 힘들다. 정확히 어떤 일이 일어날지 알 수 없기 때문에 돌들의 중앙에 대한 영향력을, ‘두터움’이라는 추상적인 용어로 설명한다. 워낙 미묘해 초보자들은 정확히 어떤 개념인지 이해하기도 힘들다.

하지만 알파고는 두터움을 계산하는 데 어느 정도 성공한 것 같다. 2국에서 알파고의 신의 한수라고 불리는 흑37이 좋은 예다.

백이 37수 다음에 A를 둔다면 상대는 우변에 확실한 집을 짓게 되고, 자신은 불확실한 중앙을 향할 수 있는 수순이었다. 중계를 하던 해설자들도 하나같이 “기원이었으면 바둑 선생님께 크게 혼났을 수”라고 평했다. 알파고는 이어진 왼쪽 아래 전투에서 손해를 보고 도망치는 와중에도 중앙을 향해 나갔다. 특히 흑73은 왼쪽 아래의 백에 거의 포로로 잡혔던 돌들이 순간 중앙으로 진출할 수 있는 두터운 수가 됐다. 2국은 결국 중앙에서 알파고가 큰 이득을 취하며 승리했다.

그래도 체면을 구긴 맛과 달리, 두터움의 중요성은 알파고가 인정한 셈이다. 바둑도 알파고의 도움을 받아 더 발전할 전망이다. 벌써 국가대표 바둑팀이 알파고의 수들을 연구하고 있다는 소문도 들린다. 다만 알파고가 제시한 새로운 패러다임이 인간에 바로 적용될 수 있을지는 의문이다. 알파고는 슈퍼컴퓨터 급의 계산 능력이 있었기에 가능했지만, 인간은 이런 계산이 불가능하다.

그렇다고 인간이 이대로 주저앉지는 않을 것이다. 사실 인간의 직관이 방대한 데이터에 의해 무너진 것은 어제 오늘의 일이 아니다. 데이터가 잘못된 직관을 바로 잡아 그 분야를 발전시키기도 했고, 기존의 직관을 데이터가 증명해 더 발전된 새로운 논의를 이끌어내기도 했다. 전자의 예는 중세인들이 믿던 천동설이고(천체 관측 데이터가 쌓이면서 잘못된 이론으로 드러났다), 후자의 예로는 데이터에 기반한 최근의 야구를 꼽을 수 있다.


이세돌이 남긴 것 : 인간을 뛰어넘은 인간

알파고가 완벽한 모습만을 보인 것은 아니다. 약점도 있었다. 이세돌 9단의 신의 한수라고 불리는 4국 78수 이후, 허둥지둥하는 알파고의 모습은 분명 바둑의 신과는 거리가 멀었다. 전문가들은 알파고가 학습하지 않은 데이터, 즉 78수를 마주했기 때문에 당황한 것이라고 추측하고 있다. 딥마인드의 대표인 데미스 하사비스는 자신의 SNS에 “알파고는 이세돌이 78수 자리에 착수할 확률을 1만 분의 1 이하로 예측했기 때문에 이세돌의 움직임에 매우 놀랐다”고 밝혔다.
 
그렇다면 학습하지 않은 데이터를 어떻게 찾아야할까. 알파고는 온라인 고수들이 둔 바둑 기보 16만 개를 바탕으로 정책망을 구축한 뒤, 정책망과 정책망을 하루에 3만 번씩 대결시켜 만든 새로운 기보 수백만 개로 가치망을 만들었다. 인간 프로기사의 속도로는 1000년 이상 걸릴 정도로 엄청난 양이지만 이 모든 데이터의 뿌리는 결국 인간이다. 알파고끼리 대결을 펼친 것도 결국은 온라인 바둑 고수들의 기보를 바탕으로 한 것이다. 관건은 지금까지 바둑을 뒀던 사람들이 몇 천만 판을 둬도 안 나올 새로운 수를 찾는 것이다. 완전히 처음부터 무작위로 바둑을 두며 최적의 방법을 찾지 않는 이상 알파고는 이런 약점에 항상 노출 될 수밖에 없다.

이 9단이 우리에게 보여준 것은 결국 창의성이다. 인간의 전유물이라고 불렸던 창의적인 작업에 인공지능이 침투하고 있지만 아직까지 그 그물은 헐겁다. 인공지능이 처음부터 독자적으로 쌓아 올린 생각이 아니라, 기본적으로 인간을 흉내 낸 기술이기 때문에 아직은 그것을 뛰어넘는 창의성에는 약점을 보일 것이다. 만약 인간에게서 완전히 벗어난 새로운 학습법이 등장한다면 이마저도 무용지물이 되겠지만, 아직까지는 우리 인간에게 할 일이 남았다.



▼관련기사를 계속 보시려면?

Intro. 알파고 쇼크, 그 후
Part 1. 알파고가 우리에게 남긴 것들
Part2. ‘알파크래프트’ 어디까지 왔나
Part3. ‘딥러닝’ 넘어야 인공지능 시대 온다
Part 4. 인공지능의 미래를 가늠하다

이 기사의 내용이 궁금하신가요?

기사 전문을 보시려면500(500원)이 필요합니다.

2016년 04월 과학동아 정보

  • 송준섭 기자

🎓️ 진로 추천

  • 컴퓨터공학
  • 정보·통신공학
  • 소프트웨어공학
이 기사를 읽은 분이 본
다른 인기기사는?