지난 3월 ‘야구월드컵’ 월드베이스볼클래식(WBC)에서 한국이 4강에 올랐다. 우리 국민이면 누구나 올해 6월 독일에서 열리는 월드컵에서도 2002년 한일월드컵 4강 신화에 이어 또 다시 세계 4강에 들었으면 하는 기대를 할 것이다.
이번 독일월드컵에서 한국팀 성적을 예측해보자. 지난 3월 초 한국갤럽이 전국 성인남녀 1520명을 대상으로 독일월드컵의 전망을 조사했다. 조사 결과 93.1% 이상의 응답자가 한국팀이 16강 이상의 성적을 낼 것이라고 기대했다. 이 방법이 월드컵 성적을 예측하는 제대로 된 방법일까.
펠레의 저주 vs 수학공식
과학적인 예측을 하는 사람도 설문조사를 이용해 많은 문제를 해결한다. 특정분야의 전문적인 문제에 대해서는 보통 전문가 설문방법을 동원한다. 가령 한국팀의 독일월드컵 성적을 축구전문가인 국내 K리그 감독을 대상으로 조사하는 방식이다.
그러면 전문가 설문방법이 항상 정확할까. 축구를 좋아하는 사람이면 누구나 ‘펠레의 저주’라는 말을 들어본 적이 있을 것이다. ‘펠레의 저주’란 브라질의 축구황제 펠레가 월드컵에서 우승후보로 꼽았던 팀이 졸전 끝에 예선 탈락하는 전통을 두고 생긴 말이다.
필자가 속한 연구실은 과거 데이터를 분석해 그 경향을 수식으로 만든 뒤 예측한다. 축구 경기 결과를 예측하기 위해서는 승패 또는 득·실점을 설명하는 수학공식이 필요하다.
과거 데이터에서 분석하고 싶은 것은 이런 내용이다. 아드보카트 감독이 부임한 뒤 한국팀이 더 잘 이기는지, ‘유럽파’가 가세하면 승률이 높은지, 국제축구연맹(FIFA)이 정한 순위가 높은 강팀을 만나면 이길 확률이 낮은지 등.
예측모형을 만들기 위해 데이터를 찾아야 한다. 먼저 아드보카트 감독이 오고 난 뒤 국가대표팀 평가전의 자료를 수집했다(자료 수집과 사전 분석은 연구실의 김동수 석사과정생이 담당했다). 승패, 득·실점, 유럽파가 참여했는지, 그 경기가 친선경기인지, 우리 관중이 많았는지, 상대팀의 FIFA 랭킹 등에 대한 자료였다.
수집된 자료를 바탕으로 경기별 승리 확률을 예측하는 수학공식을 만들었다. 아드보카트 감독이 와서 지난 3월 초까지 대표팀이 치른 경기는 단 13경기. 성적은 8승 2무 3패였다. 최근의 몇 경기만으로는 자료가 부족해 의미 있는 결과를 낼 만한 수학공식을 만들 수 없었다.
이번에는 본프레레 감독이 대표팀을 지휘했던 시기의 경기까지 조사했다. 물론 2002년 히딩크 감독 시절부터 자료를 수집할 수 있지만, 축구 경기결과는 워낙 급변해 과거 수십년의 자료를 분석하는 일이 꼭 도움이 되진 않는다.
결국 국가대표간의 38경기 자료를 모았다. 경기장의 온도, 상대편의 1군이 경기에 나왔는지, 그 경기를 하기 전 최근 6경기의 결과까지 수집했다. 이제 좀 쓸 만한 공식을 만들 수 있었다. 정확도 83%로 경기결과를 예측하는 공식이 탄생했다. 과거에 이긴 경기는 승리확률을 높게, 진 경기는 승리확률을 낮게, 비긴 경기는 확률을 50% 근처로 예측하는 공식의 정확도가 83%라는 것이다. 하지만 실제 미래 결과를 예측할 때는 경험으로 볼 때 공식의 예측 정확도가 이보다 더 떨어진다.
한국팀 승패, 이전 3경기 결과에 영향 받아
필자의 연구실에서 만든 공식에 따르면 한국팀의 승패는 경기 바로 전 3경기 결과에 영향을 받았다. 즉 지난 3경기에서 모두 승리했다면, 이번에 이길 확률은 낮다는 뜻이다. 여러 번 이겼을 때는 좀 자만해 경기를 망친다는 결과가 수식으로 표현된 것이다. 또 FIFA 랭킹이 한국보다 높은 상대를 만나면 이길 확률이 떨어진다. 상대팀 1군이 참여했을 때도 한국팀이 이길 확률은 낮아진다. 물론 우리의 유럽파가 참여하면 이길 확률이 높아진다. 아드보카트 감독이 오고 나서도 승리 확률이 조금씩 올라가고 있다.
이제 이 수학공식을 이용해 독일월드컵의 G조 예선경기 결과를 예측해보자. 한국이 상대하는 팀은 토고(FIFA 랭킹 59위), 프랑스(7위), 스위스(35위) 순이다. 현재 한국의 FIFA 랭킹은 30위다. 2002년 히딩크 호는 월드컵을 앞두고 스코틀랜드, 잉글랜드, 프랑스를 상대로 평가전을 치렀다. 이들 강팀과 맞붙어 1승 1무 1패를 기록했다.
한국은 오는 6월 1일 노르웨이(40위)와 6월 4일 가나(50위)와 평가전을 벌일 계획이다. 5월 26일에도 국내에서 보스니아-헤르체고비나(63위)와 평가전을 치를 예정이다. 필자의 연구실에서 만든 공식은 독일월드컵 예선결과를 예측하기 위해 과거 3경기 결과가 필요하다. 2002년처럼 이 3경기에서 1승 1무 1패를 기록한다고 가정했다.
토고와의 첫 경기에서 이길 확률은 98%로 예측됐다. 승리인 것이다. 다음 경기인 프랑스전에서 한국이 이길 확률은 2%(패할 확률은 98%)였다. 패전으로 예측됐다. 마지막 스위스와의 경기결과는 이길 확률이 61%로 나왔다. 무승부로 예측된 경우다. 한국의 예선 결과가 1승 1무 1패로 예측된 셈이다.
한국이 독일월드컵 16강에 올라가기 위해서는 6월 13일 프랑스가 스위스를 많은 점수차로 이겨야 한다. 스위스가 토고를 이겨 한국과 똑같이 1승 1무 1패가 되더라도 한국이 골득실에 앞서야 16강에 갈 수 있을 것으로 예상되기 때문이다.
16강서 스페인 이길 확률 66%
한국이 16강에 진출했다고 가정하면 어디까지 올라갈 수 있을까. 16강, 8강, 4강에서 만날 상대를 가정해 승리확률을 예측해봤다(그림). 16강에서 상대가 스페인이 될 경우 한국이 이길 확률 66%. 이길 확률이 높아 보이지만, 사실 예측모형의 판정은 무승부다. 보통 예측확률이 0~33%는 패배, 33~67%는 무승부, 67% 이상은 승리라고 판정하기 때문이다. 물론 토너먼트 방식으로 치르는 16강 이후는 무승부일 때 승부차기로 승패가 결정된다. 연구팀이 분석한 38경기에서는 승부차기를 벌인 경우가 없기 때문에 승부차기 결과까지는 예측할 수 없다.
만약 승부차기에서 이겨 8강에 진출한다 하더라도 한국의 8강 상대는 브라질이 될 가능성이 높다. 8강에서 한국이 이길 확률은 58%로 예측됐다. 역시 무승부로 승부차기까지 가야 한다는 결과다. 승부차기에서 이긴다고 가정하면 4강에서는 잉글랜드, 포르투갈, 멕시코 중에서 한 팀을 만날 것으로 보이는데, 어느 팀이든 예측결과 이길 확률이 2%에 불과하다. 패전이 예상된다.
독일월드컵에서도 한국이 4강에 들었으면 하는 것이 축구광인 필자의 바람이다. 연구실에서는 경기결과를 더 잘 예측하는 모형을 만들기 위해 한국팀 경기에서 어떤 선수가 얼마나 뛰었는지까지 알아보고 상대편 선수도 조사하고 있다. 한국팀이 예측결과보다 더 좋은 성적을 거두려면 우리 모두 대~한민국을 더 크게 외쳐야 하지 않을까.