우리가 가장 흔히 접하는 선거 예측은 ‘여론조사’입니다. 나이, 성별, 지역, 직업 등을 고려해 조사 대상을 구성하고, 어떤 후보를 지지하는지 조사해 정리하는 방식이지요. 통계학적으로 올바르게 설계하면 상당히 정확하지만, 실제로는 여론조사마다 결과가 제각각인 게 현실입니다. 선거 결과를 조금 더 정확하게 예측할 수는 없을까요?
2020년 미국 노스웨스턴대학교와 캘리포니아대학교 로스엔젤레스(UCLA) 등으로 이뤄진 공동 연구팀은 전염병의 전파를 예측하는 수학 모형을 이용한 새로운 선거 예측 모형을 만들었어요. 연구팀이 활용한 전염병 모형은 ‘SIS 모형’입니다. 이 모형에서 전체 인구는 전염병에 걸리지 않은 취약군(S)과 전염병에 걸린 감염군(I)으로 나뉘며, 감염군(I)이 회복하면 다시 감염될 수 있는 취약군(S)으로 돌아갑니다. 이때 시간의 흐름에 따라 각 집단에 속한 사람의 수가 얼마나 되는지를 예측하지요.
미국 대통령선거는 민주당과 공화당이라는 두 거대 정당이 대결하는 형태입니다. 그래서 연구팀은 감염을 일으킬 수 있는 병원체가 두 종류라고 가정했습니다. 즉 민주당(D)과 공화당(R), 그리고 취약군에 해당하는 부동층(U)이 서로 상호 작용하며 변화하는 것이지요. 이때 민주당 및 공화당 지지자는 부동층을 설득할 수 있지만, 부동층은 양당 지지자에게 영향을 끼치지 않는다고 가정했습니다. 부동층은 민주당 및 공화당 지지자와 상호 작용하며 어느 한쪽 지지자가 될 수도 있고 다시 부동층으로 돌아올 수도 있습니다.
연구팀이 이 모형을 미국의 상원의원 및 대통령선거에 적용한 결과, 전체적으로 90% 이상의 높은 적중률을 보였습니다. 특히 버락 오바마 민주당 후보와 밋 롬니 공화당 후보가 맞붙은 2012년 미국 대통령선거의 적중률은 100%였습니다. 미국은 간접선거제이므로, 어떤 주에서 어느 후보가 승리할지 모두 맞혔다는 뜻입니다. 가장 최근에 있었던 2020년 미국 대통령선거에서도 조 바이든 민주당 후보가 도널드 트럼프 공화당 후보를 꺾을 확률이 89%라고 예측했고, 실제로 바이든 후보가 당선됐습니다.
우리나라도 사실상 두 거대 정당이 지지율을 대부분 나눠 갖고 있습니다.
혹시라도 이 모형을 적용해 본다면 누가 대통령이 될지 실마리를 얻을 수 있지 않을까요?