그런데 작년 4월에 진행된 2013 보스턴 마라톤에서는 불미스러운 폭탄 테러가 일어나 중간에 경기가 중단되고 말았다. 그 결과 6000여 명의 참가자가 경기를 끝마치지 못했고, 대회 조직위원회는 이들에게 다음 대회 참가 자격을 어떻게 부여해야 하는지를 놓고 고심하고 있다.
그러던 중 미국 노스캐롤라이나대의 리차드 스미스 교수가 방법을 내놓았다. 참가자들이 마지막으로 지난 체크포인트(구간 기록을 구하기 위해 5km마다 지나는 지점) 통과 기록을 가지고 통계학적으로 완주 기록을 예측할 수 있다고 제안한 것이다.
스미스 교수가 사용한 방법은 K 근접 이웃(K-Nearest Neighbor)이다. 이 방법은 구하고자 하는 값과 비슷한 기존 기록 중에서 유추를 통해 예상 값을 구하는 알고리즘이다. 우선 참가자가 마지막으로 지난 체크 포인트 기록을 2011년과 2012년의 완주자의 같은 거리의 기록과 비교해, 유사한 K개의 표본을 고른다. 그런 다음 기존 완주자들의 최종 기록을 ‘분산분석’으로 분석해 참가자의 예상 완주기록을 유추해 내는 것이다. 분산분석은 통계학에서 두 개 이상 다수의 집단을 비교하고자할 때 쓰이는 분석기법이다.
스미스교수는 “이웃이라고 부르는 표본의 개수를 100개부터 300개까지 다양하게 해 봤지만 결과엔 큰 차이가 없었다”며, “적은 표본으로도 충분히 결과를 예상할 수 있다”고 덧붙였다.