빌리 조는 우리나라 상황을 조금 더 잘아야 한다고 생각했다. 그래서 우리나라 프로야구 팀에서 꽤 긴 시간 데이터분석관으로 활동한 SK 배원호 매니저를 만나 조언을 구했다.
Q야구단에서 일하면 정말 매일 야구 보나요?
일이 다 끝난 뒤 봅니다. 재미로만 보는 게 아니라 꼭 봐야 해요. 이전 자료보다 시즌 중 한 경기의 데이터가 더 중요하기 때문에 야구를 보지 않고서는 제 일을 제대로 할 수 없어요. 경기를 보고 얻은 데이터로 필요한 요소를 뽑아 분석하는 게 주 업무입니다.
Q야구 보다가 야구단에 입사하셨다던데…, 맞나요?
연세대학교 응용통계학과를 졸업하고 대학원을 다닐 때 일 년 정도 매일 야구만 보고, 야구 커뮤니티 정보를 봤습니다. 6시 30분에 야구 보고, 10시~11시쯤 야구가 끝나면 각종 야구 커뮤니티에 올라온 글을 모두 읽었어요. 그러다 나름대로 데이터를 분석해 인터넷에 글도 썼지요. 어느 날 SK 구단에서 인터넷에서 저의 활약(?)을 보고 연락이 왔어요.
Q그럼 종일 야구만 보면 야구 데이터분석관이 될 수 있다는 건가요?
아니요. 지금 데이터분석관을 꿈꾸는 청소년이라면 수학 공부를 열심히 하세요. 저는 한국에서 거의 처음 데이터분석관이 된 사례기 때문에 특이한 경로로 입사했지요. 그러나 데이터 야구가 활발해질수록 한국 구단도 미국처럼 전문성을 갖춘 사람을 찾게 될 거예요. 실제 미국도 처음에는 통계학자를, 이제는 수학자와 물리학자를 찾고 있습니다.
Q감독의 투수 교체는 도대체 왜 팬들 마음과 다를까요?
저도 입사 전에는 팬질하던 사람이기 때문에 그 마음을 압니다. 그러나 구단에 들어오고 나서 선수 몸 상태와 같은 내부 자료가 엄청 영향을 준다는 걸 알게 됐어요. 차단된 내부 정보가 핵심인데, 그 부분을 반영하지 않고서는 정확하게 판단할 수 없어요. 예를 들어 어떤 선수가 겉으로는 잘 던지고 있지만, 사실 팔꿈치에 뼛조각이 돌아다닐 수도 있고, 인대가 늘어나 있을 수도 있거든요. 내부에서만 알 수 있는 사실이죠.
Q감독은 실시간으로 분석한 데이터를 얼마나 이용하나요?
한국은 덕아웃에 전자기기를 반입할 수 없습니다. 그래서 실시간으로 분석해 자료를 종이로 전달하지요. ‘기기’ 반입만 안 되니 기기로 만든 결과물은 줘도 되니까요. 이처럼 저는 데이터를 보고 분석해서 전달하는 역할을 합니다. 사실 경기 전 연습할 때 말고 긴박한 경기 상황에서는 얼마나 참고하는지 모릅니다. 현장의 감이라는 걸 무시하지 못하고, 감독의 성향에 따라 다르기 때문이지요. 저는 그저 최대한 정밀하게 데이터를 분석해서 자료를 넘기고, 판단은 감독과 코치가 합니다.
Q전문가의 눈으로 분석한 올 시즌 순위는?
2018 시즌은 팀 간 성적의 차이가 너무 컸습니다. 그런데 올해는 차이가 더 심하게 벌어질 것으로 보입니다. 분석 결과 키움, SK, 두산 세 팀이 압도적으로 3강 구도를 취하고, 나머지 7팀은 큰 차이가 없을 것으로 보입니다. 심지어 3위와 4위 차이가 4위와 10위 차이보다 크게 예측되지요. 구단에서는 보통 WAR로 불리는 선수력과 선수 연령을 측정하는 노화곡선을 회귀분석하고, 새로운 외국인 선수를 변수로 분석해 구단의 성적을 예측합니다.