![](https://images.dongascience.com/uploads/article/Contents/201503/M201503N011_img_99.jpg)
하지만 모두가 그 꿈을 이룰 수는 없다. 영광의 자리는 단 한 팀에게만 허락된다. 2015년 가을의 전설은 어느 팀이 차지할까? 수학을 알면 그 주인공을 미리 볼 수 있다. 수학동아와 함께 2015년 프로야구를 전망해 보자.
비즈볼 프로젝트
유의미한 스포츠 컨텐츠의 지속적인 생산을 목표로 만들어진 단체. 야구, 축구, 농구 같은 종목을 중심으로 활동 중이다. 필자가 속한 야구팀은 팟캐스트 ‘트루볼쇼’을 비롯해 세이버매트릭스를 기반으로 한 다양한 활동을 이어가고 있다.
매년 이맘때가 되면 ‘전력 차이가 거의 없다’ 같은 안전지향적 기사에서부터 1등부터 꼴찌까지 순위를 예언하는 확신형 기사까지 다가올 프로야구 시즌을 전망하는 기사가 넘쳐난다. 이런 예측은 주로 선수단의 변화나 스프링캠프 분위기를 바라본 ‘전문가의 느낌’을 바탕으로 한다. 과연 ‘사람의 느낌’만으로 미래를 전망하는 것은 합리적일까?
필자는 조금 다른 시선에서 2015년 프로야구를 바라보고자 한다. 바로 수학과 통계에 기초한 세이버매트릭스★다. 영화 <;머니볼>;을 봤거나 야구에 남들보다 관심이 많다면 한번쯤 그 이름을 들었을 것이다. 세이버매트릭스의 고향인 미국에서는 ‘집스’나 ‘스티머’ 같은 다양한 예측 시스템이 이미 널리 쓰이고 있다.
한국에선 세이버매트릭스는 이제 막 걸음마를 뗀 정도다. 한국 프로야구의 현실에 맞는 분석법이 아직 제대로 만들어지지 못했다. 더군다나 세이버매트릭스의 기본 재료가 되는 다양한 야구 정보가 폐쇄적으로 오가고 있어 분석에 한계가 있다.
그렇다고 목수가 연장과 재료 탓만 할 수는 없다. 부족하나마 공개돼 있는 기록을 바탕으로 올 한 해 프로야구를 세이버매트릭스의 시선에서 전망해 보자.
*세이버매트릭스 게임이론과 통계학을 바탕으로 야구를 보다 객관적으로 이해하려는 방법론. 1970년대 미국의 빌 제임스가 창립한 ‘미국야구연구협회’에서 시작됐다. 타율이나 방어율 같은 고전적인 기록이 선수들의 가치를 제대로 반영하지 않는다는 문제의식에서 출발했다. 선수의 가치를 합리적으로 나타내는 수치를 만들고 이를 바탕으로 시즌을 예측하는 것이 주요 목표다.
행운과 불운을 계산한다: 베이스런
운은 야구 경기에 큰 영향을 미친다. 하루는 2사 1루에서 큰 점수를 얻는 반면, 다음 날은 무사 만루에서 1점도 뽑지 못하는 게 야구다. 반대로 안타 10개를 맞아도 무실점으로 승리하는 날이 있는 반면, 단 하나의 안타에 경기를 내줄 수도 있다. ‘야구 몰라요’라는 오래된 격언에 고개가 끄덕여지는 이유다.
만약 야구가 이처럼 우연의 스포츠라면, 통계에 근거한 세이버매트릭스는 무슨 소용일까? 언뜻 보기에 둘은 서로 멀게만 느껴진다. 하지만 세이버매트릭스는 이미 이에 대한 대답을 준비해 놓았다. 기댓값과 실제 값의 차이를 비교하면 운을 통계적으로 분석할 수 있다. 바로 ‘베이스런’이라는 개념이다.
1990년 미국의 데이비드 스미스가 개발한 베이스런은 타격 기록과 투구 기록을 바탕으로 한 팀의 기대득점과 기대실점을 예측하는 지표다. 야구경기에선 운이 좋으면 안타 하나에도 많은 점수를 얻지만, 운이 나쁘면 안타를 10개 넘게 쳐도 한 점도 뽑지 못할 수 있다. 베이스런은 이런 우연을 빼고 오로지 총루타(안타+볼넷) 같은 기록에 바탕한 통계학적 기댓값이다.
2014년 행운의 여신은 NC의 편
베이스런과 실제 기록을 비교하면, 어느 팀에게 행운이 함께 했는지 알 수 있다. 공격의 경우, 실제 득점에서 베이스런을 뺀 값이 클수록 운이 좋았다고 할 수 있다. 수비의 경우, 베이스런에서 실제 실점을 뺀 값이 클수록 운이 좋았다고 볼 수 있다. 과연 2014년에 우주의 기운이 함께한 팀은 어디일까?
2014년 공격 면에서 행운의 여신이 함께한 팀은 LG트윈스와 SK와이번스, 그리고 NC다이노스다. 베이스런에 비해 득점이 20점 이상 많았다. 세 팀 모두 득점 상황에서 특히 강했다고 볼 수 있다. 실제로 세 팀의 작년 시즌 득점권 타율은 평균타율보다 1% 이상 높았다.
기대에 비해 점수를 뽑지 못한 팀은 KIA타이거즈와 한화 이글스다. 두 팀의 득점권 타율은 앞의 세 팀에 비해 2% 이상 낮다. 부족했던 해결 능력이 팀을 하위권으로 몰고 간 것이다.
득점권에서 강한 모습이 실력인지 행운인지는 아직 많은 연구가 필요하다. 하지만 확률적으로 득점권 타율도 결국 평균 타율에 수렴하게 된다. 행운의 여신이 항상 타자들과 함께할 순 없기 때문이다. 만약 LG, SK, NC의 공격력이 작년과 같다면, 올해는 좋은 성적을 거두기 쉽지 않을 수 있다. 반대로 KIA와 한화의 득점권 타율이 평균을 쫓아 간다면, 올시즌 두 팀의 득점력은 작년과 많이 달라질 수 있다.
수비에서 운이 따른 팀은 넥센히어로즈와 삼성라이온즈, 그리고 NC다이노스다. 세 팀 모두 베이스런에 비해 실점이 30점 이상 적었다. 세 팀이 실점 위기를 다른 팀보다 잘 넘어갔다고 해석할 수 있다. 여기엔 다양한 해석이 가능하다. 위기 상황에서 적시타를 특별히 적게 맞았거나 결정적인 상황에서 호수비가 계속됐다고 볼 수 있다. 혹은 감독의 적절한 투수 교체로 위기를 돌파했을 수 있다. 하지만 이런 요소 역시 세이버매트릭스로 볼 땐 ‘행운’에 가깝기 때문에, 올 시즌에는 세 팀의 실점이 더 늘어날 가능성이 있다.
이번에도 가장 불운한 팀은 KIA타이거즈였다. 기댓값보다 10점 넘게 많은 실점을 기록했다. 위기 상황에서 쉽게 안타나 실책을 허용했고 감독의 투수 교체에도 문제가 있었을 가능성이 높다. 하지만 감독이 바뀌었고, 전체 피안타율을 낮춘다면 타이거즈에게도 희망은 있다.
모든 요소를 종합해 볼 때, 작년 한해 가장 운이 좋았던 팀은 NC다이노스다. 베이스런보다 무려 60점 넘는 이득을 봤다. 이런 결과가 김경문 감독의 지략 덕분이었을까, 아니면 우연히 찾아온 행운의 여신 덕분이었을까? 올 시즌 NC의 행보에 관심이 가는 이유다.
가장 불운한 팀은 역시 KIA타이거즈였다. 기댓값보다 무려 40점 가까이 손해를 봤다. 통계적으로 올 시즌 기아의 수치는 좋아질 가능성이 있지만, 불펜과 수비 불안 같은 고질적인 문제가 바뀌지 않는 한 올해도 불운은 계속될 것이다.
베이스볼을 직접 계산해보자!
다음과 같이 간단한 방법을 이용하면 누구나 쉽게 베이스런을 계산해 볼 수 있다.
베이스런➊ (기대득점) = A×$\frac{B}{(B+C)}$+D
A = 안타 + 볼넷 + 몸에 맞는 볼(사구) - 홈런 - (고의사구 × 0.5)
B = {1.4 × 총루타 - 0.6 × 안타 - 3 × 홈런 + 0.1 × (볼넷 + 사구 - 고의사구) + 0.9 × (도루 - 도루 실패 - 병살타)}×1.1
C = 타수 - 안타 + 도루 실패 + 병살타,
D = 홈런
베이스런➋ (기대실점) = A×$\frac{B}{(B+C)}$+D
A = 피안타 + 피볼넷 + 허용한 몸에 맞는 볼 - 홈런 - 고의사구 × 0.5
B = {1.4 ×피총루타 - 0.6 × 피안타 - 3×피홈런 + 0.1×(피볼넷 + 피사구 - 고의사구) + 0.9×(피도루 - 도루저지 )}×1.1
C = 이닝수×3
D = 피홈런
총루타 : 타자가 친 안타 + 얻은 볼넷
피총루타 : 투수가 맞은 안타 + 허용한 볼넷
피타고라스가 예측하는 2015년 프로야구
지금까지 지난 시즌 각 팀에 얼마나 행운이 따랐는지 알아 보았다. 이젠 피타고리안 승률과 지난 겨울 있었던 선수 이동을 종합해 2015년 프로야구 순위를 예측해 보자.
피타고리안 승률을 직접 구해보자
피타고리안 승률 = $\frac{득점²}{(득점²+실점²)}$
이 공식은 메이저리그에 맞춰 만들어졌기 때문에 우리 현실과는 맞지 않는 부분이 있다. 그래서 1991년부터 2012년까지 한국 프로야구의 기록을 통계적으로 분석해 한국형 피타고리안 승률을 만들었고, 그 공식은 다음과 같다.
한국형 피타고리안 승률 = $\frac{득점^{1.87}}{(득점^{1.87}+실점^{1.87})}$
피타고리안 승률로 돌아본 2014 프로야구
넥센히어로즈 : 실제승률(0.619) >; 피타고리안 승률(0.575)
넥센은 피타고리안 승률보다 4.4% 높은 승률을 거뒀다. 투수력이 강하진 않지만, 확실한 필승조를 보유하고 있었고 여기에 감독의 적절한 투수 운영이 더해진 결과라고 볼 수 있다. 하지만 실제 승률은 결국 피타고리안 승률을 따라가는 경향이 있다. 전반적인 투수력 향상이 없다면, 히어로즈의 올 시즌은 쉽지 않을 수 있다.
롯데자이언츠 : 2014년 실제 승률(0.457) <; 피타고리안 승률(0.497)
롯데는 기대치보다 4% 낮은 승률에 그쳤다. 작년 한 해 롯데의 투수 교체는 납득이 가지 않는 경우가 많았다. 게다가 불펜진은 위기 상황마다 쉽게 무너졌다. 만약 올해 이런 부분이 바뀐다면 자이언츠의 성적은 달라질 수 있다.
각 팀은 자유계약(FA)과 외국인 선수 교체, 군입대·제대 같은 과정을 통해 새로운 선수를 영입하기도 혹은 소중한 선수를 내보내기도 했다. WAR(대체 선수 대비 승리 기여도)를 계산해 보면, 이런 변화가 팀 전체 전력에 얼마나 영향을 줬는지 숫자로 한 눈에 알 수 있다.
삼성과 넥센의 경우 선수단 변화에 의해 작년보다 승수가 적어질 가능성이 높고, 반대로 SK와 한화의 경우 작년보다 높은 승수를 기대할 수 있다.
*피타고리안 승률 세이버매트릭스의 아버지 빌 제임스가 고안한 지표로 팀의 득점과 실점을 바탕으로 기대 승률을 예측하는 공식이다. 공식의 꼴이 피타고라스의 정리와 비슷하기 때문에 피타고리안 승률이라 이름 지어졌다.
2015년도 삼성천하?
자, 이제 드디어 모든 요소를 고려해 2015년 프로야구 순위를 예측해 보자. 우연을 피하기 위해 작년 베이스런 정보로 계산한 피타고리안 승률을 이용해 기대 승수를 계산했다. 여기에 WAR 변화를 더해 2015년 순위를 구해봤다.
2015년에 1위는 삼성라이온즈일 것으로 예측된다. 선수 이적에 따라 -7이 넘는 WAR 감소가 있었음에도 워낙 탄탄한 전력을 보유한 덕에 최강자의 자리를 지킬 전망이다.
2위는 NC다이노스다. 일반적인 우려보다 기존 전력이 탄탄해 특혜(외국인 선수 4명 보유)가 사라짐에도 불구하고 순위가 오를 것으로 예상된다. 순위가 3단계 하락해 5위로 예측된 넥센은 40홈런 유격수 강정호의 빈자리가 커보인다.
3위 SK부터 6위 두산까지는 기대승차가 불과 1게임에 불과할 정도로 4개 팀의 전력이 비슷하다. 그만큼 올해 프로야구의 순위 다툼은 어느 때보다 치열할 전망이다. 하위권은 지난 시즌과 마찬가지로 롯데-KIA-한화 순으로 나타났다.
물론 이 순위도 ‘확률’에 불과하다. 감독의 역량, 새롭게 등장할 스타, 부상 같은 수많은 변수가 있기 때문이다. 2015년 프로야구는 과연 예상대로 삼성의 6년 연속 우승으로 막을 내릴까? 아니면 명장 김성근의 한화가 꼴찌돌풍을 일으킬까? 벌써부터 마음은 야구장으로 향한다.