d라이브러리









스토브리그. 데이터를 보고 선수를 픽해라

야구 경기가 없는 겨울에도 빌리 조 단장은 바쁘다. 시즌이 시작되기 전 팀 사정에 맞는 좋은 선수를 영입해 더 나은 팀을 꾸리는 준비를 해야 하기 때문이다. 데이터 야구를 한다는 빌리 조 단장이 선수를 영입하는 방식은 어떨지, 그가 보는 선수의 기록은 무엇인지 알아보자. 

 

미국 야구팀 오클랜드 애슬레틱스는 자금이 충분하지 않아 다른 팀의 좋은 선수를 데려오기는커녕, 실력 있는 선수를 다른 팀에 뺏기기 일쑤인 하위 팀이었다. 그러던 1998년 새 단장으로 부임한 빌리 빈은 획기적인 운영방식을 펼쳤다. 
‘세이버메트릭스’를 이용해 선수를 스타성이나 외적인 조건이 아닌 통계 데이터로만 판단한 것이다. 세이버메트릭스는 1971년 빌 제임스가 제시한 것으로, 야구를 수학적이고 통계학적인 방법으로 분석하는 법을 통칭한다. 빈 단장은 사람들이 주목하지 않지만, 가치 있는 데이터를 찾아 싼 가격으로 좋은 선수를 영입했다. 
그 결과 미국 프로야구에서 가장 가난한 팀 중 하나이자, 만년 하위 팀인 애슬레틱스를 2000년대 이후 거의 매년 포스트시즌(상위 팀들이 우승을 다투기 위해 치르는 경기)에 진출하는 강팀으로 바꿔놓았다. 빈의 경영 방식이 성공을 이루자 이후 데이터 야구에 관심이 높아졌고, 야구인은 물론 야구를 취미로 보는 팬들도 데이터를 나열해 두고 분석하기 시작했다. 

 

빅데이터로 찾아낸 가치 있는 투수
프로야구 한 시즌이 끝나고 다음 시즌이 시작하기까지 비는 기간을 ‘스토브 리그’라고 한다. 수개월 간 쉴 틈 없이 경기를 치러온 선수들에게는 꿀맛 같은 짧은 휴식 기간이다. 그러나 자유 계약을 앞둔 선수와 구단은 바쁘다. 자유 계약을 할 수 있는 선수 중 보석을 찾아야 하기 때문이다. 일명 ‘FA’라고 하는데, 프로 선수들이 구단과 자유롭게 계약을 맺을 수 있는 제도를 말한다. 뜨거운 스토브 리그에 쓸만한 ‘선발 투수’가 나오면 열기는 치솟는다. 선발 투수는 팀 운영의 핵심이기 때문이다. 그럼 어떤 투수가 가치가 있을까?
2018년 7월 정우성 포스텍 산업경영공학과 교수팀은 빅데이터를 이용해 승리에 도움을 주는 선발 투수를 규명했다. 연구팀은 미국 야구팀 선발 투수의 공을 구종에 따라 분류한 뒤, 그 분류에 따라 어떤 투수가 팀 승리에 더 기여하는지 ‘불확실성’ 측면에서 찾아냈다. 특정 스트라이크 존에 공을 반복해 넣는 투수의 불확실성은 낮고, 타자가 예측하기 힘든 다양한 형태의 변화구를 던지는 투수의 불확실성은 높다. 연구 결과 불확실성이 낮은 투수가 팀 승리에 기여할 확률이 높게 나왔다.
우리나라 프로야구에서는 기아 타이거즈의 양현종, LG 트윈스의 헨리 소사, SK 와이번스의 앙헬 산체스가 여기에 속했다. 즉 구사할 수 있는 구종은 많지 않아도 구속으로 확실하게 타자를 압도할 수 있는 강속구 투수가 승리를 이끄니 FA에 나오면 무조건 잡아야 한다. 
그러나 이런 선수는 너무 적다. FA로 풀린다 해도 매우 비싸다. 구단 재정상 원하는 선수를 모두 영입할 수 없다면, 남들이 보지 않는 ‘숨은 데이터’를 찾아 좋은 선수를 저렴하게 데려와야 한다. 숨은 데이터를 찾기 전 먼저 아래 문제를 풀어보자.

 

 

이것만 알면 야잘알~?


빌리 조를 비롯한 많은 구단에서 주목하는 지표,  ‘스탯(stat)’은 미국 팬그래프와 베이스볼레퍼런스에서 만든 것이다. 스탯은 수학이나 확률, 통계적인 계산으로 나타낼 수 있는 야구 지표를 통틀어 이르는 말이다. 야구인이나 데이터를 분석하는 전문가가 아니더라도 누구나 만들 수 있다. 그러나 그 지표가 충분히 타당성이 있고, 이용하는 사람들이 납득해야 하니 주로 사용하는 스탯은 정해져 있다. 빌리 조가 눈여겨보는 스탯을 살짝 소개한다. 

이 기사의 내용이 궁금하신가요?

기사 전문을 보시려면500(500원)이 필요합니다.

2019년 04월 수학동아 정보

  • 조혜인 기자

🎓️ 진로 추천

  • 산업경영공학
  • 통계학
  • 경영학
이 기사를 읽은 분이 본
다른 인기기사는?