![](https://images.dongascience.com/uploads/old/articleEditor/2011/09/12005262974e82e86db2fbc.jpg)
메이저리그에서 뛰다 올 시즌부터 한국에서 뛰는 외국인 타자가 있다고 하자. 이 선수를 스카웃한 사람은 어떻게 타자를 설명해야 할까. 스윙이 호쾌하고, 힘이 좋다고 말하면 될까. 아니다. 타율이 얼마고, 장타율이 얼만지를 말하고, 홈런과 타점의 개수를 말하면 된다. 야구는 숫자로 말하고, 숫자로 이해한다.
보통 3할을 치면 잘한다고 한다. 2할 8푼을 치면 보통 수준의 타자다. 볼넷이 없다고 가정한다면 3할 타자와 2할 8푼 타자의 안타 수는 얼마나 차이가 날까. 두 타자 모두 볼넷이 없고 최소 규정타석인 413타석에 들어갔다고 할 때, 3할타자는 약 124개, 2할 8푼의 타자는 116개를 친다. 1년 동안 고작 8개의 차이가 실력 있는 타자와 보통 타자를 가른다.
만약 타율 2할 8푼을 기록한 타자가 볼넷을 50개 얻었고, 3할 타자는 볼넷을 20개 밖에 얻지 못했다고 하자. 그리고 2할 8푼의 타자가 홈런을 한 시즌에 20개를 치지만 3할 타자는 고작 3개 친다고 한다. 누가 더 뛰어난 타자일까. 2할 8푼 타자다. 이렇게 우리가 알던 야구 통계의 허점을 무너트리고 야구의 본질에 다가가고자 하는 새로운 통계가 있다. 바로 세이버매트릭스다.
![](https://images.dongascience.com/uploads/old/articleEditor/2011/09/13805468584e82e9be69d34.jpg)
오클랜드 애슬레틱스 돌풍의 힘
세이버매트릭스를 이용해 성공을 거둔 대표적 팀이 미국 메이저리그의 오클랜드 애슬레틱스다. 이 팀은 최악의 성적과 재정난을 이기고 2000년대 초반 강팀으로 우뚝 섰다. 오클랜드는 오랜 역사와 우수한 성적을 거둔 바 있지만 1990년대 구단주의 긴축 재정으로 좋은 선수를 영입하지 못해 약체로 전락했다.
하지만 1998년 빌리 빈이 팀의 단장이 된 뒤 오클랜드는 2000년부터 2003년까지 4년 연속 포스트시즌에 진출하는 돌풍을 일으켰다. 놀라운 것은 같은 기간 오클랜드의 연봉 순위는 30개 구단 중 25위, 29위, 28위, 23위에 불과했다는 점이다. 가장 적은 비용으로 가장 큰 효과를 냈다. 오클랜드의 성공 비결 중 하나가 세이버매트릭스다. 세이버매트릭스는 미국의 야구 저술가이자 통계학자인 빌 제임스가 1970년대 창안한 방법론이다. 빌 제임스는 메이저리그에 축적된 엄청난 양의 데이터를 분석해 일정한 수의 단타, 2루타, 도루, 사사구, 아웃 등이 주어졌을 때 각 팀이 몇 점을 얻는지를 예측하는 공식을 만들었다. 빌 제임스가 만든 득점창출에 관한 식, RC는 다음과 같다.
RC = (안타+볼넷)×전체 루타수÷(타수+사사구) = 출루율×장타율×타수
이 공식에 따르면 한 팀의 득점력을 높이려면 단순타율 보다 출루율과 장타율이 높아야 한다. 제임스는 안타를 치건, 사사구를 얻어내건 일단 출루하는 것, 즉 타자가 아웃 당하지 않는 것이 중요하다고 여겼다. 27번의 아웃 기회를 최대한 아끼며 모든 타자가 출루의 확률을 높이고 멀리 치려고 노력하는 것이 중요했다.
오클랜드의 새로운 단장인 빌리 빈은 이를 받아들였다. 다른 단장이나 감독이 타율이 높고, 홈런을 잘 치는 타자만 선호할 때 출루율과 장타율이 높은 선수를 영입했다. 타율, 홈런 수, 출루율과 장타율 모두 높은 선수가 제일 좋은 것은 누구나 아는 사실이다. 다만 그는 출루율과 장타율이 높은 대신 타율이 낮은 선수가 저평가됐다는 점을 주목했다. 투수를 영입할 때도 같은 원칙을 이용했다. 공의 속도가 빠르고 평균자책점이 낮은 선수는 비싸다. 그러니 공이 느리고, 평균자책점은 높지만 출루 허용 비율이 낮은 선수를 발굴했다.
빌리 빈의 통계적, 과학적 선수 영입 원칙은 큰 성공을 거뒀고, 메이저리그에서 통계를 보는 시각이 바뀌었다. 과거에는 홈런과 타율, 타점, 도루를 중요하게 여겼으나, 빌리 빈 이후에는 출루율, 장타율, 볼넷이 중요해졌다. 투수는 승수, 평균자책점, 구속이 중요했으나, 이후에는 이닝 당 출루 수, 땅볼/뜬공 비율이 중요해졌다.
![](https://images.dongascience.com/uploads/old/articleEditor/2011/09/13577831384e82ea4811c5f.jpg)
![](https://images.dongascience.com/uploads/old/articleEditor/2011/09/18171721414e82ea5106a2e.jpg)
오클랜드의 성공은 자신의 성공 비법을 차용한 돈 많은 구단에 의해 끝이 났다. 미국 동부의 명문구단이자 부유한 보스턴 레드삭스는 빌 제임스를 구단 고문에 임명했다. 그리고 단장에는 하버드대 출신의 테오 엡스타인을 임명하면서 세이버매트릭스를 받아들였다. 이를 통해 보스턴은 2004년 86년 만에 우승을 거머쥐었고, 2007년에 또 다시 우승했다. 메이저리그에서 통계의 위상은 점점 높아지고 있다.
[세이버매트릭스의 창안자인 빌 제임스. 보스턴 레드삭스는 그를 구단 고문으로 임명한 뒤 2004년 86년 만에 우승했다. 이전에 마지막으로 우승한 1918년은 제1차 세계대전이 끝났던 해다.]
![](https://images.dongascience.com/uploads/old/articleEditor/2011/09/12383427884e82ebea70b87.jpg)
![](https://images.dongascience.com/uploads/old/articleEditor/2011/09/2610887364e82ebf3303db.jpg)
[2007년 KIA 타이거즈의 3루수 이현곤은 타격왕을 차지했지만 최고의 3루수에게 수여되는 골든글러브는 두산 베어스의 김동주 선수가 받았다. 타율은 선수의 많은 것을 보여주지만, 모두를 보여주진 않는다. 아래 표는 2007년 두 선수의 성적.]
과대평가된 타율
세이버매트릭스에서는 왜 타율보다 출루율과 장타율을 강조했을까. 타율은 두 가지를 무시하는 통계였기 때문이었다. 첫째 볼넷을 계산하지 않고, 둘째 안타와 홈런에 동일한 가중치를 뒀다.
예전에는 단타로 출루하나 볼넷으로 출루하나 똑같은 출루지만 볼넷은 중요하지 않은 것처럼 생각했다. 물론 안타와 달리 볼넷은 1루에 있는 주자를 3루로 보낼 수 없기에 단타의 가치는 볼넷보다 높다. 그래도 볼넷은 타자의 능력 중 하나인 선구안을 나타내는 척도이기에 무시할 수 없다.
누구나 인정하듯 단타와 홈런의 가치는 다르다. 타율은 이를 같다고 평가한다. 2007년 KIA타이거즈의 3루수 이현곤은 타율 0.338로 타격왕을 차지했다. 이현곤 선수는 31개의 2루타와 2개의 홈런을 쳤다. 그런데 같은 해 두산 베어스의 3루수 김동주의 타율은 0.322였으며 24개의 2루타, 19개의 홈런을 쳤다. 누가 더 나은 타자일까. 김동주가 타율은 조금 낮지만 17개나 더 많은 홈런을 쳤으니 팀이 더 많은 득점을 생산하는 데 도움을 줬다고 볼 수 있다. 이런 차이를 보정하는 장타율은 타격 능력을 평가하는데 타율보다 나을 수 있다.
앞서 말한 타율의 두 가지 약점을 보완하기 위해 빌리 빈은 OPS를 중시했다. 출루율과 장타율을 더한 OPS는 타자의 능력을 측정하는 간단하면서도 정확한 통계다.
물론 OPS가 선수의 가치를 모두 말해주진 않는다. 희생타, 진루타 등의 타격 능력은 물론, 주자와 수비수로서의 능력이 포함돼 있지 않다. 2007년 두산 베어스의 2루수 고영민과 롯데 자이언츠의 내야수 이대호를 비교해보자. 고영민은 타율 0.268, 홈런12개, 타점 66타점, 도루 36개를 기록했으며 OPS는 0.799였다. 이대호는 타율 0.335 홈런 29개, 타점 88개를 기록했다. OPS는 1.053였다. 타격 성적만 봐선 이대호가 훨씬 뛰어나다. 그렇지만 팀 공헌도와 선수의 가치를 생각하면 07년의 고영민과 이대호는 비슷한 가치를 지닌 선수였다.
‘대체 선수 대비 승리(WAR)’라는 통계가 있다. 예를 들어 삼성 라이온즈 최형우 선수의 WAR이 8이라면 최형우 선수대신 다른 평균적 선수가 던졌다면 팀이 8승을 덜 했을 것이라고 판단하는 통계다. 타격만 고려하는 OPS와 달리 WAR은 수비와 주루를 포함한 종합적인 가치를 고려한다.
고영민은 2루수로 1095.1이닝을 출전해 평균 이상의 수비력을 보였으며, 이대호는 1루수로 816.1이닝을 출전해 평균 이하의 수비력을 보였다. 그리고 고영민이 루상에 있을 때 뒷타자가 안타를 치면 3루나 홈까지 파고드는 능력은 이대호보다 뛰어났다. 도루의 개수 차이도 꽤 났다. 주루 능력의 차이, 포지션의 차이, 이닝 수의 차이, 수비 능력의 차이는 고영민과 이대호의 타격 능력의 차이를 메워 종합적인 평가에서는 두 선수의 가치가 비슷한 것이다. OPS의 단점을 보완하는 통계 지표는 WAR말고도 XR, RC, 윈쉐어, wOBA, VORP 등이 있다. 이 통계들은 계산하기 힘들다는 단점이 있다. OPS가 현재 널리 쓰이는 이유는 계산이 간단해 쉽게 이해할 수 있기 때문이다.
![](https://images.dongascience.com/uploads/old/articleEditor/2011/09/10006025964e82ec6fd17d7.jpg)
[미국의 대표적인 야구 통계 사이트 베이스볼리퍼런스 (www.baseball-reference.com). 팬들이 만든 이 사이트는 메이저리그의 다양한 야구 통계를 소개한다. 각종 세이버매트릭스 지표를 풍부하게 제공해 많은 이들이 찾고 있다.]
![](https://images.dongascience.com/uploads/old/articleEditor/2011/09/16075342574e82ec9abb52f.jpg)
[롯데 자이언츠의 이대호 선수는 2007년 장타율 1위를 차지했다. 타격만으로는 그 해 최고의 선수 중 하나였다. 하지만 수비와 주루를 포함시키면 두산 베어스의 고영민 선수와 가치가 비슷했다. 아래 표는 2007년 두 선수의 성적.]
투수의 능력을 평균자책점으로 알 수 없다
빌리 빈이 평균자책점을 대신해 사용하는 WHIP은 이닝당 출루허용율이다. ‘(안타+볼넷)÷이닝’으로 계산한다. 고의사구는 포함시키며 몸에 맞는 볼은 포함하지 않는다. WHIP은 OPS와 마찬가지로 계산하기 어렵지 않아 OPS와 함께 많이 사용하는 통계다. 평균자책점 대신 WHIP을 사용하는 이유는 뭘까. 평균자책점 계산에서 자책점을 내주는 과정을 생략해 평균자책점이 낮다고 해서 반드시 좋은 투수라고 말하기 힘들기 때문이다.
자책점에는 운이 개입한다. 올 시즌 삼성 라이온즈의 투수 차우찬은 3.64의 평균자책점을 기록하고 있다. 그런데 WHIP은 1.49이다. 매번 1.5명의 주자를 출루시켰다는 말이다. 평균자책점이 비슷한 LG 트윈스의 투수 벤자민 주키치는 3.39의 평균자책점에 WHIP은 1.18이다. 주키치 선수보다 차우찬 선수는 이닝 당 0.3명의 주자를 더 내보낸다. 그럼에도 방어율이 그리 차이나지 않는 이유는 결정타를 맞지 않아서고, 달리 보면 운이 좋았던 것이다. 평균자책점에는 이런 운이 포함돼 있어 온전히 투수의 능력을 반영했다고 보기 어렵다.
평균자책점은 앞서 나온 투수에게 불리하다. 선발투수가 주자를 두고 내려갔을 때 그 주자가 득점하면 자책점이 된다. 구원투수의 능력에 따라 자책점이 결정되는 것이다. 팀의 구원투수들이 뛰어나면 평균자책점이 낮아진다. 같은 경우에서 구원투수는 앞선 투수가 남겨둔 주자를 득점 시켜도 자책점으로 기록되지 않는다. 평균자책점은 득점을 허용한 투수의 능력을 평가할 수 없다는 약점이 있다.
WHIP도 약점이 있다. 타율과 같이 출루 허용에만 중점을 둬 내용을 고려하지 않기 때문이다. 한 이닝에 2개의 볼넷을 허용한 것과 홈런 2개를 맞은 것이 똑같이 취급한다.
그리고 포수가 빠른 송구로 도루를 잡아낸 아웃과 수비진의 능력이 들어간 병살타로 인한 아웃 카운트도 투수가 얻어낸 것처럼 계산된다. 따라서 WHIP도 다른 모든 통계처럼 한계가 있다. 그리고 이를 보완하는 다른 통계가 끊임없이 나오고 있다.
이를 보면 빌 제임스를 비롯한 통계 전문가들은 야구의 특성을 과학적으로 이해해 통계에 접목했다는 것을 알 수 있다. 제임스가 도입한 OPS와 WHIP, RC를 분석해보면 그가 실제 일어나는 야구의 모든 플레이의 특성을 살펴보고 과학적으로 고찰한 뒤 편견과 속설을 제거해 나간 것이다. 빌리 빈은 이렇게 만들어진 통계를 이용해 팀 운영에 도입했고 큰 성공을 거두었다. 오클랜드의 성공 뒤에는 과학적 통계 분석이 있었다.
![](https://images.dongascience.com/uploads/old/articleEditor/2011/09/19303729534e82ed4623a5d.jpg)
[11월 개봉 예정인 영화배우 브래드 피트 주연의 ‘머니볼’의 한 장면. 오클랜드 애슬레틱스의 돌풍의 과정을 영화에 담았다. 브래드 피트가 빌리 빈 역을 맡았다.]
[LG 트윈스의 벤자민 주키치 선수와 삼성 라이온즈의 차우찬 선수는 WHIP의 차이에 비해 방어율의 차이가 적다. 차우찬 선수가 운이 좋았거나, 구원투수의 능력이 더 좋았다고 볼 수 있다. 오른쪽 표는 9월 21일까지의 성적.]
시즌 준비에서 연봉 협상까지
한국 야구 현장에서도 통계와 세이버매트릭스를 활용한다. 김정준 SK 전력분석 담당 과장은 통계가 ‘건강검진표’와 같다고 말한다. 그는 “통계를 보면 팀의 전력을 파악할 수 있다”며 “팀과 선수의 실력과 야구 스타일에 관한 대략적 이미지가 떠오른다”고 말한다. 코칭스태프는 건강검진표를 토대로 다음 시즌을 준비하는 것이다.
김정준 과장은 “세이버매트릭스 통계 지표 중 피타고리안 승률을 신뢰한다”고 말했다. 피타고리안 승률은 득점과 실점을 통해 최종 승수를 예상하는 것이다. 시즌 중반 이를 활용하면 최종 승률을 예상할 수 있다.
연봉 산정할 때도 세이버매트릭스 통계를 사용한다. 지난해 LG 트윈스는 올 시즌 연봉협상에서 ‘윈쉐어’를 기준으로 사용했다. 윈쉐어는 팀의 승리에 기여한 정도를 타격, 수비, 투구로 나눠 평가하는 지표다. 이긴 경기만 판단하기 때문에 실력을 정확히 판단하기 보다는 팀의 직접적 승리에 기여한 정도를 본다. LG는 경기에서 이기는 데 기여하는 것이 중요하다고 판단해 이를 연봉에 반영한 것이다.
야구통계는 계속 발전하고 있다. 한국프로야구 통계를 기록·가공해 각 구단과 언론에 제공하는 ‘스포츠투아이’의 이은주 운영팀장은 “RC와 윈쉐어 등을 한국 상황에 맞는 지표로 변화시키기 위해 노력하고 있다”고 말했다. 세이버 매트릭스 통계를 산출할 때 안타나 볼넷, 도루 등의 수치에 리그 사정에 맞는 가중치를 곱한다. 아직 이런 가중치는 메이저리그에 맞춰져 있다. 이를 한국프로야구리그에 맞춰 야 믿을 수 있는 지표가 된다.
개인적으로 한국프로야구통계를 기록하는 사이트 ‘아이스탯’을 운영하는 김범수 씨는 “야구 통계를 이용할 때 통계가 만들어진 이유와 계산 절차를 파악해 통계의 한계를 이해해야 한다”며 “상황에 맞게 각종 통계 지표를 적절히 활용해야 한다”고 말했다. “통계를 맹신해선 안 된다”는 말도 덧붙였다. 통계는 과거를 되돌아 볼 뿐 미래를 예측하는 데에는 한계가 있기 때문이다. 선수가 부부싸움을 해서 스트레스를 받아 경기에 제대로 뛰지 못하는 일까지 예상 할 수는 없다. 그리고 그는 “야구가 통계대로 된다면 재미가 없을 것”이라고 말했다. 9회말 2사, 3점차에서 오승환 선수가 나왔을 때 무명의 타자가 역전 만루 홈런을 치는 재미, 확률을 뒤집는 재미가 야구의 매력이기 때문이다. 어쩌면 사람들은 통계가 뒤집히는 재미를 보기 위해 통계를 보는 것일지도 모르겠다.
![](https://images.dongascience.com/uploads/old/articleEditor/2011/09/12249361094e82edec08e49.jpg)
[선수 개개인의 통계외에도 타구 방향과 수비에 관한 통계도 많다. 감독은 타자의 특성과 타구 방향을 통계적으로 분석해 수비 위치를 이동시킨다.]
▼관련기사를 계속 보시려면?
Intro. 한국시리즈 우승? 과학에 물어봐!
Part 1. 기다림의 과학, 재활
Part 2. 숫자의 마법, 진짜 유망주 찾는 통계
Part 3. 투수를 해부하는 메스, 투구추적시스템