야구에서는 타순(타자의 순서)에 따라 타자의 역할이 다르다. 주로 1~2번 타자는 발이 빠르고 출루율이 높아 투수를 압박할 수 있어야 한다. 3~5번 타자는 홈런이나 2루타를 많이 치며, 득점권 상황에서 타점을 올려줄 수 있어야 한다. 7~9번 타자는 포수나 유격수처럼 타격보다는 수비에 더 강점을 가진 타자들이 위치한다.
감독들은 타순마다 다른 타자의 역할을 바탕으로 그날의 승리를 위해 머리를 굴리며 라인업을 짠다. 상대 팀에 따라 공격에 집중할지 수비에 치중할지 정해 타순을 짜기도 한다.
그런데 러시아의 수학자 안드레이 마르코프가 개발한 ‘마르코프 연쇄’ 모형을 이용하면 어떤 타순이 최강인지 알 수 있다. 먼저 마르코프 연쇄부터 무엇인지 알아보자.
마르코프 연쇄를 고안할 당시 마르코프는 오늘 어떤 일이 일어나는 이유를 전날에 일어난 일 때문이라고 생각했다. 즉 어떤 사건은 그 일이 일어나기 전에 있었던 일과 관련이 있고, 그 둘 사이를 확률로 나타낼 수 있다고 여겼다.
그런데 무한히 많은 사건을 모두 고려하면 너무 복잡해져 확률을 계산하기 어렵다. 그래서 마르코프는 시간이 연속이 아닌 단절적이라고 가정했다. 또한 과거의 몇 가지 일 때문에 오늘의 일이 일어났다고 가정했다. 이를 ‘마르코프의 가정’이라고 한다.
예를 들어 오늘 어떤 선수가 홈런을 친 이유는 바로 전날의 행동에 따라서 좌우된다. 어제 타격감이 좋았거나 충분히 휴식을 취했거나 기분 좋은 일이 있는 등의 상태에 따라 오늘의 행동이 결정된다는 얘기다. 오늘의 상태에서 일정한 확률로 계산되어 내일의 상태가 결정된다는 의미이다. 이렇게 바로 앞의 상황만이 뒤에 영향을 끼치는 것을 ‘1차 마르코프 연쇄’라고 한다.
‘2차 마르코프 연쇄’는 어제는 물론 그제의 일까지 오늘의 상태에 직접 영향을 끼치는 것을 말한다. 이렇듯 전날의 상태는 전전날에 영향을 받고, 전전날의 상태가 전전 전날의 영향을 받으니, 결국 연쇄적으로 따진다면 내일 홈런 칠 여부는 태어날 때의 상태와 마치 사슬처럼 간접적으로 관련이 있다.
마르코프 연쇄를 야구에 본격적으로 적용해보자. 타자는 안타, 2루타, 3루타, 홈런, 볼넷, 아웃을 당할 확률을 갖고 있다. 이에 따라 아웃 카운트나 루상의 주자의 위치가 달라지는데, 이를 24가지 상태로 나눌 수 있다.
위 그림은 한 이닝에서 벌어질 수 있는 24가지 상태를 나타낸 것이다. 여기서 우리는 1아웃에 주자가 3루인 상황에서의 상태 변화를 살펴보자. 동그라미 안에서 점을 기준으로 왼쪽 숫자는 주자 상황을 뜻하고, 오른쪽 숫자는 아웃 카운트다. 즉 123.1은 주자가 1루, 2루, 3루에 있고, 아웃 카운트는 1이라는 의미다.
예를 들어 1아웃 3루에서 홈런이 나오면 득점이 2점 나오며, 1아웃에 주자가 없는 상태로 변한다(❶). 만약 3루타가 나오면 득점이 1점 나고, 아웃카운트 상태는 그대로 이어진다(❷). 만약 뜬공 아웃이 되면 주자는 3루 그대로고, 아웃카운트만 2로 바뀐다(❸). 이를 마르코프 연쇄로 만들어 반복적으로 모의실험하면 타자의 득점 기여도를 알 수 있다.
그렇다면 야구 마르코프 연쇄 모형은 얼마나 정확할까? 2010년 관련 연구가 있었다. 장영재 KAIST 교수팀은 2010시즌 KBO 기록을 바탕으로 어떤 팀이 가장 효율적으로 타순을 짰는지 알아봤다. 먼저 마르코프 연쇄로 모형을 만든 뒤, 이 모형을 검증하기 위해 2010년 각 팀의 실제 경기 득점과 모형이 예측한 득점 분포를 비교했다.
SK 와이번스는 평균 예상 득점이 5.218점이었는데 실제는 5.293점이었다. 오차가 1.4%로 어느 정도 신뢰할 수 있는 모형이었다. 모형이 검증된 뒤에는 이 모형을 바탕으로 가능한 모든 타순 조합의 예상 득점을 계산해 가장 효율적인 타순을 구성한 팀을 찾았다.
그 결과 가장 효율적인 타순을 구성한 팀은 롯데 자이언츠와 그해 우승 팀인 SK 와이번스였다. 특히 SK 와이번스는 김성근 감독이 상대 팀 선발투수에 따라 매번 타순을 바꾸는 방식을 추구했는데, 이 점이 효과적이라는 것이 단적으로 드러났다.