야구를 분석하는 또 다른 도구,
‘세이버 메트릭스’

  • 459호
  • 기사입력 2021.01.13
  • 취재 박기성 기자
  • 편집 김민서 기자
  • 조회수 5126

한민국에서 가장 인기 있는 프로스포츠를 고르라면 아마 프로야구일 것이다. 2000년대 중반 국제 대회에서 연이은 호성적으로 프로야구는 높은 인기를 구가했고, 2020년 지상파와 4년간 2,160억 원 규모의 중계권을 체결하기도 했다. 야구계의 후발주자였던 우리나라에도 야구가 인기 스포츠로 자리 잡으면서 야구를 기존의 방식보다 더욱 다양하고 구체적으로 분석하는 도구들이 도입되어 대중화되고 있다. 이번 호에서는야구를 분석하는 또 다른 도구인 ‘세이버 메트릭스’  라는 개념에 대해 설명해보고자 한다.


세이버 메트릭스의 개념과 역사

세이버 메트릭스라는 용어는 대중들에게 생소할 수도 있는 야구 용어이다.  ‘세이버’야구 역사와 통계에 대한 연구를 목적으로 1971년 창립된 SABR(The Society for American Baseball Reseach)라는 단체명을 소리 나는 대로 읽은 것이고, ‘메트릭스’‘측정’을 뜻하는 ‘Measurement’에서 따온 것으로 1980년에 빌 제임스라는 인물이 처음으로 사용했다. 그가 정의한 세이버 메트릭스는 ‘야구의 객관적 지식을 추구하는 것’이다. 흔히 세이버 메트릭스와 비교되는 것은 ‘클래식 스탯’이다. 클래식 스탯은 타율, 홈런, 타점, 승수와 같은 지표로, 기존의 야구에서는 이들을 활용해 선수를 평가하곤 했다. 세이버 메트릭스는 이러한 지표들의 효용성에 대한 의문에서 시작되었다. 통계적 분석을 통해 야구를 객관적으로 바라보는 도구이자 기존의 선수를 평가하던 방식에서 벗어나 객관적 평가를 통해 야구의 본질을 탐구하고 학문적 접근을 추구하는 방법론적 시도가 세이버 메트릭스라 할 수 있다.

세이버 메트릭스 정신의 시초를 찾으려면 20세기 초의 F.C.레인으로 거슬러 올라가야 한다. 레인은 야구의 황금률로도 불리는 타율이 단타, 2루타, 3루타, 홈런이 타율 상에서는 똑같은 가치로 평가되는 맹점을 지적했다. 그는 62경기의 데이터를 조사한 후 단타와 2루타, 3루타, 홈런이 가지는 가치를 점수로 환산했다. 레인의 연구를 이어받은 조지 린지는 레인이 계산한 값을 수정해 단타는 0.41점, 2루타는 0.82점, 3루타는 1.06점, 홈런은 1.42점의 가치를 가진다는 ‘득점 기대치 이론’을 고안했고, 이후 등장한 언쇼 쿡은 1964년 「확률 야구」라는 논문을 통해 야구 작전과 선수 평가에 확률론을 접목했다. 쿡의 연구는 밀스 형제의 『선수 승률』이라는 저서로 이어졌고, 이는 각 타자의 안타가 팀의 승리 확률에 기여하는 정도를 예측하는 프로그램으로 개발되었다. 이러한 20세기 초중반의 여러 가지 시도들은 매해 「야구 연감」을 출간하던 1970년대의 빌 제임스를 만나 더욱 발전했으며, 1980년대부터는 메이저리그의 여러 구단들이 통계분석가들을 고용해 야구의 통계적 접근을 시도하며 세이버 메트릭스는 더욱 대중화되었다. 현재 베이스볼 레퍼런스나 팬그래프 닷컴과 같은 인터넷 사이트에서 메이저리그 선수들의 세이버 메트릭스 지표를 확인할 수 있다.


세이버 메트릭스의 대표적인 지표 – WAR, 피타고리안 승률


-WAR

WAR(Wins Above Replacement)은 대체 수준 대비 승리 기여라는 의미로, 가상의 대체 선수 수준과 비교했을 때 어떤 선수가 득점과 실점 과정에 미친 영향을 측정해 승수로 바꿔 표현한 지표이다. 여기서 대체 선수란 메이저리그 최하 수준 정도의 선수를 의미하고 그들의 WAR은 0으로 정의한다. 이렇게 산출된 WAR은 해당 선수가 대체 선수 대비 기여한 승수로 판단할 수 있다. 예를 들어 얼마 전 샌디에이고 파드리스와 계약을 체결한 키움 히어로즈의 김하성 선수는 2020년 7.26의 WAR을 기록했는데, 이는 대체 선수 대비 7.26승의 가치를 가지는 선수라고 해석할 수 있다. WAR은 타격, 주루, 수비, 투구를 모두 계산해 종합한 지표이므로 그 계산법과 접근법이 굉장히 까다롭지만, 그 결과물을 통해 한 선수의 전체적인 평가를 직관적으로 내릴 수 있고 선수 간 비교도 용이하다는 장점이 있다. 실제로 2003시즌 프로야구 MVP를 차지한 이승엽과 심정수의 WAR을 비교하면 MVP를 차지하지 못한 심정수의 WAR이 10.19로 이승엽의 9.084보다 높음을 알 수 있다. 이승엽은 심정수보다 많은 홈런과 타점으로 MVP를 수상했지만 실제로는 심정수가 더 높은 가치의 활약을 보였다는 것을 알 수 있다.


-피타고리안 승률

피타고리안 승률승률을 추정하기 위해 고안된 공식으로 그 형태가 피타고라스의 정리와 유사해서 피타고리안 승률이라 이름 붙여졌다. 원래의 지수 값은 2였지만 공식의 수정을 거쳐 현재는 리그에 따라 1.83 혹은 1.87로 쓰인다. 피타고리안 승률은 득점과 실점에만 의존하는 지표이므로 득실 간 차이의 값에 따라 좌우되는 경향이 있다. 피타고리안 승률은 실제 승률과 잘 맞아떨어지므로 시즌 중반 특정 팀의 득실점을 가지고 최종 승률을 예측하는 데에 사용되며, 실제 승률과 피타고리안 승률 간의 차이를 운의 영역으로 설명한다. 예를 들어, 2018시즌 SK 와이번스의 피타고리안 승률을 계산하면 약 0.564인데 실제 승률은 0.545이다. 반대로 동일 시즌 두산 베어스는 실제 승률 0.646보다 낮은 0.609의 피타고리안 승률을 보였다. 세이버 메트릭스에서는 SK 와이번스와 같이 실제 승률이 더 낮은 경우는 운이 없었다고, 두산 베어스와 같이 실제 승률이 더 높은 경우는 운이 따랐다는 결론을 내린다.


세이버 메트릭스의 장점과 한계

세이버 메트릭스를 통해, 기존의 야구계에서 선수를 평가하는 지표보다 더 객관적인 지표를 개발하거나 과소평가되었던 지표들에 집중함으로써, 야구에 대한 정확한 이해를 추구하며 이를 통해 효율적인 승리 방법을 모색할 수 있다. 실제로 한국 프로야구의 NC 다이노스는 2013년에 1군 리그에 진입한 신생구단임에도 창단 초기부터 데이터 분석의 중요성을 강조했고, 선수들의 투구와 타격을 분석할 수 있는 ‘D-라커’라는 프로그램을 통해 선수들 스스로가 능동적으로 데이터를 확인하고 이를 적용할 수 있게끔 했다. 이를 토대로 NC는 창단 8년 만에 2020시즌 프로야구 우승을 거머쥐었다. 그러나 이러한 세이버 메트릭스도 한계가 존재한다. 기존의 클래식 스탯의 통계적 오류를 지적하는 세이버 메트릭스의 지표들도 그 계산 방법에 오류가 발견되거나 지표의 신뢰성에 의문이 제기되기도 한다. 빌 제임스 역시 선수도 사람이기에 데이터만을 가지고 평가하는 것은 틀릴 때가 있음을 언급하며 세이버 메트릭스 맹신의 위험성을 강조했다. 세이버 메트릭스는 야구를 분석하는 또 다른 방식이라는 점에서 의의가 있다. 그러나 세이버 메트릭스 역시 클래식 스탯과 다름없는 야구를 분석하는 하나의 통계적 도구일 뿐, 그것이 정답이 아니라는 것을 염두에 두어야 한다.



사진 출처 :

대표 사진 ©엔씨 소프트 공식 블로그 (https://blog.ncsoft.com/%ec%95%bc%ea%b5%ac-%eb%8d%b0%ec%9d%b4%ed%84%b0-%eb%b6%84%ec%84%9d-3-%ec%84%b8%ec%9d%b4%eb%b2%84%eb%a9%94%ed%8a%b8%eb%a6%ad%ec%8a%a4%ec%9d%98-%eb%b0%9c%ec%a0%84/)

사진1 ©뉴욕 타임스 – Bill James has required the numbers (https://www.nytimes.com/2019/01/20/opinion/baseball-hall-of-fame-bill-james.html)

사진2 ©오마이뉴스 – ‘라이온 킹’의 영원한 라이벌, ‘헤라클레스 심정수’ (http://star.ohmynews.com/NWS_Web/OhmyStar/at_pg.aspx?CNTN_CD=A0002364182)

사진3 ©득점과 실점의 미학 - 피타고리안 승률 이야기 (https://preamtree.tistory.com/92)

사진4 ©한겨레 - 꼴찌→5위→우승… NC, 가을을 완성하다 (http://www.hani.co.kr/arti/sports/sports_general/971351.html)


기사 자료 출처:

엔씨 소프트 공식 블로그 (https://blog.ncsoft.com/%ec%95%bc%ea%b5%ac-%eb%8d%b0%ec%9d%b4%ed%84%b0-%eb%b6%84%ec%84%9d-3-%ec%84%b8%ec%9d%b4%eb%b2%84%eb%a9%94%ed%8a%b8%eb%a6%ad%ec%8a%a4%ec%9d%98-%eb%b0%9c%ec%a0%84/)

한국 경제 스포츠 (https://www.hankyung.com/sports/article/202002036234Y)

[이영미 in 캠프] 세이버매트릭스 창시자, 빌 제임스를 만나다 (https://sports.news.naver.com/news.nhn?oid=380&aid=0000000988)

『세이버메트릭스 레볼루션』 – 벤저민 바우머, 앤드루 짐발리스트