스마트 베이스볼 - 현대 야구를 지배하는 새로운 데이터
키스 로 지음, 김현성 옮김, 허구연 감수 / 두리반 / 2020년 5월
평점 :
장바구니담기


 

야구는 감이 아니라 데이터로 하는 스포츠란 말이 있다. 공하나 던질 때마다, 방망이 한번 휘두를 때마다 벤치에서 작전이 내려가고 그에 따라 움직인다. 물론 다른 스포츠도 데이터를 기반으로 작전을 짜고 지시를 내리지만 직관적으로 움직일 때가 더 많은반면 야구는 한땀 한땀 쌓여진 데이터로 운용되는 매 순간이 데이터와의 싸움이고 그래서 다른 스포츠에 비해 데이터가 더 많이 작용한다. 그래서 확실히 야구의 지식과 데이터를 잘 아는 사람은 야구를 볼 때에도 더 넓은 시각으로 경기를 바라보고 더 디테일하게 경기를 읽어낸다. 선수 교체 시기나 수비위치의 변화, 번트 시기 등 경기를 깊고 폭넓게 이해하며 볼 수 있게 된다.


또 감독의 지시나 경기의 흐름을 읽는 것 뿐만 아니라 데이터는 선수의 능력치, 스탯을 알려주는 중요한 수단이다. 일반 야구 팬에겐 이것이 더 크게 작용할텐데 타율, 타점, 홈런률 같은 타격 지표나 투수의 전적 같은 데이터는 그 선수를 이해하는데 필수불가결한 요소다. 야구를 잘 모르는 팬들도 타율 타점이 높은 타자, 홈런을 많이 때리는 타자, 도루를 많이 하는 타자라는 식의 간결하면서도 직관적인 데이터로 선수를 판단하게 된다. 경기 중간에 선수 기용이나 선수의 스탯에 따른 작전 변화 등을 이해할 수도 있고, 경기 외적으로는 트레이드나 선수 영입 할 때 그 선수가 어떤 선수인지, 감독이 어떤 점을 고려했는지 등을 판단할 수도 있다.


그런 데이터는 경기장의 전광판이나 티비화면에서 끊임없이 제공되고 있다. 해설자들도 계속 데이터를 읊으며 정보를 전달해준다. 선수 개인의 스탯, 팀간의 전적, 각종 지표와 평가방법들 등 수많은 축적된 데이터를 접하게 된다. 그것에 따라 작전이 달라지고, 경기 운영 방식이 달라지기 때문에 경기를 보면서 감독의 작전을 예측을 해볼 수도 있고, 흐름을 이해할 수도 있다. 그것을 알고 야구를 보는 것과 그렇지 않는 것은 큰 차이가 있다.


야구에 관심이 많고 잘 아는 사람들은 이런 데이터를 읽을 수 있어서 그 내용을 통해 경기를 예측하지만 그렇지 못한 사람들은 대부분이 타율이나 방어율이 높고 낮다는 식의 직관적인 수준에 그친다. 아니면 타율이 높다거나 도루를 잘하고 홈런을 몇 개쳤다는 기본적인 데이터만 소비하는데 겨우 그 정도만으로도 야구를 보는 재미는 배가된다. 만약 데이터를 읽고 이해하는 법을 안다면 데이터를 분석해가며 경기를 읽어낼 수가 있기 때문에 더욱 큰 재미를 느끼게 될 것이다.


그러나 저자의 말에 따르면 많은 야구 사람들이 오래된 스탯 분석법으로 데이터를 분석한다고 한다. 미국에서의 야구 역사는 140년이 넘었고 그동안 수많은 데이터가 쌓였고, 현제재는 선수의 경기력을 파악할 수 있는 새로운 데이터 분석법이 많이 있음에도 아직까지 과거의 스탯에 머물러 있다고 비판한다. 과거의 스탯이란 선수의 지난 시즌의 타율, 타점, 홈런, 출루율 장타율, 투수의 방어율, 세이브, 평균자책점, 탈삼진과 같은 데이터를 뜻한다. 난 이런 데이터만 읽을 수 있어도 경기를 훨씬 재미있게 볼 수 있을거라고 생각했는데 이런 데이터 분석법이 올드한 방식이고 선수의 능력을 제대로 말해주지 못한다니 혼란스럽다.


과거의 전통적인 스탯은 결함도 많고, 그 스탯으로 선수를 평가하기엔 한계도 분명하다. 대표적으로 '승리투수'라는 개념. 이 개념은 아직도 많이 쓰이고 투수의 지표를 말할 때 아주 널리 쓰이는 스탯이다. 박찬호가 20승을 했다느니, 류현진이 승리투수가 되었다느니, 경기를 하면서도 승리투수의 요건을 갖추었다거나 하는 식의 해설을 굉장히 많이 듣게 된다. 그런데 저자는 이 승리투수 개념이 전체적인 야구의 수준이 낮았던 과거의 개념이라고 주장한다. 경기에서 승리하기 위해서는 투수 혼자 공을 잘 던진다고 되는 것이 아니란 거다. 아무리 투수가 공을 잘 던지더라도 공격과 수비가 뒷받침 되지 않으면 승리할 수 없다. 투수가 실투를 하고도 공격에서 맹활약하면 승리를 할 수도 있고 반대로 투수는 굉장히 잘 던졌음에도 패전투수가 되는 경우도 있다. 즉 승리는 팀 전체의 승리지 투수의 승리가 아니고, 이런 다양한 경우의 수가 있다보니 꼭 승리 투수라는 것이 공을 잘 던졌다는 말이 되지 못한다는 것이다.


이렇듯 과거에 사용되던 스탯은 결함과 한계가 분명했다. 그래서 지금은 평균 자책점, 출루율, 장타율, OPS 등의 새로운 스탯이 나왔지만 사람들은 사람들은 관습적으로 다승, 타율, 타점, 세이브 등과 같은 과거의 과거의 올드한 분석법으로 데이터를 소비하고 있다고 한다. 최근에는 한국 야구에서도 해설가들이 해설할 때 평균 자책점, 출루율, 장타율, OPS 같은 방식의 데이터를 많이 말하고 있어서 이런 용어들이 익숙하긴 하지만 야구를 깊이 알지 못하는 팬들은 새로운 방식의 스탯은 들어도 잘 모르는 경우가 많다. 그래서 좀더 직관적인 예전 스탯을 선호하는 것 같다.


그리고 야구 데이터는 미국에서 비롯된만큼 전부 영어 약자거나 일본식 조어라서 그것에 익숙하지 않은 사람이라면 데이터의 이해는 커녕 그 용어 자체의 의미조차 이해하기가 어렵다. 사실 그리 야구를 잘 알지 못하는 초보 팬들은 타율 등의 할푼리 개념을 이해하는 것도 어려울지 모른다. 그리고 요즘 많이 쓰이는 OPS같은 내용도 잘 모를 것이다. 당연히 비교적 최근에 나온 WAR, WPA, wOBA, wRC+, UZR, dRS 같은 스탯은 무슨 약자인지도 짐작도 가지 않을 것이다. 나 역시 야구를 좋아하긴 하지만 데이터를 읽고 이해하는 것은 부족하여 이런 새로 나온 스탯은 전혀 알지 못한다.


책에서는 전통적인 스탯의 결함과 한계를 실제 데이터를 통해 어떤 문제가 있는지 짚어보며, 새롭게 주목받기 시작한 스탯은 무엇인지, 왜 나왔고, 왜 쓰이는지 쉽고 재미있게 설명한다. 저자는 이를 각각 덜 스마트한 베이스볼, 스마트한 베이스볼이라고 명명한다. 과거의 스탯이 완전 엉망이라거나 가짜라는 의미가 아니라 그 역시 축적된 데이터를 분석한 내용이지만 한계가 있으므로 선수의 능력치를 더 잘 나타내고, 숨은 내용까지 잘 반영할 수 있는 좀 더 스마트한 분석법을 활용하자는 의미이다. 그리고 새롭게 알아본 지표들로 과거 명예의 전당 투표 결과를 분석해보고, 새로운 데이터가 스카우팅에 어떤 영향을 주는지 살펴보고, 현재 미국에서 화제가 되고 있는 야구 이슈나 데이터 야구의 미래에 대해서도 다양하게 이야기한다.


아는 만큼 보인다는 말처럼 스탯을 아는 만큼 야구를 더 제대로 즐길 수 있을 것이다. 야구를 더욱 깊이있게 즐기고자 하는 야구팬들에게 매우 유용할 것 같다.
 


댓글(0) 먼댓글(0) 좋아요(2)
좋아요
북마크하기찜하기 thankstoThanksTo