야구 데이터로 배우는 파이썬 - 오타니 쇼헤이 데이터를 통해 시작하는 분석과 시각화
사이토 아마네 지음, 고범석 옮김 / 영진.com(영진닷컴) / 2025년 2월
평점 :
장바구니담기




*** 이 리뷰는 리뷰어스 클럽의 소개로 출판사로부터 도서를 제공받아 주관적으로 작성한 글입니다 ***



이 책은 파이썬(Python) 프로그래밍 언어를 사용해 데이터 분석과 시각화를 구현하는 방법을 배우는 파이썬 프로그래밍 학습 교재이다.


책의 내용과 구성은 총 5개의 단원으로 이루어져 있다: Python언어의 필요성; Python 프로그래밍을 통한 데이터로 그래프 작성하기; Python 언어의 기초 문법; 실제 데이터 분석 방법; 데이터 분석을 활용하는 프로세스 등에 관해 다루고 있다.


저자는 일본 후쿠오카 소프트뱅크 호크스 야구단 GM부서의 데이터 분석 담당자 사이토 아마네이다.


---


이 책은 프로그래밍 언어 Python에 관한 프로그래밍 학습서이지만, 기존의 학습서와는 다르게 독특한 점이 있다:


우선 프로그래밍과 관련된 사항들을 살펴 보면 평범하다:

이 책에서 활용하는 프로그래밍 실습용 개발자 환경(IDE)는 구글에서 온라인 웹사이트에서 운영중인 구글 콜랩(Google Colaboratory) 도구를 사용하여 코드를 작성하고 직접 실행하여 결과를 확인할 수 있게 하고 있다.


Python 언어의 라이브러리 패키지 중에 판다스(Pandas)에서 제공하는 데이터 처리용 라이브러리 함수들을 사용함으로써 독자로 하여금 데이터 처리 작업을 대폭 쉽게 만들어주고 있다. 판다스 라이브러리는 액셀 파일 데이터를 그대로 읽어 와서 사용할 수 있어서 실제 업무 환경에서 활용도가 높기 때문에 유용한 장점이 있다.


이 책이 가지는 독특한 점은, 무엇보다, 책 내용이 결코 지루하지 않다는 것이다

저자의 야구매니아라는 독특한 배경에서 기인하여 프로그래밍을 수행하는 대상의 데이터가 프로야구 선수의 실제 데이터를 사용한다는 점에서 몰입도가 올라간다. 여기에서는 2023년 미국 프로야구 메이저리그에서 활동했던 일본의 오타니 선수의 데이터를 사용하고 있다. 참고로 동일한 메이저리그 웹사이트에서 류현진 선수의 데이터도 검색이 가능하니 동일하게 응용해볼 수도 있다.


아무리 실제 프로야구 선수 데이터를 가져다 쓴다고 한들 그저 데이터 분석의 하나의 사례에 지나지 않다는 사실은 변하지 않는다. 저자는 데이터 분석으로만 그치지 않고 데이터 분석과 시각화를 통해 분석 대상과 실제 관련된 작업의 의미를 발견하고 효율성을 높이는 방법을 보여준다. 저자가 서문에서 업무의 데이터 분석을 통해 목표 설정을 구체적인 정량화한 숫자로 도출하는 예시를 이야기하기도 하지만, 오타니 선수의 투구 데이터를 분석한 결과를 보면, 구종별로 주로 던지는 코스 패턴을 도출해낼 수 있다: 예를 들면, 패스트볼(직구)의 경우 우타자 아웃코스와 좌타자 인코스 쪽에 높은 확률로 던진다는 패턴을 파악할 수 있다.




추가적으로 sns상의 게시물에 관한 데이터를 활용하는 분석 방법과 chatGPT를 활용해서 코드 오류나 개선을 학습시키고 코드 작성에 활용하는 팁도 소개하는 것도 프로그래밍 작업에 참고할 만한 내용이다.


전반적으로 보면, Python 언어를 학습하여 프로그래밍을 통해, 데이터 분석과 시각화를 기반으로 궁극적으로 데이터를 구체적으로 활용하는 방식과 사례를 배울 수 있는 Python 프로그래밍 학습서라는 생각이 든다.





댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo