야구 데이터로 배우는 파이썬 - 오타니 쇼헤이 데이터를 통해 시작하는 분석과 시각화
사이토 아마네 지음, 고범석 옮김 / 영진.com(영진닷컴) / 2025년 2월
평점 :
장바구니담기



* 출판사로부터 도서를 제공받아 작성한 주관적인 리뷰입니다.

새로운 지식 습득이라는 측면에서 파이썬도 책을 읽은 것과 같이 가볍게 접근했다. 야구보다는 파이썬에 관심이 있어 책을 읽기 시작했다. 도코 대 야구부 출신인 저자 사이토 아마네는 실제 야구 데이터를 사용해서 그래프 작성, 우승을 갈망했기에 철저한 선수들 오타니 쇼헤이 등의 야구 데이터 분석, 매출, 집객, sns를 통한 비즈니스 분석을 터득할 수 있도록 유도했다. 초보나 경험자도 즐기면서 익힐 수 있도록 방법을 소개했다. 야구용어 패스트볼, 커터, 스위퍼, 커브, 스플리터를 모르는 나에겐 색다른 떨림으로 집중할 수 있는 시간이라 더 좋았다. 가끔 파이썬보다 야구가 더 어렵게 느껴지긴했다. 읽으면서 야구에 대한 저자의 진심이 느껴졌다. 파이썬의 장점은 한 번 작성하면 재사용할 수 있다는 것, 라이브러리의 풍부, 빅데이터의 효율성이다. 선수들의 투구의 구종 비율은 다양한 그래프로, 구속 분포는 히스토그램으로, 투구 도달 위치는 산포도와 히트맵으로, 릴리스 포인트는 상자 수염 그래프로 분석하고, 마지막 피드백까지 철저하게 알려 준다. 다양한 명령어를 이용해서 쉽게 만들어 보도록 해 주었다..

나는 대한민국을 빛난 선수들을 대상으로 우리나라에 끼친 영향력에 대해 데이터를 만들어 보기로 했다. 먼저 선수5명이다. 생각나는 대로 손흥민, 김연아, 박찬호, 김연경, 류현진 선수들을 선정했다. 영문으로 Son Heung-min (Football/Soccer), Kim Yuna (Figure Skating), Park Chan-ho (Baseball), Kim Yeon-koung (Volleyball), Ryu Hyun-jin (Baseball) 바꾸고 종목으로 구분했다. 우리나라에 주는 영향력은 히스토그램과 수입금액 데이터로로 만들었다. 선수 이름, 종목, 주요 기록을 딕셔너리 형태로 리스트에 저장하고, 선수 이름과 주요 기록을 각각의 리스트로 분리했다. 히스토그램 생성은 x축은 선수 이름, y축은 주요 기록, 임의로로 연도별 수입 데이터를 딕셔너리 형태로 저장, 그래프 제목, 레이블, x축 레이블 회전 등을 설정했다. 대한민국 연도별 수입은 x축은 연도, y축은 수입액, 그래프 제목, 레이블, 그리드 등을 설정했다. matplotlib.pyplot 라이브러리를 사용하기 위해 pip install matplotlib 명령어를 사용했다. 책에 있는 내용대로 똑같이 만들려고 스트레스 받기 보다는 내가 가볍게 웹사이트, 다양한 어플리케이션 개발, 로봇 제어, AI , 머신 러닝, LLM 개발의 전문 분야에 사용되는 파이썬은 직접 해본다고 생각하면 쉽게 배울 수 있을 것 같다. 무조건 직접 만들어라.





*리뷰어스 클럽 서평단으로서 출판사로부터 도서를 제공받아 작성하였습니다.

#야구데이터로배우는파이썬#영진닷컴#사이토아마네#데이터분석#야구데이터#오타니쇼헤이#네이버독서카페#리뷰어스클럽



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo