파이썬을 활용한 베이지안 통계 - 동전 던지기부터 월드컵까지 다양하게 배우는 데이터분석, 2판
앨런 B. 다우니 지음, 권정민 옮김 / 한빛미디어 / 2022년 6월
평점 :
장바구니담기


이 책은 미국 매사추세츠주 보스턴에 위치하는 "올린 공과대학" 앨런B. 다우니 교수가 작성한 책이다. Think Python, Think Stats, Think DSP등 주로 "Think XXX"시리즈 책을 출판하였다. 이번에 처음 접하게 된 이 책은 원제가 Think Bayes로써 가장 최근에 출판된  Trhink 시리즈 책이다. 통계학의 이론들을 Python으로 구현하는 Think Stats의 후속 책이라고 봐도 무방할 듯 하다. 


데이터를 다루고 통계를 활용하는데 있어 R, Matlap, Python등 다양한 개발 언어들이 있을텐데 이 책에서는 Python이 활용되고 있다. Python의 Jupyter notebook 인터페이스와  Numpy, Pandas 모듈을 통해 다양한 예시의 통계를 설명하고 있다. 참고로 Numpy는 행렬이나 다차원 배열을 그리고 Pandas는 데이터 조작 및 분석을 위한 오픈소스이다.


저자는 친절하게 이론과 코드를 한줄 한줄 설명한다. 책에서 소개되는 알고리즘을 직접 구현해야할 일 또한 거의 없다. 다만 Python을 하나도 모른다! 그러면 Python에 대한 기초적인 공부와 Jupyer notebook을 조금 사용해보고 시작하는게 좋다. 베이즈안 이론에서만 헤매야지 Python에서도 같이 헤매고 있으면 책을 보다가 중도 포기할 가능성이 높다.

어떤 부분은 술술 읽히는 부분도 있지만 대부분 두 번씩 읽어보고 한번 실행을 직접해봐야 조금이나마 이해가 갔다. 때론 잘 알고 있는 사람이 옆에서 코칭을 해줬으면 하는 생각도 들기도 했다. 반복해서 나오는 쿠키 문제, 그리고 순간 멘붕을 주었던 몬티홀 문제로 시작하여 정말로 다양한 예시들을 제공한다. 특히 챕터 8장 포사오 과정을 읽으면서 (임의의 시간에 발생하는 이벤트를 나타내는 모델), 축구 경기 예시가 나온다. 그 유명한 풋볼 매니저란 게임에 이러한 이론들을 활용해서 구현한게 아닐까 하는 생각이 문득 들었다.

2014년 7월 초판 이후 약 8년만에 전면 재개정되어 2판이 출판되었다. 베이지안 통계에 대해 관심이 있는 개발자나 주로 활용하는 데이터 사이언티스트, AI 엔지니어등 공부할 계획이 있었다면 이번에 새롭게 재개정된 책을 구매해서 보는 것을 추천한다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다." 




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo