-
-
파이썬을 활용한 베이지안 통계 - 동전 던지기부터 월드컵까지 다양하게 배우는 데이터분석, 2판
앨런 B. 다우니 지음, 권정민 옮김 / 한빛미디어 / 2022년 6월
평점 :
[도서 소개]
베이지안으로 생각하고 프로그래밍하라
베이지안 통계를 마주하는 데는 프로그래밍으로 충분하다. 이 책을 읽고 나면 통계 문제를 수식 대신 파이썬 코드로, 연속 확률 분포 대신 이산 확률 분포를 사용해서 풀 수 있게 된다. 골치 아픈 수학 대신 프로그래밍을 통해 베이지안 기초 지식을 이해하고, 통계 기법 하나하나를 실생활 문제에 적용해보자.
베이지안 통계 기법이 더 보편화되고 더욱 주목받고 있지만, 초심자가 볼 만한 자료는 별로 없다. 이 책은 저자 앨런 B. 다우니의 대학교 학부 강의를 기반으로 한 계산 접근법으로 베이지안 통계에 순조롭게 접근하도록 도와준다.
[주요 내용]
- 프로그래밍으로 베이지안 통계를 배우고 이해하기
- 추정, 예측, 의사 결정 분석, 증명, 베이지안 가설 검정 등의 문제 살펴보기
- 동전, 주사위, 쿠기 그릇 등의 간단한 예제를 통해 이해하기
- 실생활 문제를 푸는 데 사용하는 계산법 익히기
[서평]
이 책을 읽기에 앞서 파이썬 언어에 어느 정도 익숙해야 한다. 넘파이와 판다스에 대해서 잘 모른다면 이책을 보는데 어려움이 있을것이다. 그리고 미적분학, 선형대수학 등 수학적 통계 지식이 꼭 모르더라도 이책을 읽는데는 크게 무리는 없다. 1장에서는 확률이 무엇인지 정의하고 베이즈 정리의 기초가 되는 연속확률을 소개한다. 3장에서는 베이지안 통계의 기초가 되는 확률 분포를 설명한다. 뒤에서는 이항분포, 지수분포, 포아송분포, 베타분포, 감마분포,정규분포, 등 다양한 이산분포 및 연속분포를 사용한다. 하지만 우리는 사이파이를 사용하므로, 각분포의 특성을 알 필요는 없다. 이책의 대부분 장은 실생활 문제를 사용하다 보니 모델링에 다소 난이도가 있다. 베이지안 방법론을 적용하기 전에 모델에 실생활의 어떤 부분을 반영하고 어떤 부분을 단순화할 지 판단해야 한다. 예를 들어 8장에서 사용하는 문제는 축구 경기의 승자 예측이다. 여기서 점수를 매기는 데 포아송 프로세스로 모델링하면서 골이 게임의 어떤 시간대나 동일하게 들어갈 수 있다고 가정했다. 이는 완전히 맞는 말은 아니지만 대부분의 목적에 충분히 부합한다. 문제 해결 과정에서 모델링을 보이는 곳에 배치하는 것이 중요하다. 이런 과정을 통해 모델링에서 발생할 수 있는 오류를 고민할 수 있다. 이책의 다양한 방법론은 이산분포를 기반으로 하기 때문에 일부 사람들은 수치 오차를 걱정한다. 하지만 실제 상황에서 수치 오차는 모델링에서 발생하는 오차보다 대부분 적다. 게다가 이산적 접근은 종종 더 나은 모델을 고르게 해준다. 나쁜 모델로부터 정확한 해답을 얻기보다는 좋은 모델로 근사치의 해답을 얻는것이 낫다.
일상에서 쉽게 접할 수 있는 사건으로 배우는 베이지안 통계
베이지안 통계를 다루는 대부분의 책에서는 수학 기호와 미적분 같은 수학적 개념을 적용해 생각을 표현합니다. 이 책에서는 수학적 개념 대신 파이썬 코드를 사용하고, 연속적 수학 대신 이산적 가정을 사용합니다. 적분은 합으로, 확률 분포 연산은 반복문이나 행렬 연산으로 나타냅니다.
이렇게 일상에서 쉽게 접할 법한 일을 기반으로, 개발자에게 손쉬우면서 일반인도 배우기 쉬운 파이썬 프로그래밍 언어로 통계학을 풀어내고 있습니다. 술술 읽히며 어느새 집중하게 되는 저자의 실생활 예제와 간단한 코드로 데이터에 새로운 시각을 더해봅시다.
"한빛미디어 리뷰어 활동을 위해서 책을 제공받아 작성된 서평입니다."