숫자에 약한 사람들을 위한 통계학 수업 - 데이터에서 세상을 읽어내는 법
데이비드 스피겔할터 지음, 권혜승 외 옮김 / 웅진지식하우스 / 2020년 8월
평점 :
장바구니담기


 

시프먼의 범죄에 대한 통계적 접근은 비극적인 죽음을 맞이한 긴 희생자 목록에서 한 걸음 물러서기를 요구한다. 그 과정에서 삶과 죽음에 관한 개인적이고 고유한 세부 사항들은 건조한 숫자와 그래프로 바뀐다. 처음에는 이것이 냉정하고 비인간적인 것처럼 보일 수 있다. 하지만 통계과학으로 세상을 이해하려면, 일상의 경험은 데이터로 전환되어야 한다. 즉 우리는 사건들을 범주별로 묶고 꼬리표를 달고 측정값을 기록한 뒤 그 분석 결과에 대해 논의해야 한다.     p.11

 

오늘날 우리는 데이터과학의 시대에 살고 있다. 교통 상황, SNS 게시물, 온라인 구매 이력 등 일상에서 수집된 거대한 데이터가 이동 경로 최적화, 맞춤 광고, 구매 추천 서비스 같은 기술에 사용되고 있으니 말이다. 우리는 잡음 속 신호를 감지해내서, 일상생활에서 맞닥뜨리는 선택의 순간에 좋은 결정을 내리길 원한다. 알고리즘은 과거 데이터를 사용해, 그런 문제들을 공략한다. 이렇게 개인의 취향과 관심사마저 수량화되는 빅데이터 시대에 살고 있는 우리에게 통계적 분석과 사고 능력은 읽고 쓰는 능력만큼이나 중요하다.

 

이 책은 세상에서 벌어지는 각종 현상과 사건을 이해하는 데 필요한 통계과학을 설명해준다. 단순히 평균이나 표준편차를 계산하는 것이 아닌, 데이터에서 의미 있는 패턴과 관계를 연구하는 통계학을 실세계의 데이터와 예제를 활용해 보여주고 있어 더욱 흥미롭게 읽을 수 있다. 통계학이 집값 예측부터 질병 추적, 살인 패턴 분석뿐만 아니라 일상의 소소한 호기심까지 해결할 수 있다고 하니 말이다. 특히나 이 책은 기술적 측면보다는 개념적 측면에 더 비중을 두고 있어 인상적이었다. 골치 아픈 수식은 거의 없고, 그나마 몇 개 등장하는 수식도 맨 뒤에 수록되어 있는 용어집에서나 볼 수 있다. 그러니 기술적이지 않은 통계학 입문서를 찾고 있는 학생과 일상에서 맞닥뜨리는 통계에 관해 쉽게 이해하고 싶은 일반인에게도 도움이 될 것이다. 그리고 수포자도 얼마든지 읽을 수 있다는 점 또한 이 책이 가지고 있는 큰 장점이다.

 

 

우리는 이미 정해져 있지만 우리에게는 알려지지 않은 것들에 둘러싸여 있다. 우리는 다음에 받을 카드에 내기를 건다. 또는 스크래치 복권을 산다. 또는 아이의 가능한 성별에 대해 이야기한다. 그 밖에 추리소설을 두고 골머리를 쥐어짜고, 야생에 남은 호랑이의 수에 관해 논쟁하고, 이민자나 실업자 추정값을 듣는다. 이 모든 것은 세상 어딘가에 존재하는 사실이나 수이다. 다만 우리는 그것들이 무엇인지 알지 못한다. 베이즈 방법은, 이런 사실이나 수에 대한 개인적 무지를 나타내기 위해 확률을 사용한다.      p.338

 

베이컨, 햄, 소시지가 담배 같은 발암물질이라는 WHO의 발표는, 암 발병률을 18퍼센트 증가시킨다고 한다. 하지만 이를 실제 사람 수로 환산해보면 100명 중 6명이 7명으로 증가할 뿐이다. 사고 다발 지역에 과속 단속 카메라를 설치한 후에 사고율이 내려가면, 대부분 카메라 덕분이라고 생각한다. 하지만 실제로 카메라의 설치 효과 중 약 3분의 2는 '평균으로의 회귀' 증상 때문인 걸로 밝혀졌다. 그 밖에도 통계는 사람들의 수명에 관한 데이터를 가지고 내가 80살까지 살 가능성을 예측해보기도 하고, 특정 시간과 장소에 비가 올지 안 올지에 대한 예측도 해보고, 자녀의 키가 부모 중 누구와 더 큰 연관성이 있는지를 예측할 수도 있다. 우리는 일기예보를 보고 우산을 챙길지 말지 결정하고, 어떤 식당에 가고 어떤 영화를 볼지를 결정할 때도 사용자 평점을 참고한다. 여론조사 결과는 투표에, 경제 지수는 투자 등의 가계 운용에 영향을 미치기도 하니, 통계란 것이 우리 일상에서 얼마나 많이 활용되고 있는지 알 수 있을 것이다.

 

통상적인 사망자 수보다 몇 명이나 더 죽어야 연쇄살인을 알 수 있을까? 정확도가 90%인 암 검사 결과 양성인 사람이 실제 암에 걸렸을 확률은? 매일 일어나는 살인 사건의 수, 실업률, 사고가 났을 때 승객들의 구체적인 생존율 등등 데이터를 통해 결론을 이끌어 내는 상황들은 너무도 다양했다. 저자는 통계학의 고수처럼 생각하는 10가지 방법을 제안한다. 통계적 방법은 데이터가 과학적 질문에 답하게 해야 한다, 신호는 항상 잡음과 함께 나타난다. 그 두 가지를 구분하려는 노력이 통계학을 흥미롭게 만든다, 데이터의 질에 신경 써라. 모든 것은 데이터에 달려 있다. 등 우리 삶 전반에서 중요한 역할을 하고 있는 통계학을 제대로 활용할 수 있는 팁들이 도움이 될 것이다. 자 너머 세상의 흐름을 올바르게 읽어내는 통계적 사고의 힘이 궁금하다면 이 책을 만나 보자. 일상에서 맞닥뜨리는 숫자들에 관해 질문을 던질 수 있는 데이터 문해력을 길러 줄 테니 말이다.

 

 

*출판사로부터 도서를 제공받아 주관적으로 작성한 리뷰입니다.


댓글(0) 먼댓글(0) 좋아요(9)
좋아요
북마크하기찜하기 thankstoThanksTo