-
-
벌거벗은 통계학
찰스 윌런 지음, 김명철 옮김 / 책읽는수요일 / 2013년 10월
평점 :
‘돈의 정석’에 이어서 찰스 윌런의 저서는 두 번째이다. 돈의 정석에서도 느꼈지만 찰스 윌런의 책의 특징은 내용이 굉장히 충실하고 교양서 이상의 깊이가 있다는 점이다. 바꾸어 말하면 교양 수준을 기대하고 읽었는데 예상 외로 어려울 수도 있다. 특히나 이번 책은 통계학에 관한 책이다. 본인 또한 고등학교를 거쳐 대학 진학 후 경제학과 함께 통계학을 공부했지만 상당히 지루하고 난해했던 기억이 있다. 이렇게 배경지식이 얕게나마 있는 나도차도 ‘벌거벗은 통계학’을 읽으면서 내용을 소화시키느라 쉽게 진도가 나가지 않고, 공부하는 마음가짐으로 읽어 나갔다. 솔직히 고백하건데 본인은 이 책을 2회독했다. 완전히 2회독한 것은 아니고 중요한 곳에 인덱스를 붙여 놓은 곳만 골라서 다시 읽은 것인데, 2회독하니 내용이 전보다 이해가 훨씬 잘 되었다. 1회독 때의 문제는 중간에 핵심 내용을 잘 이해하지 않고 넘어간 것이 화근이었다. 핵심 내용을 이해하지 못하고 넘어가니 후반부가 잘 이해되지 않는 것은 당연한 일이었다.
지금까지 쓴 것만 보면 너무 겁을 준 것 같지만 이 책은 굉장히 잘 쓴 책이다. 주제가 주제인 만큼 어려움을 감안하더라도, 통계학 교양서적 중 이 책만큼 충실하고 쉽게 풀어 쓴 책은 없을 것이다. 이 책만 잘 소화한다면 대학교 기초통계학 과목을 수강한 효과와 비슷할 것이라고 확신한다. 개인적으로 찰스 윌런의 책은 “좋은 약은 입에 쓰다” 라는 격언을 떠올리게 한다. 쉽지는 않지만 소화하고 나면 남는 것이 많다.
이 책에서 두 가지 핵심 내용을 말하자면 ‘중심극한정리’와 ‘회귀분석’이라고 할 수 있다. 특히 중심극한정리를 잘 이해하는 것이 중요하다. 내가 중심극한정리를 잘 이해하지 못하고 넘어가서 후반부도 헤맸다고 할 수 있다. 중심극한정리가 중요한 이유는 모든 통계적 추론의 밑바탕이기 때문이다. 표본평균, 표본오차, 표본평균은 모집단의 평균을 중심으로 정규분포를 이룬다는 사실 등 이 부분을 잘 이해하고 넘어가야 다음 과정으로 넘어갈 수 있다. 모든 사회과학이 그렇듯이 기초를 건너뛰고 다음으로 진행할 수는 없는 법이다. 오늘날 사회과학을 급격하게 발전시킨 회귀분석 또한 회귀계수의 유의성을 검정하기 위해 중심극한정리가 이용된다. 이 정도면 정말 통계학에서 중심극한정리라는 개념은 저자가 말하듯이 통계학의 슈퍼스타 르브론 제임스라 칭할 만하다.
한편 저자는 통계학이 굉장히 유용하면서도 위험한 도구라고 말한다. 회귀분석을 하면서도 통계적 계산과정보다 올바른 방정식을 세우는 과정이 중요하고, 무엇보다 이론적 기반이 있어야 한다고 주장한다. 회귀분석 자체는 그저 상관관계를 보여줄 뿐이다. 이것을 인과관계로 착각하면 지난 20년 간 미국 내 자폐증 증가와 중국의 국민소득 증가를 연관시킬 수 있다. 또한 우리나라 뉴스에도 많이 나오는 내용인데, 남녀 간 임금차별을 다룬 논문에 대해서도 저자는 소개한다. MBA 졸업 후 동기 간 남녀 임금 차이의 세 가지 주 원인은 ‘재학 중 받은 교육의 차이’, ‘커리어 단절’, ‘주당 근무 시간 차이’로 밝혀졌다. 흔히 생각하듯이 그저 성별을 나누어 임금을 차별한 것이 아니라는 말이다. 그러나 이렇게 엄밀한 과정을 거친 논문과는 다르게 현실에서는 raw data만을 가지고 대중과 여론을 선동하는 세력들이 있다. 가령 자극적인 헤드라인을 사랑하는 일부 기자들, 본인들의 기득권을 공고히 하기 위한 일부 여성단체들, 남녀를 갈라치기 하여 표심을 잡기 위한 일부 정치인들 등등 말이다. 결론적으로 통계는 칼과 같다. 어떻게 쓰느냐에 따라서 유용하게 쓰일 수도 있고, 흉기로 쓰일 수도 있다. 통계 자체는 죄가 없다. 저자가 말했듯이 연구자의 논리와 엄밀한 방법론이 중요한 것이다.