-
-
벌거벗은 통계학
찰스 윌런 지음, 김명철 옮김 / 책읽는수요일 / 2013년 10월
평점 :
제목 : 벌거벗은 통계학
작가 : 찰스 윌런
번역 : 김명철
출판사 : 책읽는 수요일
읽은날 : 2018/06/04 - 2018/06/21
분류 : 일반
사실 아무도 믿지는 않지만 난 통계학을 전공했다. 지금처럼 data가 풍성하지도 않았고, data를 가공하는 소프트웨어의 능력도 뛰어나지 않아서 실습위주가 아닌 수학위주로 배우긴 했지만 어쨋든 통계분석도 많이 해보고 다른 사람들 논문의 통계처리도 꽤 해줬었다.
당시에는 data를 꼼꼼히 쳐다보기 보다는 빨리 분석해서 이론적 툴에 맞춰서 결과를 뽑아내는 게 통계학인줄 알았다. 그런데 사회에 나와서 일을 해보니 빠른 업무처리보다는 data를 뜯어보고 이 data가 어떻게 만들어졌고, 왜 이런 결과를 만들어내는지 어떻게 해석해야 할지가 뭘씬 중요하더라.
그런걸 모르로 패키지만 돌리니 현실적이지도 않고, 말도 안되는 분석결과를 가지고 오는 친구들을 종종 보게 된다.
이 책은 통계에서 나오는 실수와 조작에 대해서 밝히는 책이다.
숫자는 객관적이라고 사람들이 생각하지만 사실 스케일을 바꾸거나 약간의 data의 변환을 통해서 전혀 다른 이야기를 만들어낼 수 있다.
가장 단순한 평균이라는 도구도 그렇고, 이 책에서 이야기하는 회귀분석도 그렇다. 사회과학에서 많이 사용하긴 하지만 군집분석이나 판별분석같은 도구를 보면 정말 코에 걸면 코걸이, 귀에 걸면 귀걸이가 이런게 아닐까 싶다.
수학적 배경이 많지 않아도 쉽게 읽을 수 있다.
그리고 주변에서 흔히 일어나는 실수들이 책에 많이 나오다 보니 책을 읽다가 보면 내가 봤던 사례들이 많이 생각이 난다.
회사에서 일하는 사람들이라면 한번씩 다 읽어봐야 하는 책이라고 생각된다.
P38 우리는 통계적 분석을 이용하여 두 변수 사이의 강한 연관성을 도출할 수 있지만, 그러한 연관성이 존재하는 이유를 항상 설명할 수 있는 것은 아니다.
p81 정확성은 어떤 수치가 진실과 전반적으로 얼마나 일치하는지를 재는 척도이므로, 정밀하다고 해서 정확하다고 착각하면 위험하다
p87 핵심적인 교훈은 분석단위에 주의를 기울여야 한다는 것이다
p100 "올해는 모든 직원들의 연봉이 똑같이 10퍼센트 인상될 것입니다"라는 말은 "내 임금 인상액은 당신에 비해 20배 많습니다"보다 듣기에만 더 좋은 표현에 불과하다
p147 기댓값은 대가와 예상결과가 주어졌을 때 특정 사건이 공정한지 여부를 알려줄 수 있기 때문에 매우 강력하다
p180 이 모델은 그 1퍼센트 시나리오가 얼마나 나쁜 상황이 될지에 대해 알려주지 않는다. 가능성은 적지만 결과가 비극적인 꼬리리스크는 거의 주목받지 않았다
p181 가장 큰 리스크는 당신이 한 번도 본 적이 없고, 그렇기 때문에 측정할 수 없다
p215 표본이 쓰레기 같을 때는 표본크기가 클수록 결과적으로 쓰레기 더미만 거대해지고 악취도 고약해질 뿐이다
p305 정확하고 의미있는 결과를 얻으려면, 반드시 올바른 방식으로 여론조사를 해야하고, 결과 또한 정확히 해석해야 한다
p310 정치가들은 중립적이지 않은 말을 택함으로써 유권자의 응답을 조작하려 한다
p324 회귀분석에서 정말 어려운 절차는 분석할 때 필수적으로 고려해야 할 변수가 무엇인지 정하는 것과, 어떻게 하면 이런 변수를 가장 잘 정할 수 있는지를 알아내는 것이다
p426 정보화 사회가 풀어야 할 난제는 이 정보를 사용해 무슨 일을 하는가이다.