그렇지! 바로, 그거다. 이렇게 통계를 어떻게 해석하느냐, 어떻게 인과관계를 추론하느냐에 따라 정치적으로 전혀 엉뚱한 결론을 만들어 낼 수 있단다. 그러니 통계를 남용하여 성급한인과론을 주장하는 사람들은 정치적으로 의심할 필요가 있단다. - P71
"선생님 덕분에 많은 교훈을 얻었어요. 우리가 어떤 사회 집단에 대해서베이를 실시한다는 것은 어떤 현상을 수치로 측정 가능한 변인과 변인의 관계로 설명하고 이것을 통계적으로 검증한다는 뜻이에요. 그리고 변인을 어떻게 설정할 것인지, 변인과 변인의 관계를 어떻게 해석할지까지는통계적으로 결정해 주지는 않는다는 것을 알았어요. 그건 결국 사람의 영역이에요. 그래서 통계는 분명 유용한 도구이긴 하지만 합리적이고 신중한해석 없이 무작정 믿었다가는 도구가 아니라 흉기가 될 수도 있어요." - P75
실제로 단순무작위표본추출은 표본 추출을 하기 전에 일련번호를 가진 목록이 확보되어야 한다. 그러나 모집단이 아주 클 경우 이런 목록을 만든다는 것은 아예불가능하거나 설사 가능하다 하더라도 비용이 아주 많이 들어서실현이 불가능하다. 그래서 몇 가지 다른 방법이 사용되고 있단다. 그중 가장 많이 사용되는 방법이 층화표본추출과 집락표본추출, 그리고 이 둘을 결합한 층화집락표본추출이다. 층화표본추출은 모집단을 몇 개의 층으로 나눈 다음 각 층에서표본을 추출하는 방법이다. 예를 들면 우리 학교 학생 1,500명에서 한꺼번에 표본을 추출하는 것이 아니라 각 학년에서 50명씩 앞에서 본 난수를 이용해서 추출하는 것이지. 이때 모집단을 나누는층이 의미가 있으려면 같은 층끼리는 동질적이고, 다른 층과는 이질적인 특성이 있어야 한다. - P122
아무리 정교하게 설계된 조사라고 하더라도 조사자는 자신이 예측할 수 있는 것은 정확한 수치가 아니라 어디까지나 일정한 범위내의 수치임을 명심하고, 진실 앞에 겸허해야 한다. - P134
1인당 국민소득이 비현실적으로 느껴지는 이유도 그 때문이란다. 1인당 국민소득은 평균을 낸 수치이고 국민소득의 중앙값은 중위 소득이라고 한다. 2003년에서 2009년 사이에 1인당 국민소득과 중위 소득의 비율을 조사했는데, 1인당 국민소득보다 중위 소득이 더 낮았단다. 그러니까 우리나라 1인당 국민소득은 극단값에 해당하는 두드러지는 부자들 때문에 평균이 올라갔단 뜻이지. - P170
"통계는 양날의 칼과 같다는 것을 알게 되었어요. 이렇게 통계적인 방법을 이용하면 어떤 주장을 훨씬 설득력 있게 할 수 있지만, 반면에 이걸남용하면 설득력이 큰 만큼 더 위험해요. 거짓말을 마치 과학적인 근거가있는 듯 포장하거나, 아니면 현실에 대한 왜곡된 정보를 제공할 수 있으니까요." - P193
영국의 정치가 디스레일리라는 사람이 세상에는 세 가지 거짓말이 있다고 했대. 거짓말, 새빨간 거짓말, 그리고 통계. 하지만 거꾸로 세상에는 세 가지 진실이 있어. 진실, 참된 진실, 그리고 통계. 통계는 다른 거짓말과 달리 그 원리를 알고 사용법을 알면 속지 않을 수 있는 거짓말이야. 그러니 통계가 거짓말로 쓰이는 데는 속이는 사람들 탓도 있지만 속는 사람들의 무지도 있는 법이지. 게다가 오늘날 우리가 살아가는 세상은 온통 통계 수치로 뒤덮여 있어. 모든 통계를 거짓말이라고 밀어내기보다는 진실한 통계와 거짓된 통계를 구별할 수 있는 능력을 갖추는 게 올바른 길일 거야. - P202
|