1.
미-서전쟁 동안 미 해군의 전사율은 천 명당 9명이었다. 그런데 같은 기간 중 뉴욕시에서의 사망률은 천 명당 16명이었다. 미 해군의 징병관들은 이 숫자를 이용해서 해군 입대가 뉴욕에 거주하는 것보다 더 안전하다고 선전하였다.
백 번 양보하여 이 숫자 자체가 정확하다고 가정하자. 그리고 이 숫자의 맹점 또는 징병관들이 이 숫자로부터 추론한 결론의 맹점이 어디에 숨겨져 있는지 잠깐 생각해보자. 실은 애당초 두 집단은 비교가 불가능한 집단이었다. 해군은 대부분이 육체적으로 건강한 청년들로 구성되어 있는데 비해 뉴욕시민 중에는 갓난아이도 있을 것이고 노인이나 환자들도 끼어 있어서 그들이 세계의 어느 곳에서살건 간에 사망률은 당연히 높았을 것이다. 따라서 이 숫자가 해군 입대 기준에 통과할 만한 건강한 청년들이 뉴욕시내에 살 때보다 해군에 입대해 있을 때가 사망률이 더 적다는 것을 증명한 것은 아니며 그 역도 성립하지 않는다.
2.
대학교육의 금전적인 가치를 나타내는 숫자가 여러분야에서 집계되고 또 산더미 같은 팸플릿을 발간하여 이 숫자들과 이를 근거로 한 여러 설명들을 통해 미래 대학생들의 관심을 끌려고 한다. 나는 이와 같은 의도에 대하여 시비 걸 생각은 전혀 없다.
..(중략)..
단 한 가지 잘못된 점이 있다면 그것은 이와 같은 숫자나 사실이 엉뚱한 결론에 도달할 수도 있다는 사실이다. 그것도 전후관계와 인과관계를 혼동하는 전형적인 오류이다. 즉 이 숫자들은 만약 당신 또는 당신의 아들이나 딸이 앞으로 4년간 대학에 다닌다면 다니지 않는 것에 비해 더 많은 수입을 얻을 수 있다고 주장한다. 이 부당한 결론은 일반적으로 대학교육을 받은 사람의 소득이 높은데 그 이유는 그들이 대학에 입학했었기 때문이라는 똑같이 부당한 가정을 근거로 얻어진 것이다. 확실하게는 알 수 없지만 이 친구들은 설사 대학에 안 갔더라도 높은 소득을 올릴 수 있는 사람들이었을지도 모른다.
3.
오늘날에는 다음 현상들 중에서 그 어느 것들을 택하더라도 둘 사이에 양의 상관관계가 있음을 쉽게 보여줄 수 있다. 그 현상들이란 대학생 수, 정신병원의 환자 수, 담배 소비량, 심장병 환자 수, X-선 기기의 수, 의치의 생산량, 캘리포니아주의 교사 급료, 네바다주의 도박장 수익 등이다. 그렇다고 해서 이 중의 어느 하나가 다른 것의 원인이라고 생각하는 것은 어리석은 일이다. 그런데도 불구하고 매일 그런 일이 벌어지고 있다.
애매모호한 통계적 처리를 받아들이거나 숫자나 소수점의 최면효과를 이용해서 엉터리 인과관계로 꾸며내는 행위는 미신숭배와 다르지 않다.
4.
어쩌면 당신은 유명한 루돌프 플래시의 '가독성 공식'에 관해서 알고 있을지도 모르겠다. 주어진 문장이 얼마나 읽기 쉬운가를 측정하기 위하여 그 문장에 사용된 단어나 구절의 길이 등등의 간단하고도 객관적인 요소를 이용해 만들어낸 공식이다. 잴 수 없는 것이라도 숫자로 바꾸어버리거나 판단하기 힘든 사물이라도 산수를 써서 판단한다든가 하는 따위의 여러 편법과 마찬가지로 이 공식도 확실히 설득력이 있다.
..(중략)..
이 공식에서의 가정은 단어나 구절의 길이가 가독성을 결정한다는 데에 있다. 이런 가정은 흔하고 평범한 것처럼 보이지만 사실은 증명조차 되어있지 않은 것이다.
그런데 로버트 듀포라는 사람이 마침 주변에 있는 몇개의 작품으로 플래시의 공식을 시험해 보았다. 그 결과는 <슬리피 할로우의 전설>쪽이 플라톤의 <국가론>보다 1.5배나 읽기 힘든 것으로 나타났다. 또 싱클레어 루이스의 소설인 <카스 팀벌레인>쪽이 자끄 마리땡의 <예술의 정신적 가치>보다도 읽기 힘든 것으로 나타났다.
5.
너무나 정확한 숫자도 상식에 맞지 않는 점이 있다. 뉴욕의 신문들은 가족을 가진 직업 여성이 가족과 함께 만족한 생활을 하기 위해 주당 40.13달러의 주급이 필요하다는 연구결과를 기사화하였다. 조금 더 논리적으로 생각하며 이 기사를 읽어 나간 독자들이라면, 인간이 마음과 몸의 평안을 찾아 충족한 생활을 유지해 나가는데 필요한 경비를 산출하는데 무슨 놈의 마지막 1센트까지 계산을 해야하는가를 의심하게 될 것이다.
6.
노동성 관리들이 정말로 알아낸 사실은 '얼마나 자주 목욕했는지'가 아니라 '얼마나 자주 목욕했다고 말했는지'라는 것이다.
※참고:통계의 속임수를 피하는 다섯가지 열쇠-이 책의 마지막 장.
1.누가 발표했는가? 출처를 캐봐야한다.
2.어떤 방법으로 알게 되었는지, 조사방법에 주의해야 한다.
3.빠진 데이터는 없는지 숨겨진 자료를 찾아보아야 한다.
4.내용이 뒤바뀐 것은 아닐지 쟁점 바꿔치기에 주의해야 한다.
5.상식적으로 말이 되는 이야기인가 살펴봐야한다. 석연치 않은 부분은 조사해라.