-
-
통계학 超 입문
다카하시 요이치 지음, 오시연 옮김 / 지상사 / 2020년 1월
평점 :
인터넷 활용이 당연시된 이 시대에 방대한 자료를 수집하기란 식은 죽 먹기이지만, 그 자료를 처리하고 정리 그리고 이해하려면 통계학이 필요하다.
통계학은 어렵다. 고로 일부 내용만 잘라내어 전체 내용을 이해할 수 있는 공략법도 없다. 통계학을 어렵다고 느꼈다면 그것은 오해가 아니라 그야말로 사실이다.
원래 통계학이라는 학문은 수학 분야에 속한다. 수식을 활용해서 이해하는 것을 전제로 한다. 통계학에서 수학과 수식은 언어다. 따라서 그걸 빼놓고는 통계학을 이해할 수 없다.
통계학을 잘 모르는 사람은 흔히 이렇게 생각한다. 통계학은 컴퓨터와 인터넷이 보급됨에 따라 발전한 빅데이터 등의 방대한 데이터를 신속하게 처리하는 데 활용된다는 오해다.
물론 그런 면도 있지만 그것은 기술혁신에 따라 극히 최근에야 활성화된 이용 방식이다. 기존의 통계학과는 다소 결이 다르다고 할 수 있다. 일상에서 접하는 통계학의 대표주자라 하면 TV 시청률 조사가 있다.
통계학은 적은 비용과 노동력으로 거의 정확한 전체상을 파악할 수 있다. 그런데 거의 정확한 결과를 도출할 수 있는지는 샘플을 선택하는 방법에 달려 있다.
예를 들어 시청률 조사를 할 때, 그 집에서 사는 사람이 어느 방송을 보는지는 연령대나 가족 구성에 따라 다르기 마련이다. 그런데 샘플 대상을 20대 젊은이만 수집하거나 70대 이상인 고령자만 수집하면 편향된 결과가 나올 것이다. 즉, 샘플이 편향되면 정확한 결과를 낼 수 없다는 말이다. 그러므로 통계학자는 편향되지 않은 샘플을 추출하는 것을 무엇보다도 중시한다.
통계학은 한쪽으로 편향되지 않은 샘플링 조사를 전제로 한다. 물론 예를 들어 연구 분야에서도 편향성이 있는 조사를 하면 그 조사에 어떤 의도가 숨어있다고 의심받을 것이다. 데이터가 편향되어 있는지 판단하거나 어떻게 하면 편향되지 않도록 할지 연구하는 것도 통계학의 일종이다.
그런데 편향된 데이터야말로 의미가 있는 경우도 많다. 특히 비즈니스에서 통계학을 이용하는 경우에는 편향된 데이터를 수집하는 것이 중요하다.
시청률이나 출구조사에 통계학을 이용한다는 점을 이미 알고 있었던 사람도 있을 것이다. 그러나 그 사실을 아는 것과 통계학을 이해하는 것은 전혀 다른 이야기다.
통계학을 배우는 것은 즐겁다. 그러나 그 상태에서 끝이라면 너무 아깝다. 앞으로 통계학에 관한 지식을 이용해 사물을 바라보아야 한다.
여론조사나 정부 지지율, 자동차보험, 벚꽃 개화예보, 평균 수명, 야구선수의 타율, 경기동향지수 등 이 세상에는 통계학이 알려주는 것이 셀 수 없이 많다.
통계학을 배웠으니 끝이 아니라 앞으로도 일상생활에서 통계학을 활용해서 통계학과의 인연을 이어나가기를 바란다.