세상에서 가장 쉬운 통계학입문 세상에서 가장 쉬운 시리즈 (지상사)
고지마 히로유키 지음, 박주영 옮김 / 지상사 / 2009년 12월
평점 :
장바구니담기



책의 내용 가운데 어느 하나라도 빼놓으면 통계학이 아니다라고 할 수 있을 만큼 아슬아슬하게 필요한 부분만을 간추려 쉽게 이해하며 읽을 수 있도록 구성된 '아주 쉬운 입문서'다. (p13)​  ……  이 책의 최종 목표는 '검정'이나 '구간추정'이라는 통계학의 가장 중요한 목표 지점에 가장 짧은 시간에 도달하는 것 (p6)


적어도! (검정이나 구간추정이 과연 통계학의 가장 중요한 목표 지점인가에 대한 의문은 있을 수 있겠으나)1 저자가 의도하는 '아주 쉬운 입문서'라는 점은 누구도 부정할 수 없는 책이라고 확신합니다. 


………………………………………………………………………………… 


'아슬아슬하게 필요한 부분만을 간추'렸다는 소개글처럼, 이 책은 '평균 - 표본분산 - 정규분포'에 대한 설명인 1부를 거쳐 --- "모집단이 정규분포라는 것만 알고 모분산은 모르는 경우, 소표본에서 모평균을 추정한다"(p221)라는 (저자의 표현에 따르자면) "통계학 초급의 수료지점"(p226)에 도달하는 2부로 구성되어 있습니다. 이같은 내용을 설명함에 있어, 


우리들은 단순히 통계학을 사용하려는 사람들이기 때문에 … (p197)


저자는 철저하게 '통계학을 배우는 학생'이 아닌, '통계학을 사용하여 무엇을 얻어내려는 독자'들을 대상으로 하고 있습니다. 그러한 연유로, 이 책에는 (일정 부분의 수식을 사용할 수 밖에 없는) 확률에 대한 내용이 전혀 없습니다. 즉, --- 기술통계(descriptive statistics)와 추리통계(inferential statistics)를 구분하지 않고 있다라는 것이죠.2 그럼에도 불구하고!


'구슬이 서말이라도 꿰어야 보배'란 옛 속담처럼, 서말이나 되는 단편적 지식을 그저 알고만 있는 것 보다는, 얼마 되지 않는 지식이라도 서로 꿰어 익히고 있는 것이 훨씬 낫다라는 기준에서 보자면, 이 책의 효용은 사뭇 대단하다,라고까지 표현되어도 괜찮지 않을까 싶습니다. 


·

·

·

통계학의 방법론은 지금까지의 과학 법칙 (예를 들어서, '지구상의 물체는 그냥 떨어뜨리면 바닥을 향해서 떨어진다'는 법칙과 같은 것)과는 조금 다른 형식을 취한다. 바로 '처음부터 100% 맞추지는 못한다'는 것을 전제하는 것이다. 95% 예언 적중구간의 개념은 5%는 틀린다는 '완벽하지 않다'는 점을 허용하는 것으로, 상당히 좁은 구간의 예언3을 가능하게 하는 것이라고 이해해야 한다. (p104)

 

우리나라의 대통령을 뽑기 위해, 전 국민이 자신의 선택을 '투표'라는 형식으로 표출합니다. 그리고 그 결과에 따라 향후 5년 간 우리나라를 이끌어 갈 한 명의 인물이 정해지게 되지요. 다시 말해 '투표'라는 행위는 결국엔 한 가지의 결과만을 보여주게 되는, 일종의 결정론적 게임입니다. 그렇다면 대체 왜 --- 우리들은 여론 조사라는 행위를 통해 그 결정론적 게임의 결과를 조금이라도 미리 알고자 하는 것일까요? 


"우리가 카지노에서 갬블링을 한 적이 없고 베팅 업체를 방문한 적이 없다 해도, 베팅은 우리 삶에 널리 퍼져 있다. 좋은 운이든 나쁜 운이든 운은 우리 사회생활과 인간관계 속에서 나타난다. 우리는 숨어 있는 정보에 어떻게든 대처해야만 하고 불확실한 가운데서도 타협을 해야 한다."


- 애덤 쿠하르스키,「수학자는 행운을 믿지 않는다」p311, 북라이프, 2016.


우리가 원하는 것이 '대처'이건 혹은 '타협'이건, 조금이라도 더 빨리, 또는 더 정확하게 미지(unknown)의 무언가에 대해 알고 싶어 합니다. 그러나 --- "대부분의 불확실한 현상은 그 뒷면에 있는 모집단을 모두 관측할 수 있는 경우가 거의 없"(p113)기에, "모집단 중에서 나오는 몇 가지의 데이터를 가지고 모집단 전체에 대한 어떠한 추측을 하"(p135)게 되는 것이죠. 이것이 바로 '통계적 추정'입니다.4 이 때 '추정'의 현실 유용성은 '얼마만큼의 정확성'으로 '어느 정도의 구체적인 (즉, 좁은) 범위'를 제시해주느냐로 평가되겠지요.5  


………………………………………………………………………………… 



"무엇보다 사람의 감정은 어째서, 뜨거운 물에 닿은 소금처럼 녹아 사라질 수 없는 걸까. … 그러다 문득 소금이란 다만 녹을 뿐 사라지지는 않는다란 걸 깨닫는다." 

- 구병모,「위저드 베이커리」p185, 창비, 2009.


감정만이 아니라, 지식 또한 '다만 녹을 뿐 사라지지는 않는다'는 걸 이 책을 통해 깨달을 수 있었습니다. 학부에서 통계학, 수리통계학, 선형대수, 계량 경제학 그리고 대학원과 박사과정에서도 또 계량 경제학을 배웠던 과거의 노력이 결고 헛된 것은 아니더군요. 지난 30여 년간, '구간추정'이란 작업을 해본 적은 없었었음에도, 이 책을 읽다보니 이게 도대체 뭔 소리를 하고자 함인가는 미리 알게 되더란 말이죠. 그럼에도 불구하고!


한 데이터 세트 중에 있는 어떤 하나의 데이터가 가진 특수성은 평균에서 떨어진 정도(편차)를 나타내는 수치만으로는 계측할 수 없고, 표준편차를 기준으로 가정해야만 알 수 있다. … 그래서 '편차를 표준편차로 계산해서 얼마만큼'이라고 나타내는 변환이 중요해지는 것이다. 즉, 이것은 (데이터-평균값)/표준편차)라는 계산을 기준으로 데이터를 평가하는 것이다. (p62)


당연히, 그 수식은 금새 기억이 났습니다만, 정작 "(x-μ)/σ" 라는 통계량이 정확히 무엇을 의미하고 있는지, 왜 이러한 변환이 필요한지까지를 제가 이해했던 기억은 끝내 찾아지질 않더군요. "이전의 통계학 책은 수식이 상식을 압도했다. 수식을 풀고 증명하는 과정에서 무언가 배운 것 같은데 막상 현실에 적용하려면 앞이 캄캄했다"6란 말이 저에게도 예외는 아니었다라는 것이죠. 


"P.Halmos는 '오솔길을 산책하며 연필도 공책도 없이 어려운 수학개념을 연인에게 쉽게 풀어서 설명해 줄 수 있는 사람'이 수학을 진정으로 잘하는 사람이라고 말한다"


- 류근관,「통계학」vii, 법문사, 2018.


통계 작업을 해야 할, 그러나 통계에 대한 사전 지식이 거의 없는 직원에게 소개해 준, 근데 그저 소개만 해주기엔 뭔가 무책임할 수도 있다라는 생각에, 저 또한 통계에 대한 교과서적 지식이 참 많이도 녹아 없어져버렸다 생각했기에 읽었던 책이었습니다. 비록 제가 이 책을 두 번 정독했다 하여, 그 직원에게 '오솔길을 산책하며 연필도 공책도 없이' 이 책의 내용을 설명해줄 수 있을 거라곤 결코 생각지 않습니다만, 외려


통계학 책 수준으로 확실히 가르치는 것은 가능했지만, 가르치는 사람이 그 정도의 수준밖에 모르면 배우는 사람은 그 수준을 이해할 수 없다. 나는 학생들이 잘 이해하지 못하는 것은 학생들이 공부를 게을리 했다고 보기보다는 가르치는 사람이 제대로 이해하지 못하고 가르쳤기 때문이라고 생각했다. (p230) 


이것이 단지 통계학의 학습에만 그치는 것이 아닌, 업무의 지시에 있어서도, 더 나아가 --- 내 아이의 장래에 대한 (조언을 빙자한) 가르침을 주는 것에 있어서도 예의 적용되어야 할 매우 중요한 기준이란 배움을 얻었다라는 것이, 앞으로의 제 직장과 가정 생활에서 커다란 도움이 되지 않을까 싶습니다. 어쨌든,


통계학을 처음 배우고 있는 분들에게, 교과서를 보완해주는 부교재로 이 책을 강추! 드립니다. 



※ 읽어본, '통계' 관련 도서들 : 통계의 거짓말」·「신은 주사위 놀이를 하지 않는다」·「수학자는 행운을 믿지 않는다 




  1. 경제학을 전공했던 제 관점에서는 아무래도 --- 통계는 결국 여러 변수들 간의 인과관계 여부와 그 정도를 파악해내기 위한 일종의 도구(tool)로서의 의의가 가장 크다고 생각합니다.
  2. "이 책에서는 '데이터 세트에서 테이터 x는 모든 데이터 중에서 p퍼센트를 차지한다'라고 하는 것과 '데이터 세트 중에서 하나의 데이터를 관측할 때, 이것이 x일 확률은 p퍼센트다'라는 것을 동일시 하여 설명한다. 이것은 추리통계 학자가 열심히 연구해 쌓아올린 이론의 경계를 무시하는 셈이 되어 마음 아프지만, 통계학을 알고 싶어 하는 많은 사람들이 혼란을 겪지 않도록 하기 위한 어쩔 수 없는 방법이라고 생각하며, 일반 독자들이 이것에 대해 심한 위화감을 느끼지는 않을 것이라고 생각한다." (pp18~19) --- 실제, 거의 모든 통계학 교과서가 확률론으로 시작되고 있는 것을 생각해 본다면, 이 점이 커다란 결점일 수도 있겠으나, '통계학을 사용하려는 사람들'의 입장에서 보자면 이러한 내용들의 배경에 어떠한 원리가 작동되고 있는지까지 반드시 알아야 하는 것은 아니지 않겠느냐란 주장 또한 충분히 설득력을 지니고 있어 보입니다.
  3. 대략적으로 말해, 이것을 '검정' 혹은 '구간추정'이라 이해해도 됩니다.
  4. 국민투표와 같은 전수 조사는 일반적이지 않은, 극히 예외적인 상황입니다.
  5. 대통령 선거에서의 사전 여론조사를 예로 들자면, 가장 적은 수의 표본만으로 가장 정확한 예측을 해내는 것.
  6. 류근관,「통계학」vii, 법문사, 2018.



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo