만화로 배우는 통계학 만화 비즈니스 클래스 3
토모 그림, 신은주 옮김, 고바야시 가쓰히코.홍종선 감수 / 비전비엔피(비전코리아,애플북스) / 2019년 8월
평점 :
구판절판


 

 

나는 타고난 수포자로 어린시절부터 수학이라면 치를 떨었고 학창시절에도 역시나 수학과는 친해지지 못했다. 그러다 보니 수학 중에서도 출제 비중이 높지 않은 확률과 통계 문제는 거의 버리는 챕터로 생각했었고 학교를 졸업한 이후에는 통계와 관련된 지식이 없어도 사는데는 아무런 문제가 없었다. 그래서 취직한 이후에도 회사 생활에 이런 지식이 필요 하겠어라고 생각했었었는데 이게 웬걸 은근히 통계와 관련된 상식들이 필요한 경우가 있었다. 물론 자신의 업무가 어느 분야인지에 따라 이런 지식이 필요할 수도 있고 필요하지 않을 수도 있겠지만 나의 경우는 아주 슬프게도 관련이 있는 쪽이었다. ㅠㅠ

제품을 생산하는 제조 회사에서는 제품의 품질관리가 필수적인데, 품질과 관련된 지표들은 거의 통계로 결과가 산출되기 때문에 관련 용어에 대한 지식이 없을 경우에는 결과물을 봐도 이게 무슨 소린지 전혀 이해하지 못했다. 그런데 이번에 <만화로 배우는 통계학>이라는 책이 출간된 것을 보고 만화니까 쉽게 술술 읽히지 않을까라는 다소 안일한(?) 생각으로 서평단을 신청해 읽기 시작했다.

그런데 막상 읽다보니 제목에서부터 벌써 힌트가 있었던 것이 <만화로 "쉽게" 배우는 통계학> 이 아니라 <만화로 배우는 통계학> 이라는 것이다. 아... 만화긴 만화인데 우리가 생각하는 만화처럼 책장이 술술 넘어가는 건 아니었다. 통계 자체가 일상생활에서 잘 사용하지 않는 생소한 용어가 대부분이고 숫자와 관련된 학문이다보니 아무리 만화로 설명한다고 해도 한 번 슥~ 봐서는 쉽게 이해되지 않았다.

그리고 만화로 배우긴 하지만 내용 전부가 다 만화인 것은 아니고 용어나 개념 설명은 만화로, 계산 방법은 아래와 같이 구체적인 예를 들어 기재되어 있었다. 아무래도 통계라는 것이 숫자로 이야기하는 학문이기 때문에 100% 모두 만화로 설명할 수는 없었을 것이다. 하지만 계산방법을 설명해야할 때 외에는 최대한 만화로 쉽게 풀어내 독자들의 거부감을 줄이려 노력한 흔적이 보였다.

 

 

챕터는 총 3개로 구성되어 있는데 첫 번재 챕터에서는 통계학 입문 과정으로 평균값과 최빈값 그리고 표준편차와 정규분포 등 통계의 가장 기본이 되는 용어와 개념에 대해 설명한다. 단어만 들어서는 무슨 뜻인지 감이 오지 않는데 아무래도 일상적인 단어가 아니다보니 한 번 읽어서는 잘 기억에 남지 않는다. 하지만 이런 기본적인 용어와 기호의 의미에 대해 정확하게 기억하고 이해하지 않으면 다음 과정에서 헤매게 되기 때문에 책에서는 챕터가 끝날 때마다 요약정리를 하고 다음 챕터 시작 전에 또 다시 상기시키며 독자들이 반복학습하여 빠르게 기억할 수 있도록 도와준다.

개인적으로는 업무와 관련해 표준편차나 산술평균, 기하평균, 정규분포와 같은 단어들을 듣게 되는데 두루뭉술하게 이해하고 있던 개념을 이번에 확실히 이해할 수 있었다. 구체적으로 "표준편차"란 '평균값을 기준으로 데이터가 흩어진 정도'를 나타내는 지표로 '분산의 제곱근을 구한 값'이 바로 표준편차가 된다. 이 표준편차의 개념을 알기 위해서는 먼저 아래 용어들을 이해해야 한다.

*분산: 편차를 제곱해 모두 더한 값을 데이터로 나눈 값 / 편차를 제곱한 값(편차제곱)의 평균값

* 편차: 데이터 값에서 평균값을 뺀 값 / 각 데이터가 평균값에서 어느 정도 떨어져 있는지를 나타냄

* 평균값: 데이터 값을 모두 더해 데이터 개수로 나눈 값

위와 같이 이렇게 글로 봤을 때는 이게 무슨 뜻인지 한 번에 와닿지 않지만 책에서는 구체적인 수치를 예로 들어 계산하는 과정을 차근차근 설명해주기 때문에 천천히 읽어보면 이해하기 어렵지는 않다. 혹시 한 번에 이해가 되지 않더라도 책에서 설명하는 예를 보고 직접 계산해보면 누구나 이해할 수 있다.

그리고 실무에서는 주로 통계를 이용해 그래프를 그리는 작업들을 많이 하게 되는데 아래와 같이 어떤 그래프를 사용해야 내용을 더 효과적으로 설명할 수 있는지, 그리고 엑셀에서 구체적으로 어떤 함수를 사용해서 쉽게 통계를 낼 수 있는지 등 통계를 업무에 활용할 수 있는 방법들을 제시한다는 점이 좋았다.

 

 

 

 

 

이제 2장부터 본격적으로 통계에 발을 들인 단계인데 1장이 사칙연산 수준이었다면 2장에서는 무려 시그마가 등장한다. 학창시절에도 포기했었던 시그마를 여기서 다시 보게 될 줄이야 -_-; . 기호만 봐도 어지럼증이 날 것 같지만 책에서는 기호를 아주 잘게 쪼개서 하나하나 설명해주기 때문에 페이지를 한 장, 두 장 넘기다 보면 어느새 더듬더듬이나마 기호를 읽고 있는 자신을 발견하게 된다. 물론 하룻 밤만 자면 금방 새카맣게 잊어버릴 것 같기는 하지만 말이다ㅎㅎ .

 

 

 

구체적으로 2장에서는 원인과 결과를 분석하는 다변량분석에 대해 설명하는데 이 과정에서는 우리가 리서치나 보고서에서 볼 법만 데이터들의 상관관계에 대해 설명한다. 예를 들어 날씨와 우산판매량의 상관관계라던가 키와 몸무게의 상관관계같은 것들이다.

이 챕터에서는 정확히 상관이 있다는 것이 어떤 의미인지, 그리고 상관관계가 있는 것처럼 보이지만 실제로는 상관관계가 없는 허위상관에 대해서도 설명한다.

마지막으로 3장에서는 자신의 가설이 맞는지 확인할 수 있는 추론통계학에 대한 것인데 수집한 데이터에서 특징을 뽑아내고 수치를 통해 확률로서 자신의 가설이 맞는지 확인해볼 수 있다. 추론통계학이라는 단어에서도 알 수 있듯이 일부 데이터로 전체적인 특징이나 경향을 추론해야할 때 사용하는 기법으로 우리가 흔히 알고 있는 시청률, 청취율 조사라던가 인구주택 총조사도 여기에 해당한다.

추론통계학에는 표본 값에서 전체가 어느 구간에 있는지 보는 '추정'과 표본을 통해 가설의 합당성을 판정하는 '검정'이 있는데 이 과정에서 두 가지 안 중에 어떤 안이 더 나은지 객관적으로 판단하기 위해 확률 기법을 사용한 '가설검정'이란 것을 한다. 어떤 안에 대해 의문을 제기할 때 단순히 그건 틀렸다고 반박할 것이 아니라 합당한 근거 제시가 필요한데 이 때, 가설을 세우고 그 가설이 절대 일어날 수 없다던가 혹은 10번 중에 한 번은 일어날 수 있다던가 하는 식으로 확률계산을 통해 그 수치를 근거를 제시한다.

모든 가설검정은 항상 두 가지를 가설을 세우고 시작하는데 이 때 가설을 기각하던가 채택하던가 선택을 하게된다. 하지만 책에서는 이것만으로는 사실 자체를 알 수는 없고 판단을 잘못할 수도 있다는 점을 항상 명심해야 한다고 조언 하기도 한다.

책의 마지막 에필로그에서 저자도 "통계학 책은 입문서라고 해도 어렵다" 고 하는데 나 뿐만 아니라 다른 독자들도 저자와 마찬가지로 생각할 것 같다. 하지만 차근차근 따라가다 보면 더디긴하지만 이해하지 못할 정도는 아니며 수포자인 나조차도 계산할 수 있었으니 아마 대부분의 독자들이 조바심만 가지지 않는다면 얼마든지 이해할 수 있을 거라고 생각한다.

저자도 말했듯이 통계학은 입문서라고 해도 어려운게 당연한 것이니 잘 이해되지 않아도 여러번 읽다보면 자기도 모르는새 회사에서 사용하는 통계 용어 정도는 너끈히 이해할 수 있을 것이다.

 

* 출판사로부터 책을 제공받아 작성한 리뷰입니다.

 


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo