-
-
문과 출신도 쉽게 배우는 통계학
타카하시 신.고 가즈키 지음, 오시연 옮김 / 지상사 / 2022년 2월
평점 :
<문과 출신도 쉽게 배우는 통계학>은 요즘 중요하게 여겨지는 통계학을 인문학 전공자들도 되도록 쉽게 접근할 수 있도록 도와주는 책입니다. 통계학은 본래 데이터를 다루기 때문에 숫자를 처리하고 집계하면서 분석하는 숫자의 학문입니다. 따라서 수학적인 용어가 나올 수 밖에 없고 입문수준에서 넘어가면 계산과 공식이 필요하게 됩니다. 이 때부터 문과출신들이 포기하는 경우가 많은데, 이 책과 같이 쉽고 재미있게 쓰여진 책으로 통계학을 공부하면 더 용이할 듯 합니다.
통계학이 100여 년간 어떻게 발전해왔으며 빅데이터와 어떤 연관성이 있는지 데이터 기반의 경영에 대해서도 책의 초반에서 설명합니다. 또한, 가장 대표적으로 사용되는 통계학의 분석기법인 중회귀 분석, 로지스틱 회귀 분석, 주성분 분석에 대해서 간략하게 설명한 후 뒤에서 자세하게 보충하게 됩니다. 실제로 회귀분석은 데이터마이닝에서 상당히 많이 쓰이고, 주성분 분석은 안면인식 등의 기술에 활용되기도 하는 필수적인 통계 분석기법입니다.
책에서는 만화와 삽화, 그림, 차트, 도식을 이용해서 최대한 수학적인 내용을 쉽고 용이하게 알려주고 있습니다. 쉽게 설명하지만 다루는 항목들은 통계학의 주요 항목들을 빠짐 없이 포괄하고 있습니다. 데이터를 추출하는 주요 방법인 "단순 무작위 추출법", "층별 추출법", "2단 추출법", "층별 2단 추출법"의 차이점을 이해할 수 있습니다. 그 다음에는 수학 과목에서 어려웠던 분산과 표준편차를 다시 살펴보고 통계학의 중심으로 조금씩 다가갑니다.
데이터를 다루는 방법은 크게 범주형와 수량 데이터가 있는데, 앞에서 공부했던 평균/ 분산/ 제곱합/ 표준편차를 수량데이터에서 살펴봅니다. 그리고 범주형 데이터를 위해 비율을 배우고 난 후 데이터 가시화의 주요 기법들을 공부합니다. 통계를 이용한 품질관리에서도 활용되는 도수분포표, 히스토그램 등을 여기서 살펴보고 이해해봅니다. 책의 후반부에는 "실전"을 위해 중회귀 분석을 하나씩 따라가면서 살펴보고 어떻게 사용되어 데이터가 의미있는 값으로 전환되는지 확인해볼 수 있습니다.
출판사로부터 책을 제공받고 솔직하게 쓴 글