빅데이터를 지배하는 통계의 힘 : 실무활용 편 - 쉽고, 빠르고, 정확한 통계 활용법 빅데이터를 지배하는 통계의 힘 시리즈
니시우치 히로무 지음, 신현호 옮김, 홍종선 감수 / 비전비엔피(비전코리아,애플북스) / 2015년 8월
평점 :
구판절판


통계의 중요성은 학문을 막론하고 굉장히 중요해지고 있다. 어느 정도냐면 내가 다니는 직장에서는 수의 개념이 필요 없고, 글쓰기로 일을 하는 곳이었는데 당장 이번 하반기부터 통계를 통한 수요도 및 만족도 조사를 시행한다고 하니 막막한 노릇이었다. 왜냐하면 나는 통계 분야를 전공하지 않아서 통계 관련 업무를 할 때마다 다른 사람의 손을 빌리거나 책을 뒤져 가장 쉬운 방법으로도 오래 걸려 일을 해결하는 편이기 때문이다. 그래서 이 책을 보자마자 읽고 싶다고 간절히 생각했다. 이 책의 표지에는 '일본 경제경영 베스트셀러 1위'라는 슬로건과 함께 통계의 기초 지식부터 고급 기술까지 모든 것을 다룬다고 소개하기 때문이다. 결론부터 말하면 통계를 활용해 실무에 적용하기 위해 2장이 크게 도움되었다.


이 책에서 설명하는 통계학은 11페이지에 언급되었듯이 인간을 통찰하고 그 행동이나 자세를 조금이나마 변화시키는 데 목적이 있다. 통계학은 크게 세 가지로 나뉘는데, 인과관계를 통찰, 현상 파악, 미래 예측이 그 내용이다. 통계학은 우리 생활과 밀접한 관련이 있어 예를 들어 축구 경기를 시작하기 전에 동전으로 공과 골대를 정하는 것도 확률의 싸움에 해당한다. 바로 이런 확률 싸움을 체계적이고 명확하게 해석 및 분석하는 것이 '통계'인 것이다. 이 책은 총 5장으로 구성되어 있으며 24챕터로 서술되어 있다. 1장은 평균과 비율에 대한 내용이고, 2장은 표준오차와 가설검정, 3장은 다중회귀분석과 로지스틱 회귀분석, 4장 인자분석과 군집분석의 개념들, 5장은 통계 분석방법을 총정리하고 도표 실용판을 응용하는 내용이 담겨 있다. 개인적으로는 2장이 인상 깊었다. 새롭게 알게 된 것이 너무 많았기 때문이다. 우연한 불규칙성 때문에 생겼다고는 생각하기 어려운 차이를 가리켜 유의한 차이, 유의차라고 부른다던지, '어떤 차이가 존재하고 있다는 가설이 올바를 때 정확히 유의차라고 말할 수 있는 확률'을 검정력이라 하는 것은 통계를 접하며 새롭게 알게 된 사실이다. 더욱 놀라운 것은 오차범위와 유의미한 통찰을 위한 표본크기 설계 파트이다. 여기에서는 오차 즉, 불규칙성을 미리 셈하여 범위를 줄여나가는 설계를 할 수 있게 가이드를 하고 있다. 그때 중요한 것이 가설검정인데, 102쪽에 나와 있는 가설의 진위를 논하는 방식은 쉽게 받아들일 수 있는 예를 싣고 있어 이해하기 수월하다. 


이 책을 읽고 나서 든 생각은 그야말로 안도감이었다. 이 책을 몰랐더라면 나는 쓸모없는 통계 시스템을 잡고 멍청이 짓을 하고 있었을 것이다. 물론 이 책을 통해 말끔하게 정복한 것은 아니지만 조금 덜 멍청한 통계초보가 되었다. 최근 직장에서 맡은 일이 어떤 실험을 통해 2,000건 이상에 대한 데이터를 정리하는 작업이었는데 만약 이 책을 접하지 못했더라면 나야말로 오차 범위에 놓인 공황 상태에 빠졌을 것이다. 끝으로 아직은 다중회귀분석이나, 군집분석에 대한 수학적 이론에 대한 이해는 미흡한 편이지만 이 책을 가까이하면 큰 도움을 받을 수 있을 것 같다. 왜냐하면 어린이 때 단어 공부를 하기 위해 국어사전을 뒤졌듯 이 책을 사전 삼아 공부해도 될 만큼 구성이 좋기 때문이다. 개념어 설명도 훌륭하고, 생소한 부분도 적절하게 설명해 놓았기 때문에 통계를 한 번은 응용해야 하는 실무자라면 이 책을 소장해도 좋다. 


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo