빅데이터 시대, 올바른 인사이트를 위한 통계 101×데이터 분석 - 데이터는 다뤄도 통계까지 배울 시간은 없었던 당신에게
아베 마사토 지음, 안동현 옮김 / 프리렉 / 2022년 10월
평점 :
장바구니담기


확률, 통계는 학교 교과과정에서 맨 마지막 부분에 있어서 시험볼때 바짝 공부하고늘 그때뿐이었다. 그런데 사회에 나오니 막상 다른 부분보다 통계를 업무로 할 일이 많았다. 그때마다 기억을 되짚어 애를 쓰며 업무를 해 오며 나빠진 기억력만 탓하다가 이 책을 접하게 되었다.

올바른 데이터 분석, 분석내용의 해석이 중요해진 빅데이터 시대이다. 총 13장으로 구성된 이 책은 통계학의 의미부터 모집단, 표본, 확률의 기본적 의미부터 다양한 가설검정 방법과 해석, 기계학습의 모형까지 어떠한 통계법에 대해서도 이해할 수 있도록 전반을 다루고 있다. 각 장은 주제별로 기본적인 정의, 분석이 뜻하는 의미, 해석의 방법 등 단계적으로 설명을 하고있어 마치 통계교과서를 읽거나 강의를 듣는듯한 느낌이 든다. 한 학기는 턱없이 모자랄 분량이 책으로 구성되어있지만 학교다닐때 수업에서 들었던 내용이 눈앞에 판서가 되어 보이는 것 같은 기분도 들었다. 각 장의 서술은 말하듯 설명하는 어조로 되어있고 색과 수식, 그래프, 그림 등을 적절하게 사용해서 가시적으로 매우 이해하기 쉽게 구성되어있다. 통계에 대해 어려움을 느끼는 사람이더라도 찬찬히 읽으며 따라가다 보면 이해의 깊이를 넓힐 수 있을 것 같다. 그만큼 책을 낼 때 편집에 심혈을 기울였을 것이다.

개인적으로 좋았던 부분은 최근 업무를 통해 다시 적용해야만 했던 다양한 가설검정 부분이었다(6장). 수집 data에 대해 어떠한 분석을 해야할지, 해당 분석의 지표가 의미하는 바는 무엇인지 분석을 돌려놓고도 난해했는데 적절하게 설명해주어서 판단에 도움이 되었다. 이 책을 읽으며 spss 학습서를 같이 보았는데 spss학습서에서는 충분치 못했던 메뉴나 분석방법, 해석에 대한 설명이 자세하게 되어있어서 도움이 되었다. 가령,

(p.127) p값이 0.05를 상회하는 경우 귀무가설을 기각할수 없으며 "통계적으로 유의미한 차이는 발견하지 못했다"라는 결과가 됩니다. 이것은 귀무가설이 옳다는 것이 아니라 틀렸다고는 말할 수 없다는 뜻이란 점에 주의하세요. 다시말해 어느명제가 옳은가 판단은 보류하는 것이 됩니다.

p값을 가지고 기각이나 채택이냐 늘 기계적으로 판단했는데 판단을 보류하는 것이 오히려 올바른 해석이라는 점에서 아. 그렇지 하고 깨닫게 되었다.

수 많은 통계 분석, 지표, 값들의 의미에 대해 알기쉽게 풀어 제시해 주고있어 공부하는 학생 뿐 만 아니라 통계를 업무로 종종 접하는 사람이라면 사전처럼 두고 찾아보기 좋은 책 같다. 적절한 도표와 그래프, 사례등으로 이해를 돕고있어 통계 입문자에게도 시간을 들인다면 크게 어렵지 않은 책이다. 차후에 spss나 Amos처럼 통게툴과 접목해서 발간된다면 더할나위 없이 좋을 것같다는 생각도 해 보았다.

#서평 #통계 #통계입문 #데이터분석 #경영경제 #사회과학


댓글(0) 먼댓글(0) 좋아요(2)
좋아요
북마크하기찜하기 thankstoThanksTo