빅데이터를 지배하는 통계의 힘 : 실무활용 편 - 쉽고, 빠르고, 정확한 통계 활용법 빅데이터를 지배하는 통계의 힘 시리즈
니시우치 히로무 지음, 신현호 옮김, 홍종선 감수 / 비전비엔피(비전코리아,애플북스) / 2015년 8월
평점 :
구판절판


 

음... 
이 책을 한 마디로 뭐라 설명하기는 참 어렵고, '실무활용편'이라는 것처럼 실제로 통계를 이용해 데이터를 분석하는 방법에 관해서 설명하고 있다... 그치, 뭔가 굉장히 단순하게 이야기한 것 같은데, 왠지 많이 빠뜨리고 있는 것 같은 이 느낌적인 느낌! 뭐 한 줄로 축약하자면 양적(Quantity) 아웃컴은 다중회귀분석을, 질적(Quality) 아웃컴은 로지스틱 회귀분석을 이용한다... 라고 할 수 있겠지만, 그칰ㅋㅋㅋ 더 미궁으로 빠지는 듯한 느낌이 들것이얔ㅋㅋㅋ (만일 당신도 나와 같은 생각을 하고 있다면! ㅋ)

왜 이런 미궁으로 빠져드는 느낌이 드는가, 해서 학부생 시절의 확률통계 성적을 또 찾아봤지 뭐야. 나... 그래도 수학 쪽은 점수 잘 받았다고 생각했는뎈ㅋㅋㅋ C+였습니다. (털썩) 엄, 혹시 궁금해하실 분은 없겠지만, 굳이 이야기하자면 이 책의 뒤에서 20%, 80페이지 정도 되는 분량은 <수학적 보충>이라는 제목으로 극한, 정규분포 등 이 책의 수학적 베이스에 대한 설명을 상세하게 풀어나가고 있습니다. 후, 나도 자꾸 어려웠는지 책 이야기하려다가 옆으로 자꾸 새는 기분인데 다시 원점으로 돌아가 보자. (학부 때 통계학 전공한 칭구들이 급 부러워지고 있는 1人)

여튼, SNS가 활기를 치기 시작한 그 시점으로부터 우리는 이미 빅데이터의 시기에 접어들었고, 넘치는 데이터를 관리하는 방법을 찾고 있다... 는 것이 시대적 배경이라면, 이 시대적인 요구에 부응하기 위해 발달하고 있는 것이 Google Analytics 같은 로그 분석 툴이라고 할 수 있겠지요. 하지만, GA(Google Analytics)에서 우리가 얻어낼 수 있는 정보는 그저 수치적인 정보입니다. 여기에서 유의미한 데이터를 뽑아내기 위해서는 이 수치들을 '가공'하고 '편집'하여 원하는 결과를 이끌어내야 하는 것이지요. 그렇기 위해서 데이터의 정확도를 높이고, 이 근거에 신뢰도를 부여하기 위해 통계가 필요한 것입니다.

여담입니다만, Data Journalism 수업을 수강하다 보면 Steve Doi의 통계 수업도 20% 비중으로 등장하는데, 이게 의외로 유익하고 유용하다는 말이지요. 그래서 이 책이 좋았던 점을 이야기하자면, (빙빙~ 둘러오긴 하였습니다만!) 우리가 이론적으로만 알고 있던 통계를 좀 더 실무에서 사용할 수 있도록 그 연결고리에 대한 이해를 높여준다는 점이었습니다. 왜 그냥 평균보다는 표준편차를 이용해야 정확도가 올라가는지, 그런 것들에 대한 비교적 친절하고, (어려운) 이야기가 이 책에 있다고나 할까요.

댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo