빅데이터를 지배하는 통계의 힘 : 실무활용 편 - 쉽고, 빠르고, 정확한 통계 활용법 빅데이터를 지배하는 통계의 힘 시리즈
니시우치 히로무 지음, 신현호 옮김, 홍종선 감수 / 비전비엔피(비전코리아,애플북스) / 2015년 8월
평점 :
구판절판


 

통계는 수학이 실생활에 활용되는 대표적은 예입니다. 더욱이 수학을 공부하고 있어서, 최근 통계프로그램 SAS와 R프로그램에 대해서도 배우고 있는데 이 도서의 제목 <통계의 힘:실무활용편>을 보자마자 반가웠습니다. 빅 데이터를 활용하기 위해서 통계프로그램을 통해 우리가 필요한 정보를 걸러내는데 어떤 기준으로, 방식으로 걸러내느냐에 따라 다양한 결과를 산출하고 곳곳에 활용할 수 있는 데이터를 만들어냅니다. 이 책 <통계의 힘:실무활용편>을 통해 어떤식으로 빅 데이터를 유용하게 다루는지 알아보고 싶어 이렇게 읽어보았습니다.

 

 

 

학창 시절부터 줄기차게 보아왔던 통계 중에서도 정규분포표와 회귀분석을 발견하니 통계에 있어서 얼마나 정규분포와 회귀분석이 중요하게 쓰이고 있는지 느낄 수 있었습니다. 이 정규분포는 가우스의 중심극한정리를 그대로 따라가는 분포로 중심값 부위에서 많은 데이터들이 몰려있음을 알 수 있습니다. 그 만큼 평균을 이뤄내는 중심값은 많은 데이터들이 차지할 수 밖에 없음을 알 수 있습니다. 그리고 회귀분석은 독립변인이 종속변인에 영향을 미치는지 알아보고자 할 때 실시하는 분석방법으로 양적인 데이터를 질적으로 분석하는 하나의 대표적인 방법임에 통계가 실생활에 얼마나 쓰이고 영향을 미치고 있는지 잘 알 수 있었습니다.

 

 

 

"데이터를 통한 아웃컴의 관련성을 분석할 수 있도록 하는데 목적을 두고 있다."


단순히 데이터를 모아서 분석하여 표를만들어 내는 일에만 국한 되는 것이 아니라 통계라는 것이 분석하여 실생활과 연관짓어주는 역할까지 한다는 것을 알게하고자 이 책의 저자는 계속해서 강조하고 있다는 것을 알게 됩니다. 너무나 많은 데이터를 분류하고 걸러내고 쓰고싶은 정보만을 걸러내는 역할을 하는 것는 통계라는 것에 앞으로 빅데이터시대에 통계라는 학문이 얼마나 많이 필요하게 될지 다시한번 느껴볼 수 있는 시간이었습니다.


원래 통계란 어떤 현상을 종합적으로 한눈에 알아보기 쉽게 일정한 체계에 따라 숫자로 나타내는 것을 말하고 통계 해석이란 조사를 통해 밝혀낸 수치가 어느 정도의 신뢰성과 유의미성을 갖는지, 인과관계의 방향은 어떠한지, 어떤 사실 관계를 알 수 있는지 등을 밝혀내는 것이라 생각해왔는데 이 도서는 여실히 그 통계의 특징을 잘 살려 그려내고 있습니다. 이러한 이유에서 빅데이터 시대를 맞이하여 많은 빅데이터들을 이해하려면 먼저 100년 이상 다양한 기법을 축적해온 통계의 본질을 알아야 하며, 그런 의미에서도 “통계학은 최강의 학문이다”라는것을 일깨워 주고 있습니다.

 


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo