빅데이터를 지배하는 통계의 힘 : 입문 편 - 통계학이 최강의 학문이다 빅데이터를 지배하는 통계의 힘 시리즈
니시우치 히로무 지음, 신현호 옮김 / 비전비엔피(비전코리아,애플북스) / 2013년 7월
평점 :
구판절판


 오늘날 우리는 사는 동안 수많은 '통계'를 마주치게 된다.

 예를 들면, 대선 전후로 여론 조사와 출구 조사에서 "오차 범위는 ± χ..."운운하는 말을 들을 수 있고, 야구에서는 타자에 한해서만 봐도 타율, 출루율, 도루율 등 온갖 통계 데이터를 만날 수 있다. 뿐만 아니라, 마케팅, 사회 조사, 신문 기사나 뉴스 등에서 많은 통계를 만날 수 있다.

 

 갈수록 통계학의 지식이 널리, 또 깊이 활용되고 있다. 통계학적 리터러시(읽고 쓰는 능력)는 이제 거의 모든 것의 기본 또는 기초가 되어가고 있다. 자연 과학 또는 인문·사회 과학의 여느 분야에서도 통계학을 빼놓고서는 학문성을 내세울 수 없을 정도다. 두말할 나위 없이, 기업의 비용 절감 및 매출 증대를 위한 대책의 수립에 있어서는 통계의 활용은 필수적이다. 또, 다양한 사회 문제 해결을 위한 논의를 할 때 일어나기 쉬운 수많은 소모적인 갈등을 줄이는 동시에, 근본적으로 문제를 해결하는 데 있어서도 통계는 가장 큰 도움을 준다.

 최근, 많은 이들의 입에 오르내리고 있는 '빅데이터'의 활용은 바로 IT에 통계를 접목시킨 것이랄 수 있다.

 

 

 책은 빅데이터와 통계의 관련성을 널리 알리거나 통계를 활용한 빅데이터를 소개한다기보다, -도서명 《빅데이터를 지배하는 통계의 힘》에서 읽을 수 있는 그대로- 통계의 효용과 중요성을 강조하면서 통계학에 대한 교양수준의 개괄적인 소개(역사, 한계, 이론 등)에 주안점을 두

고 그 설명을 이어가고 있다. 오차와 인과관계, A/B테스트(임의화 비교실험), ρ값, 임의화 비교실험, 신뢰구간, 회귀모델 등 통계학의 기초 지식이나 기법을 사례와 연구 결과를 바탕으로 설명한 뒤, 다음과 같은 통계학의 주요 분야에 대해 간단히 설명한다.

 

 

 " ① 실태를 파악하는 사회조사법, ② 원인을 규명하는 역학·생물통계학, ③ 추상적인 것을 측정하는 심리통계학, ④ 기계적 분류를 위한 데이터마이닝, ⑤ 자연언어 처리를 위한 텍스트 마이닝 ⑥ 연역에 관심을 두는 계량경제학 "

 

 그리고 기타, 확률을 둘러싼 베이즈파와 빈도론파의 대립을 살펴보고, 에비던스(과학적 근거)와 그것을 찾는 방법을 소개한다.

 

 2008년경, 최제호씨의 《통계의 미학》을 읽었기에 흥미를 가지고 읽을 수 있었다. 좀 더 심화적인 내용을 읽을 수 있었지만, 역시나 교양서답게 개론서 수준의 체계는 없었다. 조금 더 전문적인 내용은 맛보기 수준이었던 듯 하다. 그러나, 개론서 수준에서는 보기 힘든 내용도 담겨 있어, 단순한 교양도서라고 보기에는 무리가 있다고 본다.

 

 책을 읽고 통계학을 더 잘 알았다기보다는, 통계학의 중요성을 체감하고 더 공부해야겠다는 마음이 들었다고 하는 게 옳을 것 같다. 확실히, 위 최제호씨의 말씀대로, "통계는 세상을 읽는 유익한 학문이자 사람들과 정보를 공유하고 의사소통할 수 있는 명쾌한 과학"임을 다시 한번 느낄 수 있었다. 더불어 통계학의 기초지식 뿐만 아니라 그의 적절한 활용 능력이 중요하다는 것도 깨달을 수 있었다.

 

 여기에 덧붙여 세부 내용을 읽어나가며 생각하고 느낀 점 가운데 인상적인 것 하나만 -곁가지로 뻗어나가는 말이지만- 기술해본다면, 다음과 같다.

 '현대 통계학의 아버지 로널드 A. 피셔의 세계 최초 임의화 비교실험은 바로 '우유를 먼저 넣었는지 밀크티를 먼저 넣었는지' 실험해보는 것이었다고 한다. 이를 생각해볼 때, 장난이나 내기, 퀴즈, 일상에서 그냥 별 것 아닌 것처럼 치부하며 넘어가는 일에서 좋은 이론적 도구가 만들어질 수 있음을 다시 한번 확인할 수 있었다. 사실 학문 연구에서 새로운 아이디어에 대한 힌트는 우리 곁에서도 다양한 모습으로 만나 볼 수 있다고 본다. 다만 우리가 그걸 캐치할 수 있는 능력이나 머리가 부족할 뿐. 서양의 학문은 이런 경우가 참 많은 듯 하다. 존 내쉬의 게임이론이 창안, 수학이론이나 공식이 만들어지기까지 등의 이야기 등을 들어보면 그런 경우는 과장해서 말한다면 셀 수 없을 정도라 보인다. 그에 비해 그러한 서구의 학문을 수입하여 배우고 연구하는 국내 학문계에는, 그 전반에 엄숙주의와 격식을 갖추려 하는 분위기가 그 저변에 널리 퍼진 듯해 씁쓸한 웃음이 흘러나오기도 했다.

 일회독을 마치며, 이 책의 마지막 장을 덮는 순간 그런 생각이 들었다.

 지식, 경험, 정보, 관계망 따위의 데이터가 폭발하듯 증가하고 해일이 밀려오듯이 밀어닥치는 시대, 통계학은 어느새 우리 삶 속에 깊이 파고 들어와 가장 유용한, 때론 필수적인 도구가 되어있다. 그런만큼 통계학의 추후 학문적 발전 가능성(다른 학문과의 융합을 포함하여)도 무궁무진하지 않을까.

 빅데이터에 대한 이야기가 여기저기서 터져나오지만, 그에 대해 가볍게만 생각하고 넘어가기 쉽다. 넘어가기 전에 왜 그런 말이 곳곳에서 흘러나오는지 알 필요가 있다. 그리고 그 근저에는 그 빅데이터의 활용을 지배하고 있는 숨은 주역, 통계학에 있다는 것도 알아차릴 수 있어야 한다. 그런 면에서 적합한 타이밍에 흥미롭고 알차게 저술된, 통계학에 관한 이 책이 개인적으로 무척 유익했음을 말하지 않을 수 없겠다.

 

 

 

이 서평은 네이버 북리뷰 카페 '북소리'의 서평이벤트를 통해 제공받은 책으로 작성할 수 있었음을 알려드립니다.

 

 

 

 


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo