-
-
빅데이터를 지배하는 통계의 힘 : 입문 편 - 통계학이 최강의 학문이다 ㅣ 빅데이터를 지배하는 통계의 힘 시리즈
니시우치 히로무 지음, 신현호 옮김 / 비전비엔피(비전코리아,애플북스) / 2013년 7월
평점 :
구판절판
‘빅데이터 시대에 통계의 중요성을 인식시키고 통계적 사고를 길러주는 미래 예측 전략서’
-책 내용을 많이 인용하였다. 처음 읽은 책이라 어려운 부분도 많았지만 서평을 쓰는데 참고하고 싶은 부분과 전하고 싶은 내용이 많았다.-
요즘 빅데이터가 화두가 되면서 빅데이터 관련 도서들도 많이 나오고 있고 인식을 하고 있다.
빅데이터란 일차적으로 데이터의 양이 방대해 종래의 방법으로는 수집, 저장, 검색, 분석하기 어려운 것을 말한다. 이차적으로는 그런 큰 데이터를 여러 기법을 이용해 유의미한 정보로 만들어내는 과정까지를 포함한다.
이 책의 저자는 니시우치 히로무 씨인데 저자의 말에 1984년 엘리 골드렛박사는 소설 형식을 빌려 기업의 공정혁신 과정을 해설한 <더 골>이란 작품을 미국에서 처음 출간하였다. 공정혁신 과정을 이루는 도서로 번역판을 포함해 천만 명 이상으로 읽었을 것으로 추산이 되며 아직까지도 수많은 사람이 찾는다고 한다.
하지만 골드렛 박사는 일본판은 허가를 하지 않고 한 일화가 있는데 그 이유가 의미심장한 말이었다. 일본인은 부분 최적화의 개선에 관해 세계 일류급이다. 그런 사람들에게 <더 골>에서 다루는 전체공정 최적화의 기법이 알려지면 무역 마찰이 재연되어 세계경제가 대혼란에 빠질 것이란 말을 하였다.
일본은 1980년대까지만 해도 제조업을 중심으로 견인된 일본의 경제성장은 그 기세가 등등하여 미국을 위협할 정도였으니 위와 같은 이유를 들어 그가 염려하는 것에 무리가 없어 보였다. 이런 점에 저자는 이 책 역시 한국어 출간을 고민하였다고 한다. 1993년 세계은행이 한국 경제를 일컬어 ‘동아시아의 기적’이라 표현했듯이 오늘날 한국의 경제와 산업은 비약적으로 성장하였다.
특히 삼성이 이루어낸 갤럭시의 성공은, 80년대에 소니가 워크맨으로 세계시장을 석권한 것과 같은 현상으로 봐도 무방하다 생각하였다. 이정도의 잠재력을 지닌 한국 분들이 요즈음 비즈니스 분야에서 가장 큰 화두인 통계학의 에센스가 전해지면 세계 경제에 충격을 주게 될지도 모릅니다. 그만큼 통계학의 영향력이 강력하며, 한국 국민과는 매우 궁합도 잘 맞는 학문이라고 생각한다 하였다.
골드렛 박사가 말한 부분 최적화의 개선이란 바로 도요타의 ‘가이젠 : 비용절감을 위해 내놓은 생산적 혁신운동’을 가리킨다. 이 운동은 제조업의 현장에서 노동자 개개인이 자신의 작업과 관련된 데이터를 집계한 다음 현장 전원이 서로 개선점을 이야기하며 생산성을 향상시키고 값싸고 고성능이면서 고장도 잘 나지 않는 일본 제품으로 세계 시장을 석권하게 되었다.
사실 이 가이젠 혁신운동을 할 수 있었던 이유는 제2차 세계대전 이후 일본을 방문한 미국의 통계학자 에드워드 데밍 박사에게서 기인하였다. 데밍 박사가 일본 기업의 기술자나 경영자들에게 기본적인 통계학 기법과 유용성을 전파했기 때문이다. 이러한 부분이 일본의 기술력이 바탕이 되었고 통계학을 수용하므로 통계학자 뿐만 아니라 대다수 일본인에게는 기본적인 통계 리터리시가 갖춰져 있기에 이것이야 말로 새로운 기법을 받아들이는데 큰 강점으로 작용했을 것으로 본다.
통계학 기법은 먼저 미국이나 영국에서 체계화 되어 왔고 발전하고 있다. 통계학은 100년 전부터 연구 되어오고 이러한 발상을 할 수 있었던 사람들을 통하여 나오게 되었고 우리는 생각을 못하지만 가장 이상적인 생각을 통해서 돈은 적게 들이되 효율적으로 손실을 줄이고자 하였다. 이상적인 나라를 만들기 위해 통계학 적인 관점으로 계속 보게 되었고 각 각의 의견들을 제시하였다.
1933년 세계공황당시 실업률이 29.4% 달할 때 프랭클린 루스벨트 대통령과 새로운 정부는 당시 갈 곳이 없는 우수한 사람들을 모았고 이들이 통계학을 중심한 주요 인문들이 되었다. 뉴딜 정책은 불황을 벗어나 실업률을 낮추는 것이 목적이었다. 대통령과 통계학자들이 서로 의논을 하면서 정확한 실업자 수를 파악하고자 하였으나 300만 명에서 1500만 명 대략 적인 수밖에 알 수 없었고 미국의 인구 1억 2000만 명에서 1억 3000만 명의 수란 실로 어마어마한 숫자인 빅데이터였다.
저자의 경력을 소개하면 도쿄대학교 의학부에서 생물통계학을 전공하였고 도쿄대학 대학원 의학연구과 의료커뮤니케이션학 분야 조교수. 대학원 의료정보네트워크 연구센터 부센터장, 다나 파버 하버드 암 연구센터(Dana-Farber Cancer Institute, DFCI) 객원연구원을 거쳐 현재는 데이터를 바탕으로 사회혁신을 일으키는 다양한 프로젝트에 참가하며 조사, 분석, 시스템개발 및 전략 입안을 컨설팅하고 있다.
대학교시절부터 생물통계학을 전공을 하였고 세상 속에서 빅데이터가 나오기 이전의 통계 관련된 역사적 사건이나 업무에 꼭 필요한 통계 비법과 다양한 활용법을 배워온 저자이었기에 통계학의 긴 역사에 대해 알 수가 있었고 통계학을 잘 모르더라도 서로의 데이터를 모아 의논을 하고 가장 이상적인 해결방안을 찾고 통계학을 전혀 모르던 점이 책을 읽는데 어려운 부분이 많았다.
어렵게 읽긴 하였지만 역사적으로 이러한 통계학이 오기 전 우리가 알만한 나이팅게일이나 오바마대통령 등 빅데이터를 대하는 통계학으로 보는 눈을 통해서 최선의 선택을 할 수가 있었다. 통계학자들이 없었다면 억 단위의 돈을 투자하여 정확한 답만 고집하였다면 시간이 비상식 적으로 오래 걸리고 불가능하다.
하지만 통계학을 이용한다면 약간의 오차가 있을 수는 있지만 거의 근접한 답을 찾을 수가 있고 돈 또한 절약을 할 수가 있다. 통계학이 시간이 지나면서 서로의 반대의견 또한 많았지만 통계학으로 보는 빅데이터에 대한 태도는 확률적으로도 더 효율적이며 거의 근접한 답을 찾아 낼 수 있었다.
다양한 예시와 저자가 배우고 전공해온 학문을 통해서 정말 많은 것을 느낄 수 있었으며 경제가 대혼란에 빠지지 않을 수 있도록 통계가로서의 책임을 가지고 통계가가 아니더라도 함께 의견을 서로 논하면서 경제 대혼란은 벌어지지 않도록 해야겠고 통계학을 이해하고 우리가 하는 여러 가지 분야의 일이 있겠지만 적용을 하였으면 한다. 한번으로 다 이해하기엔 통계학을 배웠던 사람을 제외하고는 여러 번 읽기를 권한다.