-
-
세상에서 가장 쉬운 베이즈통계학 입문 ㅣ 세상에서 가장 쉬운 시리즈 (지상사)
고지마 히로유키 지음, 장은정 옮김 / 지상사 / 2017년 3월
평점 :
베이즈통계학 입문
비즈니스에 사용할 수 있는 베이즈 통계이다. 『베이즈통계학 입문』은 인터넷의 보급과 맞물려 비즈니스에 활용되고 있는 것을 이야기한다. 인터넷에서 고객의 구매 행동이나 검색 행동 이력이 자동으로 수집되는데, 그로부터 고객의 ‘타입’을 추정하려면 전통적인 통계학보다 베이즈 통계를 활용하는 편이 압도적으로 뛰어나기 때문이다. 베이즈 통계학은 토머스 베이즈의 이름을 따서 만든 통계학이다. 옷가게에 고객이 왔을 때 구매할 고객, 아이 쇼핑만 할 고객을 통계를 낸다면 그 중 20%(0.2)가 구매할 고객이고 아이쇼핑만 할 사람이 80%(0.8)일 때, 직사각형을 그려 구매할 사람을 20%, 아이쇼핑만 할 사람을 80%로 표지하여 직사각형을 그렸을 때 베이즈 확률을 다루는 데는 면적이 중요한 역할을 한다는 것을 알 수 있다.
철학에선 이러한 관점을 ‘가능세계’라 부른다. 가능세계의 관점은 논리적 추론이나 확률적 추론을 하는 경우 생각을 정리하기 쉽게 도와준다. 이때 0.2와 0.8이란 숫자는 왜 굳이 썼을까? 어떤 한 가지 사건에 복수의 가능성이 있는데, 그것을 확률의 수치로 평가하는 경우 ‘확률은 전부 더해서 1이 되도록 설정한다’는 수학의 약속에 근거한 것이다.
목차를 죽 훑어보았다. 정보를 얻으면 확률이 바뀐다. 베이즈 추정은 때로 직감에 크게 변한다. 주관적인 숫자여도 추정이 가능하다. 베이즈 추정은 적은 양의 정보로 그럴듯한 추정을 이끌어낸다. 정보를 얻을수록 더 정확해진다. 확률은 면적과 동일한 성질을 지닌다. 정보를 얻은 후 확률의 표시법, 더 범용적인 추정을 위한 확률분포도, 두 가지 숫자로 성격이 정해지는 제타분호, 확률분포의 성격을 결정짓는 기대치, 확룔분포도를 사용한 고도의 추정, 동전 던지기나 천체 관측에서 관찰되는 정규분포, ... 죽죽 읽어내려가는 동안 도형을 그려 면적을 표시하여 확률을 계산한다는 방식이 통계학에 문외한이 내겐 신기해 보였다.
마이크로소프트사 빌게이츠는 일찍부터 베이즈 통계로 업계 경쟁사들 우위를 차지했단다. 인터넷 검색을 베이즈 통계로 분석하고, 스팸 일은 베이즈 추정으로 만든 것이다. 이 책은 비즈니스에서 베이즈 통계를 어떻게 사용하고 있는지 수많은 사례들을 담고 있다. 구글로 영어를 공부하는 방법을 소개하는 책자를 보고 있는데, 검색엔진으로 검색어 수가 가장 많은 단어, 문장들이 검색한 순위에 따라 올라와 사람들이 어떤 단어, 어떤 문장을 많이 쓰고 있는지 볼 수 있어 공부하는데 많은 도움을 받았다. 이때도 역시 베이즈 통계가 사용되었다는 것을 이 책을 통해서 비로소 이해하게 됐다.
한마디로 인터넷이 널리 보급되면서 베이즈 통계는 온라인 비즈니스에 많이 활용을 하게 되었다는 이야기이다. 고객의 구매 행동이나 검색 행동 이력이 자동으로 수집하는 프로그램을 통해 고객 타입을 추정하려면 전통적인 통계학보다 베이즈 통계를 활용하는 것이 압도적으로 뛰어나기 때문이다. 팩스밀리에 이미지의 노이즈를 수정하여 원 이미지에 가깝게 전송하는 것도 베이즈 통계를 응용한 것이다.
인터넷 시대에는 전통 통계학보다 베이즈 통계학이 더 중요하다는 말이 이해가 간다. 특히 온라인상 비즈니스를 무시할 수 없다. 성공하려면 베이즈 통계학을 사업에 활용하라고 저자는 말한다. 사실 일반인에게는 통계학하면 어려운 것이 사실이다. 수학치인 내겐 통계학하면 왠지 모르게 목이 옴츠려든다. 그런데 이 책에선 그림으로 직각사각형을 그려서 차근차근 설명하고 있어 저자 의도대로 따라가다보니 수학에 수자도 어려운 내가 내용을 쉽게 이해해가며 읽고 있었다. 죽 문장을 따라가면서 저절로 어렵지 않게 이해가 되는, 편안한 마음으로 즐겁게 읽어나갔다. 다만 원래 수학을 어려워했던 선입견을 깨뜨리기 위해 어거지라도 읽어가다보니, 어느새 익숙해져서 처음 책을 펼쳤을 때는 덜컥 겁이 나던 가슴이 통계학에 대한 두려움을 천천히 극복해가고 있었다. 한장 한장 읽어가다보니 문득 ‘베이즈 통계는 이런 거구나’라 고개를 끄덕이는 내 모습이 발견하곤 했다.
비지니스 세상을 살아가는 현대인들에게 필요한 필독서라고 말하면 나만의 과장된 주장일까?