Head First Data Analysis 헤드 퍼스트 데이터 분석 - 하둡을 이용한 SQL 기반 빅데이터 분석 도구 Head First 시리즈
마이클 밀튼 지음, 김경태 옮김 / 한빛미디어 / 2013년 4월
평점 :
장바구니담기


당신은 컨설턴트 또는 마케터다.

세계적으로 가장 유명한 커피 체인점 '스타버즈'가 유감스럽게도 최근 몇 년간 전국적으로 매출액이 떨어지고 있다.

CEO로 부터 이 현상에 대한 분석을 의뢰 받았다. 어떻게 할 것인가?


위의 가정은 전혀 이상할 것도 드문 경우도 아닌 실제일 법한 이야기다.


최근 Big Data라는 키워드가 화두된 지 이미 몇 년이 되었다. 이제 본격적으로 우리 생활에서 스마트폰처럼 친숙한 어휘가 될 것이다. 그리고 그 엄청난 데이터를 토대로 수 많은 변수를 분석하여 영화 Minority Report처럼 미래를 예측하는 시스템을 만들어 내려는 참이다.


실제로 Google 사는 검색어에 '독감' 검색어가 증가함에 따라 미국 보건 당국보다 미국 내 유행성 독감 예측을 2주나 빨리 한 적이 있다. 이런 사례는 독감 뿐 아니라 범죄나 마케팅 영역에서 고객수요 예측 등에도 활발히 사용하려는 시도가 많다.


다시 스타버즈의 이야기로 돌아와 보자.

분석을 하려면 지난 매출과 관련된 기록들을 의뢰한 회사로 부터 넘겨 받을 것이다. 물론 인터뷰를 통해서도  얻고 말이다.

이 넘겨 받은 자료를 'Data'라고 할 수 있다.


이제부터 우리는 의미있는 'Information'으로 가공해야 한다. 수백 수천 테라바이트의 Data가 있어도 아무 것도 뽑아낼 수 없다면 그것은 꿰지 않은 서말의 구슬 아니겠는가?


'Data Analysis'에서는 검증을 위한 '비교법', '교락인자(교란변수 또는 혼란 변수)', 확률, 예측 등을 우리에게 친숙한 MS Excel이나 R이라는 비교적 낯선 통계툴을 이용해 분석 하는 방법을 가르쳐 준다.


이론적이고 추상적인 이야기가 아닌 실제 사례같은 현실적인 이야기를 예시로 들어가며 과정을 지나가기 때문에 생경하거나 뜬구름 같지 않다.


마치 내가 컨설팅 회사의 인턴으로 들어와 선배들의 업무를 지켜보며 선배들이 가르쳐주는(그것도 매우 친절 봉사스러운 선배) 느낌이랄까.



하지만 여전히 눈을 동서남북 돌려야 하는 Head First 만의 자유분방한 레이아웃은 정신 없긴 하다.



그래도 이만큼 쉽게 쓴 Data 분석 책이 어디 있겠는가.


댓글(0) 먼댓글(0) 좋아요(2)
좋아요
북마크하기찜하기 thankstoThanksTo