R로 하는 빅데이터 분석 : 데이터 전처리와 시각화 - 개념적 기초에서 심층 활용까지, 개정판
김권현 지음 / 숨은원리 / 2020년 1월
평점 :
구판절판


 

4차 산업혁명시대를 다른 말로 '데이터 경제 시대'라고들 이야기합니다. 즉, 모바일 폰과 센서를 통해 개인과 기업의 실시간 데이터를 분석하여 의미있는 패턴을 찾아내고, 이러한 분석된 패턴을 통해 현재와 미래의 소비 방식과 일하는 방식을 예측하여 기업 마케팅에 적용하거나 생산성, 효율성 극대화를 도모해 나갈 수 있습니다.

빅데이터 분석과 활용이 기업의 미래 생존전략에 필수 불가결해짐에 따라 빅데이터를 분석하는 기술에 대한 관심이 뜨거워지고 있습니다. 물론 데이터 분석을 통해 취업 진로를 모색하는 분들 또한 많아지고 있습니다.

빅데이터를 다루기 위한 가장 대표적인 오픈소스 언어이며, 도구로서 'R'과 파이썬(Python)을 많이들 언급합니다. 두 언어 모두 범용성이 뛰어나기 때문에 어떤 형태의 데이터든 자유롭게 분석이 가능한 장점이 있습니다. 물론 통계분석과 데이터 탐색 그리고 시각화에 탁월한 'R'이 데이터 분석 엔진의 표준으로 업계에 자리잡아 가고 있는 모양새입니다.

데이터 분석 기술 분야를 선도하는 구글, 페이스북, MS, 우버 등이 'R'을 사용하는 대표적인 기업이지요.


오늘 소개해 드리는 <R로 하는 빅데이터 분석>은 최근 지대한 관심을 끌고 있는 오픈소스 통계 분석 프로그램인 'R'을 체계적이고 효율적으로 학습할 수 있게 구성된 책입니다.

저자가 서문에서 밝히고 있다시피 사실 'R'의 복잡한 구문을 그 원리를 파고들어 독자를 쉽게 이해시키는 책은 그리 많지 않습니다. 특히 초심자들의 경우, 기존의 쿡북(Cookbook)의 소스코드를 있는 그대로 학습하는 경우가 많지만, 실제 현장에서 적용하기 위해서는 'R'의 복잡한 구문의 작동 원리를 파악하여 상황에 맞게끔 소스크드를 수정하거나 변경할 수 있어야 합니다. 당연히 쿡북 형식의 접근에는 한계가 있다는 이야기입니다.

아시다시피 'R'을 포함한 소프트웨어 패키지의 문법을 통째로 암기하기란 불가능합니다. 경우에 따라 조금씩 달라지는 문법을 제대로 이해하지 못하면 당연히 외워야 하겠지만 이 또한 분량이 너무 많습니다.

당연히 핵심적인 원리를 이해하지 못하고 임시변통으로 프로그램을 작성하게 되면 논리적 오류가 생기게 마련이며, 이런 오류(Bug)를 찾기 위해 부호 하나, 함수 하나 일일이 확인해야 하는 생고생(?)이 기다리고 있습니다.

사실 본서는 초심자들 보다는 어느 정도 'R' 프로그램을 접한 분들에게 큰 도움이 될 것 같습니다. 어느 책에나 있는 'R' 패키지 설치를 위한 자세한 설명과 Step by step 식의 그림은 거의 생략되어 있으며, 바로 'R'의 변수, 자료형 그리고 연산/함수로 이어지기 때문입니다.

통계분석, 머신러닝 모델링, 소셜 네트워크 분석, 텍스트 마이닝, 지도 시각화, 주식 분석, 이미지 및 사운드 분석 및 웹 애플리케이션 개발에 두루 활용할 수 있는 만능 데이터 분석 엔진인 'R'의 개념적 기초에서 부터 심층적 활용까지 특히 '데이터의 전처리와 시각화'에 골몰하시는 데이터 통계 분석 프로그래머 분들께 추천할 만한 도서로 평가합니다.


댓글(0) 먼댓글(0) 좋아요(3)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo