-
-
빅데이터 활용서 - R을 이용한 중.고급 데이터 분석의 바이블 (예제파일제공) ㅣ 빅데이터 활용서 시리즈 1
김동현.김경태.안정국 지음 / 시대에듀 / 2015년 2월
평점 :
구판절판
기업경영에서 빅데이터의 중요성이 부각되면서 빅데이터란 무엇이고 어떻게 활용될 수 있는가에 대한 기사들이 꾸준히 보도되다보니 빅데이터에 대한 관심을 지속적으로 가지고 있었고 책도 몇 권 읽었었다. 하지만, 구체적으로 빅데이터를 어떻게 분석할 수 있는가하는 방법에 대해서는 공부해보지 못했었다. 통계프로그램과 데이터마이닝 툴, 엑셀은 사용을 해봤지만, 빅데이터를 분석하기에는 적합하지 않은 것 같고 한계가 있어보여 좀더 방대한 빅데이터를 분석하는 전용 툴은 어떤 것이 있고 어떻게 사용할 수 있는가에 대해 궁금했었다. <R을 이용한 중,고급 데이터 분석의 바이블, 빅데이터 활용서1>은 이러한 궁금증을 해소시켜주었다.
빅데이터 분석툴인 R이 어떤 명령문을 사용하여 어떤 분석을 할 수 있는지 배울 수 있어 좋았지만, 이 책의 핵심 타겟이 빅데이터 분석툴을 접해본 빅데이터 중급 사용자를 대상으로 하다보니 R 프로그램을 어떻게 설치하여야 하는지에 대한 기초적인 부분은 생략되어 있어 아쉬웠다. MS 윈도우의 경우 새로운 버전이 출시될 때마다 출간되는 책들을 보면 어떻게 설치해야 하는지에 대한 부분이 소개되어 있는 것처럼 빅데이터 분석툴을 어떻게 설치해서 사용할 수 있는가에 대한 소개란이 한 두장이라도 할애하여 소개하였으면 좋았을 것 같다. 내 경우에도 R은 처음이어서 인터넷에서 R에 대한 정보를 검색하고, 프로그램을 설치(
http://cran.r-project.org/index.html)해서 단순 명령어 입력을 통해 몇 가지 단순 통계분석을 해 본 후 책을 읽으니 도움이 되었다.
빅데이터 분석 중에서 소셜 또는 비정형 데이터 분석은 어떻게 이루어지는지 궁금했었는데, 이 책을 통해 Twitter 데이터를 활용해서 어떻게 기업평판을 분석할 수 있는지, 텍스트 데이터를 이용해서 거짓식별을 어떻게 할 수 있는가를 배울 수 있어서 좋았다. 꼼꼼한 예제문과 함께 관련된 자료 화면들이 소개되어 있다보니 R과 빅데이터 분석을 이해하는데 큰 도움이 되었다.
물론 이 책을 한권 읽었다고 해서 당장 빅데이터 분석 전문가가 될 수 있는 것은 아니다. 계량마케팅 수업을 들었을 때와 데이터 마이닝 교육을 받았을 때도 느꼈지만, 분석툴을 다룰 줄 아는 것과 수많은 데이터 속에서 의미있는 데이터를 발견한다는 것은 다르다. 결국 다양한 데이터를 어떻게 연결시켜 분석해 볼 수 있는지에 대해 끊임없이 시도하고 그 결과를 어떻게 해석할 것인가에 대한 고민을 지속적으로 해야 하며, 분석상의 제약이나, 오류 그리고 한계는 없는지에 대한 검토도 필요하며, 다양한 빅데이터 분석 사례들을 끊임없이 배우고 참고해야 할 것이다.