빅데이터 활용서 - R을 이용한 중.고급 데이터 분석의 바이블 (예제파일제공) 빅데이터 활용서 시리즈 1
김동현.김경태.안정국 지음 / 시대에듀 / 2015년 2월
평점 :
구판절판


매일 수없이 만들어지는 자료들은 기술의 발달로 저장과 분석이 가능해 졌으며, 이러한 엄청난 양의 데이터들은 다양한 패턴으로 미래 예측에 활용됨으로써 기업, 국가, 그리고 영리나 비영리기관들의 이익과 업무에 큰 개척방향으로 자리매김되고 있다.

이 책 빅데이터 활용서는 빅데이터 분석에 대한 이론 및 실습 그리고 트위터를 활용한 기업평판 분석과 환율이나 질병에 대한 예측 등 실제 사용될 수 있는 실용적인 분야에 실제분석을 보여줌으로써 실용서로서 귀중한 도움을 주고 있다.

 

나와 같은 초보자들이 사용하기 가장 좋은 텍스트 마이닝의 평판분석은 컴퓨터 용어가 난무하는 빅데이터 분석에서 기초적인 내용들을 학습하기에 가장 좋다고 한다. 그러기에 트위터의 데이터를 통한 기업평판 분석방법은 흥미로웠다. 하지만 모두가 진실을 이야기 하지 않듯이 수많은 데이터에도 거짓정보들이 곳곳에 묻혀있다. 빅데이터가 좀 더 가치 있는 자료로 사용되기 위해서는 이러한 거짓을 걸려내는 장치가 필요하다. 그러기에 이러한 모델을 설계하는 작업은 중요하지만 문장의 전후 사정 컨텍스트를 모두 분석하기에는 무리가 있으므로 단순히 문장의 패턴만으로 파악하며 의미 없이 인용되거나 신문기사의 거짓정보라고 추정되는 내용들은 제외된다고 한다.

이밖에도 구글맵에서 가져온 미국 도시의 주차된 자동차 사진을 활용해서 자동차를 식별하는 과정이나, 100만명에 대한 건강검진 및 의료기록을 담은 코호트 DB를 활용하여 질병예측, 또한 국가 간의 경쟁력을 비교하는 주요 지표인 원/달러 환율을 예측하는 논문 소개 및 그 변동의 메커니즘을 제시하는 자료들은 매우 실용적인 자료로 빅데이터 전문가를 꿈꾸는 사람들에게 유용한 자료로 보인다.

특히, 신문, 뉴스, 방송 등의 미디어에서 생성되는 데이터를 분석하는 소셜분석을 통한 주가변동의 예측은 꼭 한번 매워보고 싶은 유용한 자료였다.

 

빅데이터 활용서는 기본적으로 컴퓨터 프로그램과 컴퓨터언어의 기본 정보를 가지고 있으면서 경영 빅테이터 분석사를 준비하는 학생들이 봐야할 정도의 전문적이고 실용적인 책으로 실전분석에 바로 적용할 수 있는 많은 유용한 자료들을 담고 있다.

앞으로 정부와 기업의 정책과 마켓팅에 필수 아이템으로 자리잡을 빅데이터의 세계에서 이 책 활용도는 더욱 커지리라 생각된다.

 


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo