-
-
R로 하는 빅데이터 분석 : 데이터 전처리와 시각화 - 개념적 기초에서 심층 활용까지, 제3판
김권현 지음 / 숨은원리 / 2022년 1월
평점 :
제대로 된 데이터 과학 책을 접한 느낌이다. 전체적으로 대학 교재와 같은 분위기여서 좀 딱딱해 보이긴 하지만 내용이 알차다. 21세기 디지털 원유인 데이터를 처리하는 과정과 유용한 정보를 시각화하는데 있어서 파이썬과 R이 최선으로 보인다. 시중에 나와 있는 다른 R 서적과 차이점은 중요한 내용에 관해 자세하고 확실하게 설명해 주고 있다. 3판이라 최신 버전의 R을 반영하였다.
다양한 업무 영역에서 디지털 전환을 하고 있다. 현장에서 생산되는 데이터도 많아지고 다양해져간다. 이제는 데이터 분석이나 처리가 전산팀이나 IT 부서의 고유 업무가 아니라 컴퓨터를 사용하는 영역에서 점점 필수의 업무가 되고 있다. 빅데이터는 그대로 두면 거대한 데이터 쓰레기가 될 수 있다. 데이터를 분석하고 목적에 맞게 처리해야 의미 있는 정보를 찾아내어 업무에 활용할 수 있다.
R 언어를 통해 데이터와 관련된 특화된 내용과 전처리 과정을 설명해 준다. 통계나 시각화를 하기 전에 데이터를 전처리 하는 과정에서 마주하는 다양한 문제를 접하게 된다. 머신러닝이나 딥러닝에 사용하는 학습 데이터도 전처리가 중요하다. ggplot2 패키지를 활용하여 다양한 그래프로 데이터에 담겨있는 의미 있는 정보를 시각화할 수 있다. 다양한 예제가 담겨 있고 깃허브에서 코드를 다운로드할 수 있다. 기조적인 개념에서부터 깊이 있는 활용까지 설명하고 있어 R 언어를 사용하여 데이터 처리를 하고자 하는 사람에게 유용한 입문서이다.
출판사에서 도서 협찬을 받았습니다. 하지만 개인의 주관적인 견해로 작성하였습니다.