-
-
R로 하는 빅데이터 분석 : 데이터 전처리와 시각화 - 개념적 기초에서 심층 활용까지, 개정판
김권현 지음 / 숨은원리 / 2020년 1월
평점 :
구판절판

R은 대중적으로 사용되는 통계 프로그램이다. SAS, SPSS 등 다양한 프로그램들이 있지만 높은 정확도, 저렴한 가격, 스스로 만들 수 있는 수식, 가벼운 프로그램. 이처럼 많은 장점으로 통계를 공부하는 사람들에게 사랑받고 있다. 대학에서 통계를 배울 때, 처음 접했던 프로그램도 R이다. 그만큼 나에겐 친숙한 이미지이다. 하지만 데이터를 시각화하기엔 부족한 프로그램이라 여겼다. 화려하지도 않고 기능이 많지 않을 것이라 지레 짐작했기 때문이다. 거기다 학교에서 가르쳐 주는 코딩은 이해는 커녕 그저 외우는 것에 지나지 않아 더더욱 그렇게 생각했다. 하지만 이번에 'R로 하는 빅데이터 분석: 데이터 전처리와 시각화' 책을 접하고 내 편협한 생각은 깨지고 말았다.

여태까지 R은 수식을 좀 더 용이하게 해주는 프로그램에 지나지 않는다고 생각했다. 그래서 배운대로 수식을 입력하고 열심히 외워 출력값을 해석하는 것밖에 하지 못했다. 그런데 단순히 결과값을 출력하는 것뿐만이 아니라 필요한 값만 볼 수도 있고 더 가독성 높게, 다양한 방법으로 데이터를 볼 수 있었다. 수식을 단순히 외우는 것이 아닌, 예시를 들어주어 수식을 하나씩 더해감으로써 왜, 그리고 어떤 결과값이 나오는지 차근차근 이해할 수 있었다. 나는 코딩을 경험이라도 해봤으나 설사 경험이 전무한 사람이라도 이 책을 보면 잘 따라갈 수 있을 것이다. 무엇보다 간단한 통계 지식도 더불어 설명해주니 내가 무엇을 위해 R을 쓰고 있는지 자각할 수 있어 훨씬 도움이 되었다. 변수할당부터 시각화까지 R을 이용하는 모든 방법이 이 책에 있다고 해도 과언이 아니다. 통계 지식과 함께 R을 배우고 싶다면 추천하는 지침서이다.