-
-
R로 하는 빅데이터 분석 : 데이터 전처리와 시각화 - 개념적 기초에서 심층 활용까지
김권현 지음 / 숨은원리 / 2019년 3월
평점 :
구판절판
IT계열이지만 빅데이터 분야와는 다른 쪽으로 일을 하고 있습니다. 그러나 향후 신기술 중 가장 관심있는 분야가 빅데이터 분야라서 개인적으로 공부해보겠다는 결심을 했습니다. 이것저것 검색을 통해 빅데이터 분석을 위해 최근 가장 각광받고 있는 것이 R이라는 것을 알게 되었습니다. 그리고 R에 대해 공부할 수 있는 책을 찾아보다 이 책을 발견했죠. 저자는 '전체적인 맥락을 알고 큰 그림을 그릴 수 있다면 훨씬 수월하다'는 말처럼 R에 대해 좀 더 쉽게 이해할 수 있도록 책을 썼습니다.
1장에서는 R의 간단한 특성을 소개하고 2장에서는 R의 패키지 설치방법을 소개하고 있습니다. 그리고 3장부터는 다른 프로그래밍 언어처럼 R의 변수와 자료형,연산/함수 등을 다룹니다. 변수할당과 관리, 데이터 타입에 따른 연산과 함수 등 문법적으로 조금 다른 부분이 있긴 하지만 프로그래밍을 접해보신 분들이라면 큰 무리없이 이해하고 따라할 수 있습니다. 4장에서는 벡터, 행렬, 배열, 데이터 프레임, 리스트 등 R의 데이터 구조를 설명합니다.
또 R로 데이터 읽어오기, 분석에 접합한 상태로 데이터를 가공하기, 인코딩, 정규표현식, 흐름제어와 함수 방대한 내용을 일일이 다 설명하기란 어려울만큼 방대한 내용들을 소개하고 있습니다. 저도 이제 막 R을 공부하려는 입장이기에 책의 모든 내용을 다 이해하지는 못했습니다. 그러나 명렁어를 입력하고 출력되는 결과를 바로 아래에 표시해두는 형식으로 구성되어 있어 차분히 잘 따라간다면 이론을 이해하고 실습을 하는데 큰 무리가 없을 것입니다.
그리고 이 책은 프로그래밍에 대한 기초지식을 어느 정도 갖춘 상태에서 읽는 것을 추천드립니다. 기초지식이 전혀 없이도 책을 읽는 것이 가능은 하겠지만 그러기엔 R과 이 책을 이해하는데 많은 시간이 소요될 것 같아요. 또 개인적으로 조금 아쉬운 부분은 책의 디자인 적인 부분입니다. 후반부에 그래프 등을 표현하기 위해 일부 컬러 페이지가 들어간 부분을 제외하곤 대부분 흑백 컬러로 되어 있습니다. 책의 디자인이나 스타일보다 내용 자체가 훨씬 중요하고 내용 자체는 충실하게 잘 쓰여 있습니다. 그러나 디자인 면에서 조금 더 보완했으면 하는 아쉬움이 남네요. 잘 읽었습니다.