처음 시작하는 R 데이터 분석 - 쉽고 재밌게, 실무 예제로 끝낸다! (7일 완성 로드맵)
강전희.엄동란 지음 / 한빛미디어 / 2018년 10월
평점 :
절판


또 한권의 R 학습서를 읽었다.


벌써 3권째의 R 학습서를 실습하면서 공부한 결과... 

이제는... 자주 사용하는 패키지와 함수, 문법 등은 이제 눈에 익은 듯 하다.

역시 공부는 반복학습이 최고인가 보다.



이번에 "처음 시작하는 R 데이터 분석"을 선택한 이유는...


1. R에 대해 여전히 관심을 가지고 있었고...

2. 그 동안 2권의 학습서를 익혔음에도 불구하고, R 프로그래밍에 대한 지식의 부족을 느끼고 있기 때문이며,

3. 한빛 미디어에서 발간한 신간이 궁금했기 때문이다.




그럼 이 책에 대해 이야기 하자면...


이 책은 R을 활용한 데이터 분석 방법에 대한 책이다.


특히, 목차와는 별도로 7일간의 학습 스케줄을 제시하여, R을 공부하고자 하는 (나와 비슷한) 독자들에게 목표의식을 심어주고 있다.

실제 내가 학습 스케줄을 따라해 본 결과, 하루의 학습분량을 따라가기에 큰 어려움은 없었다.

R 프로그래밍 단기 완성... 정도라고 할 수 있겠다.




그리고, 초보자를 위해 이해하기 어려운 개념은 간단한 그림(다이어그램)을 통해 알기 쉽게 설명해 주고 있다.

기초적인 부분이지만, 잘 이해하기 힘든 데이터 구조에 관한 설명도 아래와 같이 그림을 활용해 알기 쉽게 설명해 주고 있다.




R 스튜디오의 여러 가지 기능도 충실히 설명하고 있다.

나는 R 스튜디오의 메뉴에서 원시 데이터를 불러오는 기능이 있단걸, 이 책을 통해서 처음 알게 되었다.

생각보다 많은 기능이 있음에도 몰라서 활용하지 못함이 부끄러워지는 순간이었다.


각 챕터의 마지막 부분에선 본문의 내용을 엑기스 형태로 정리를 하고 있으며, 연습문제를 통해 점검할 수 있도록 구성되어 있다.

즉, 본문 학습 + 엑기스 정리 + 연습문제 = 3회 반복 학습.. 으로 구성되어 있다.


데이터 분석 실전 프로젝트를 통해...

"공공 데이터 수집 -> 정제 -> 시각화 -> 분석"까지의 데이터 분석 사례를 실습해볼 수 있도록 구성되어 있다.

소위 고기를 잡는 방법(프로세스)을 직접 해볼 수 있게 유도하고 있다.


인터렉티브 그래프나 워드 클라우드... 다른 책들도 다루고 있는 부분이긴 하다.

그런데 사용하는 패키지나 방법이 달라서 실습해 보는데 재미있었다.

(앞으로도 시각화 패키지는 계속 개발될테니, 자신이 잘 활용할 수 있는 패키지를 선택하면 될 듯 하다)


하나 더, 이 책의 저자는 유튜브에서 강의를 제공한다. (유튜브 채널 : JANY)





몇 가지 아쉬운 부분은...


이 책에선 R이 가진 가장 중요한 장점인 "통계 분석 기법"에 대해서는 상대적으로 빈약하다.

부록으로 "카이제곱 검정, t 검정, 상관분석" 정도만 간단히 소개하고 있다.


초보자의 입문용 학습서라는 기획의도에 맞도록 맛보기만 수록했다는 설명이 있긴하지만... 

왠지 아쉽기는 하다.


사실 "통계 분석"이란 부분은 별도의 학문으로 정립이 되어있을 정도로 방대하면서 전문적인 부분이다.

통계 분석을 조금 깊게 다룬다면... 책이 무척 두껍고 어려워 졌을 수도 있을 것이다..



그리고 책 내용에서 몇 가지 오류를 발견했다. (데이터 파일은 한빛 미디어에서 다운받은 파일 기준이다.)


1. "read.table()함수로 TXT 파일 가져오기" 챕터(83 p.)의 데이터 파일(data_ex.txt)의 내용이 교재와 다르다. 수정이 필요하다

2. 125 p. 예제 파일(Sample4_y17_history.xlsx, Sample4_y16_history.xlsx)의 내용이 교재와 다르다. 파일내용 수정 후 사용하면 된다.

3. 189 p. filter() 함수에 오타가 있다. 책에선 소문자로 filter()로 기재되어 있는 부문을 대문자 Filter()로 수정해야 제대로 실행이 된다.

4. 그리고...  (트위터, 구글지도) API를 활용하는 부분에서 오류가 발생했다. 추가 작업이 필요한 것 같은데... 이건 해결 방법을 몰라 실습해보질 못했다. (개인적으로 가장 아쉬운 부분이었다.)




몇 가지 아쉬운 부분이 있지만...


전반적으로, 이 책은 "R 데이터 분석 초보자의 입문서"라는 목적에는 충실한 책이라고 생각한다.

소프트 웨어 인스톨과 기능에 대한 설명, 다이어 그램을 활용한 쉬운 소개, 공공 데이터 수집 방법과 정제방법...

데이터 분석의 기본에 대해선 그 어느 책보다 충실한 입문서가 아닌가 생각된다.



개인적으로 아쉬운 부분은...

3권의 책을 공부해보고, 스터디도 했었지만 여전히 초보를 못 벗어났다.

고수가 되려면 어떻게 해야 하나.... 고민이다.


되고 싶다.. 고수...



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo