혼자 공부하는 R 데이터 분석 - 1:1 과외하듯 배우는 데이터 분석 자습서 혼자 공부하는 시리즈
강전희.엄동란 지음 / 한빛미디어 / 2022년 1월
평점 :
장바구니담기


저는 통계학 석사로서 대학원생, 직장인들 대상으로 통계, 데이터 분석 과외를 진행하고 있습니다.

통계, 데이터 분석을 가르칠때, 어떠한 데이터 분석 언어를 가르칠 것이며 어떠한 교재를 사용할지 항상 고민하고 있습니다.

먼저, 데이터 분석 언어는 크게 R과 Python, SAS 등을 고려할 수 있을 것 입니다.

이중 아무래도 오픈소스에 해당하는 R과 Python중 하나를 고민하게 되는데,

저는 데이터 분석 초심자에게는 R이 훨씬 적합한 언어라고 생각하고 있습니다.

R과 Python의 차이점을 R은 iOS에 Python은 Android에 빗대어 이해할 수 있습니다.

R은 언어가 굉장히 잘 구조화 되어있고, 문서화가 잘 되어 있습니다.

반면, Python은 R보다는 구조적인 부분이 부족하나 매우 확장성이 뛰어난 편입니다.

따라서, 저는 R을 항상 데이터 분석 입문언어로 추천하고 가르치고 있는데, R의 최신 트렌드에 맞춘 교재가 없다는 것이 항상 아쉬웠습니다.

R의 tidyverse와 관련한 dplyr, ggplot2, tibble 같은 매우 유용한 패키지와

R markdown, shiny 을 이용한 문서화 작업까지 다루는 입문자 수준의 교재가 없었던 것은 사실입니다.

하지만, 혼자 공부하는 파이썬, SQL 등의 훌륭한 프로그래밍 입문서를 출간하고 있는 한빛미디어가

"혼자 공부하는 R 데이터 분석"을 이번에 출간하여 그 고민이 해결되었습니다.


"혼자 공부하는 R 데이터 분석"은 R 기본 내장 코드를 소개하는데 그치지 않고,

최신 패키지를 이용하는 방법을 구체적으로 제시하고 있습니다.

특히, 데이터 전처리 파트를 dplyr 패키지로 바로 배우게 한다는 점은 굉장히 바람직한 방향이라고 확신합니다.

dplyr는 SQL과 매우 흡사한 문법을 가진 데이터 전처리 패키지입니다.

따라서, 기존 SQL에 익숙한 학습자라면 dplyr를 굉장히 빨리 학습할 수 있고,

dplyr로 데이터 분석을 처음 배운 학습자라면 SQL에 매우 빨리 적응할 수 있습니다.

코드의 유지보수가 기존 내장 R 데이터 처리 함수들에 비해 훨씬 용이한 것도 장점입니다.

이러한 장점으로 인해, 저는 처음부터 dplyr 패키지로 학습하는 것이 좋다고 확신하는데,

"혼자 공부하는 R데이터 분석"은 이러한 트렌드를 잘 쫓아가고 있습니다.


실제 데이터인 공공 데이터를 활용하여 데이터 분석을 하는 과정을 제시하는 것 또한 매우 훌륭한 부분입니다.

단순하게 교재에서 예습용 데이터를 제시하여 분석 과정을 학습하게 하는 것에 비해,

가설을 세우고 필요한 데이터를 습득하여 결론을 내리는 과정을 따라가게 하는 것은 훨씬 더 실전적인 학습을 가능케 한다고 봅니다.


마지막으로, R markdown를 통한 문서화와 R shiny를 이용한 인터랙티브 문서 작성에 대한 부분은

단순히 R의 학습을 프로그래밍 언어로서 그치게 하는게 아니라,

실제 데이터 분석가로서 분석결과를 정리하고 공유하는데 매우 필수적인 도구를 가르쳐줍니다.


최신 R 패키지를 이용하여 데이터 분석, 실전적인 데이터 분석 과정, 문서화를 통한 의사소통 기법까지 포함한 점은

"혼자 공부하는 R 데이터 분석"이 여타 다른 교재에 비해 R 데이터 분석을 처음 시작하기에

최고의 교재라고 확신하는 바이며,

학습자들 뿐만 아니라 R 데이터 분석을 강의하는 강사님들께도 최고의 교과서라고 확신합니다.


댓글(0) 먼댓글(0) 좋아요(1)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo