-
-
아빠가 들려주는 R 통계 - 샤방샤방 R Shiny 통계
김지형 지음 / 북앤에듀 / 2020년 1월
평점 :

날이 갈수록 중요한 위치를 차지하고 있는 학문이 통계인 거 같다. 빅데이터니 인공지능이니 하는 요즘 화두인 분야를 일단 제쳐 두더라도, 통계는 이공계통뿐만 아니라, 경제, 경영, 심리, 행정 등 다양한 문과 영역에서도 아주 중요한 역할을 하고 있다. 연구자에게 있어서, 통계는 자신의 연구를 중명하기 위한 대표적인 수단이기도 하다.
그러다 보니, 통계 관련 소프트웨어들이 주목을 받고 있는데, 최근 각광을 받는 것이 바로 막강한 데이터 분석 능력을 가진 R이다. R 사용자가 많아지면서, R을 지원하는 다양한 프로그램들도 많이 생기고 있다. 그중 Shiny 샤이니는 R의 기능을 확장하여 빠르고 쉬운 대화형 웹 앱 제작을 쉽게 제작 가능케 하는 패키지이다.
이번에 본, '아빠가 들려주는 R 통계'는 R과 Shiny를 이용한 다양한 통계 분석 방법과 그래프 보는 법을 알려주는 책이다. 그런데 이 책은 의학도, 의학 연구자에 특화된 책이라는 특징을 가지고 있다. 김지형 저자 역시 정형외과 의사이다. 그래서 그런지 책 속 통계 샘플들이 중에 의료적인 것들이 많이 보인다. 반면 저자가 지은 책들을 보면, 의학자 보다 통계학자가 아닌가 할 정도로 통계에 관련된 많은 책을 쓴 것을 알 수 있다. 그만큼, 저자가 의학과 수학적 식견을 같이 갖추고 있다는 의미일 것이다.
우선 책 제목이 '아빠가 들려주는 R 통계'이다 보니, 이 책이 R 입문이나 통계 초보 책이 아닐까 생각하시는 분이 있을 것이다. 미안하지만, 절대적으로 틀린 생각이다. t-test, ANOVA가 처음 들어 보는 단어라면, 이 책의 파트 1도 이해하기 힘들다. 게다가 R, 샤이니도 접해본 적이 없다면, 더더욱 책을 바로 덮게 될 것이다. '아빠가 들려주는 R 통계'에는 R 설치나 샤이니 설치, 기본 사용법 그런 내용이 없다. 따라서, 통계 공부도 하고 R 입문 수준을 벗어난 분들이 봐야 하는 책이다.
그런데 왜 책 제목에 아빠가 나와서 혼동을 주나 할 수 있을 것이다. 처음엔 나도 왜 그런지 이해가 안 됐다. 하지만 책을 읽어 가면서 점점 알 수 있었다. 볼수록 엄청 친절한 책이었다. 그래프 보는 방법도 일일이 알려주고 각각의 의미, 어떤 분석이 어떤 연구에 적용하면 좋은 지, 실수하기 쉬운 부분 같은 것들을 꼭 집어 자세히 알려주어, 마치 어린 자식의 질문에 이해하기 쉽게 알려주려고 땀을 뻘뻘 흘리며 설명하는 자상한 아빠 이미지가 그려졌기 때문이다.

아빠의 사랑은 항상 넘쳐난다. 이 책도 그런 의욕이 넘쳐난다. 8개의 파트에 왕초보 통계부터 시작해서, 설문 조사 연구, 탐색적 분석, 단변수 분석, 다변수 분석, 결정나무와 판별 분석 등 무척 많은 것들을 담았다. 통계 사전이라는 느낌까지 든다. 게다가 이것들을 저자의 블로그와 연동해서 직접 실습해볼 수 있게 모조리 담았다. 책에 보이는 웹 주소들이 바로 그것들이다.

실습에 나오는 각종 시각화된 자료들은 자신의 연구나 문서 목적에 맞게 약간만 수정하면 되는 것들이 많으므로 일종의 탬플릿 역할도 해준다. 게다가 문서화하는데 도움 되게 csv, pdf 파일 등을 활용하는 방법, 문서화 힌트도 있고, 편리함을 주는 소프트웨어 도구에 관한 것들도 중간중간 알려주고 있어서 통계 툴에 익숙하지 않은 독자들을 전방위적 서포트를 해주고 있다.
내가 보기에 '아빠가 들려주는 R 통계'는 적어도 중급 수준의 책이라 생각한다. 그렇기 때문에 준비된 사람들에게는 친절한 아빠로 느껴질 거고, 준비가 덜 된 사람들에게는 꼰대 아빠처럼 느껴질 것이다.
하지만 분명한 것은 '아빠가 들려주는 R 통계'가 폭넓고 다양한 내용을 담고 있고, 저자의 노하우와 조언을 아낌없이 하고 있어, 각종 연구자나 통계 업무를 하는 분들에게 많은 도움이 되어 줄 것이라 생각한다.