R 교과서 - RStudio로 실습하면서 배우는 R 기초와 활용, 데이터 분석 기법!
쿤 렌 지음, 이준용 옮김 / 길벗 / 2020년 4월
평점 :
절판


R은 데이터 분석에서 가장 많이 사용하는 언어이다. 데이터의 전처리, 분석은 물론 시각화 같은 결과를 표현하는 도구로도 이용할수 있어 그 사용방법이 무궁무진한게 큰 장점이다. 그렇기에 R하나만 배워도 데이터 분석의 모든것을 할수 있어 인기가 제법 높은 편이다. 그렇기에 시중에 다양한 R서적이 나오고 있는데, 이 책도 그 중 하나이다.


이 책은 R의 기초부터 고급 기술까지 모든 것을 담은 책이라고 한다. 솔직히 많은 책이 이미 시중에 나왔기에 이 책을 처음 볼땐 그런 R의 인기에 힘입어서 낸 책이라는 생각을 했었다. 하지만 이 책의 내용을 전체적으로 살펴보니 이 책만이 가지는 장점이 무척 강하다는 생각이 들었다.


초반엔 기본적인 환경설정과 변수, 문법 등을 가르치는 것은 다른 책들과 큰 차이가 없었다. 하지만 중간부터 이 책의 내용은 지금껏 본 R관련 도서들과 다른 내용들이 많이 보이고 있었다. 7장에서부터 메타프로그래밍을 비롯한 다양한 프로그래밍 스킬들을 배우고 있었는데, 보통 실습 위주로 쉽게쉽게 와닿게 했던 기존의 책들과는 다른 방향이라서 놀라긴 했지만, 지연 평가를 통해 성능과 속도를 향상하는 방법을 소개하고, 객체 지향에 대해 자세히 설명한 것을 보니 확실히 다른 책들과 다르게 좀 더 스킬적인 다룬 부분이 많다는 게 느껴졌다.


데이터 분석을 목적으로 하는 대부분의 경우 성능보다는 정확성이 더욱 중요하다. 다시 말해 1분안에  정확한 결과를 얻는 것이 20초안에 잘못된 결과를 얻는 것보다 낫다. 3배 빨리 얻은 결과가 느리지만 정확한 결과보다 3배 더 유효한 것은 아니다. 따라서 코드의 정확성을 확신하기 전에 성능부터 확인해야 하고, 문제가 없어야 한다.


13장 내용중 일부


특히 가장 마음에 든 부분이 13장인 고성능 컴퓨팅이었다. 13장에서는 코드의 속도보다 정확성을 어필하고 있는데, 이 부분은 여러 내용중에 특히 이건 내가 전공 수업을 들을 때 교수님이 강조하는 부분이기도 했다. 코딩에서 중요한 것은 속도가 다가 아니라는 가르침. 개발은 혼자 하는 것이 아니며, 단순히 프로그램의 속도만이 답이 아니라 하드웨어를 얼마나 사용하는지, 코드의 길이나 변수 이름은 이해하기 쉬운지 등등 고려해야할 요소가 하나만이 아니라는 것을 몇 년동안 들어왔기에 책에서의 그 내용을 얘기하는게 얼마나 중요한지가 실감이 났다. 


정말 탄탄한 기초를 다지기엔 제격이란 생각이 든다. 처음엔 쉽게 접근을 했다가 나중엔 고급 스킬로 좀 더 효율적인 코드를 짤수 있는 능력까지 키울 수 있으니 진짜 제목 그대로 "R의 교과서"라는 생각이 든다. 무턱대고 문법만 안다는 것이 아닌 체계적인 과정으로 기본기를 단단히 가지는데 제격인 책이니 R을 입문하거나 배우고 싶은 사람들, 기본기를 다지고 싶은 사람들에게 적극적으로 추천하고 싶은 도서이다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo