R을 이용한 데이터 처리 & 분석 실무 - 기본부터 통계 분석, 데이터마이닝, 기계학습까지 R 프로그래밍 실습서!
서민구 지음 / 길벗 / 2014년 10월
평점 :
장바구니담기


R을 이용한 데이터처리&분석 실무


요즘 R Studio에 RHadoop 설치해서 거기에 포함된 RHBase를 사용하고 있는데
역시 모든 분야에서 기본 문법 이해는 필수.
다행이 프로젝트 기간 중 적절한 타이밍에 이 책을 리뷰할 수 있게 되었다는..
HBase 쪽 컬럼 정보를 불러올 때 for문을 쓰기도 하는데
이건 좀 불편해서 벡터 연산 방법으로 접근을 해봤는데
책을 보면 사용하는 방법을 정확하게 이해하고 나니
원하는 결과값을 얻을 수 있게 됨.

책의 대부분의 구성은 R Studio에서 
실행한 코드와 나오는 결과값을 보여주는 패턴인데
R Studio 디자인 구조상 이런 패턴이
가장 심플하면서 원하는 코드 사용법에 빠르게 접근할 수 있지 않나 생각이 됨.

R이 올해 부터 상당히 많이 부각되기 시작했는데
하둡에서 파생되는 빅데이터가 많고 종류도 다양해서
각각의 데이터를 시각적인 화면으로 보여줄 수 있는
툴이 이미 R 외에도 유료 라이센스로 판매되는 더 좋은 제품도 있지만
R은 무료 라이센스로도 충분히 많은 기능을 소화시킬 수 있다는게 가장 큰 장점이다.

이 책을 가장 빠르게 접근해서 배울 수 있는 방법은
각 챕터에 소개된 예제들을 직접 실행해보면서 결과를 직접 눈으로 확인하는 것이다.
R은 package는 설치하거나 기존에 설치한 패키지를 
선택하면 되고 자체 Repository에서 미설치된 package를 설치할 수 있다.
R 코딩은 언뜻보면 복잡하고 난해하지만 직접 해보면
분명히 규칙이 존재하고 패턴이 있다.
이런 점들을 활용해서 이 책에 자세하고 방대하게 나와 있는 샘플 코드 작성과 실행, 결과 확인은 코드 문법을
빠르고 정확하게 익히는 지름길.
특히 2장과 3장은 정독하기를 강추한다..
기본적인 문법 패턴이 나와 있으니 이후에 나오는 내용 들을 충분히 응용하기 위해서는

기본 과정을 반복 습득 후 뒷장으로 나가기를 권한다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo