R 데이터 분석 머신러닝
조민호 지음 / 정보문화사 / 2021년 2월
평점 :
장바구니담기


입문자를 위한 R 데이터 분석 프로그래밍

R 데이터 분석 머신러닝

R Data Analysis Machine Learning



통계를 배워서 업무에 활용하는 것은 
쉽지 않아서 
전문가의 영역으로 생각한다. 

프로그램을 이용해서
데이터를 잘 분석하는 것과 
통계를 이용하여 
업무에 적용하는 것은 
조금 다른 영역이다. 

마치 빵을 만드는 제빵 기술과 
삥을 이영하여 행복한 삶을 사는 것과 
같은 부분이라고 생각한다. 

그래서 나의 경우에는 
통계 프로그램의 운용 원리를 이해하여 
분석된 통계치를 활용하는 방법에 
더 많은 관심이 있다. 


 

저자 조민호는 컴퓨터공학과 교수로 
25년 동안 컴퓨터 관련 실무를 수행하며,
수많은 기업체에서 
컴퓨터 원리와 응용에 대해 강의하고 있다. 

책의 주요 내용을 살펴보면 

1. R의 사용법
2. R을 사용한 통계 분석
3. R의 활용법
4. 데이터 분석 기법

데이터 분석 도구인 
R의 사용법의 기초적인 사용법부터 
다양한 활용법까지 설명하고 
딥러닝과 관련된 기술적 흐름에 대하여 
설명하고 있다. 




R 은 오픈소스 소프트웨어로 
인터넷에서 무료로 다운로드해 
설치하여 사용할 수 있다. 

R 은 쉽게 배우고 
활용할 수 있다. 

R 의 기초적인 사용법부터 
데이터를 읽어 
분석이 필요한 부분을 추출하거나, 
데이터를 변형, 가공할 수 있고, 
다양한 방법으로 데이터를 
시각화할 수 있다. 





그래프는 데이터의 성질을 파악하고 
분석한 데이터의 특성을 
알기 쉽게 알아보기 위해 필요하다. 

패키지는 그래픽으로 표현하는데 
탁월한 기능들을 갖고 있다. 

그래프 그리기의 단계별 작업방법을 
예제와 함께 설명하고 있다. 




데이터의 분석은 통계 도구를 사용하는 
궁극적인 목적이다. 

<통계 기법의 적용을 위한 개념> 

데이터의 수집 및 특성 파악
데이터 특성 상세화 
데이터간의 의존 관계분석 
(독립성 검정)

특정 분포를 따르는지 분석 
(적합도 검정)
차이검정 
인과관계

내용이 통계에 대한 기초적인 지식 없이는 
이해하기 쉽지 않다. 
통계의 기본 적용 원리를 
배우는 과정이 필요하다. 




워드 클라우드는 텍스트로 된 데이터에서
빈번하게 사용하는 단어를 선별하여 
구름과 같은 그림으로 나타내는 기법이다.  
텍스트 마이닝이라고도 한다. 

이 책의 표지에는 
R 프로그래밍의 기초 입문자를 위한 
책이라고 소개하고 있어서 
쉽게 생각하고 읽기 시작했으나 
점차 진도가 나가면서 
1~2일에 해결되지 않을 거란 생각이 든다. 
중간중간 필요한 부분만 선별해서 읽었다. 
왜냐하면 
통계와 관련된 기초 지식 없이 
책의 진도를 따라가기가 어렵다. 
조금 더 쉬운 통계학 책을 읽어 보고
진도를 나가기를 제안한다. 

어느 정도 통계적인 기본 지식이 있다면 
이 책의 도움을 받아서 
패키지를 잘 배울 수 있을 것이다. 


출판사로부터 도서를 제공받아 작성한 리뷰입니다



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo