R로 쉽게 시작하는 빅데이터 분석
이안용.박은수 지음 / 광문각출판미디어 / 2023년 8월
평점 :
장바구니담기



R로 쉽게 시작하는 빅데이터 분석


이 책의 저자이신 이안용 님은 대학에서 스마트팩토리관련분야의 연구와 교육을 하고 계시며 박은수님은 대학에서 건설사업관리 관련 시공관리, 건설정보, 스마트건설 등의 교육 및 연구를 수행하고 계십니다.


이 책은 빅데이터 개요, R 시작하기, 데이터 탐색, IV. 모델링과 예측 선형 회귀, 디지털 영상 처리와 R을 이용한 데이터 분석관련 연습문제 등이 있습니다.


인터넷, 클라우드의 발전으로 인하여 빅데이터를 이용한 분석을 R을 통하여 하고 있습니다. 빅데이터는 개인, 기업 뿐 아니라 국가간의 자원으로 활용 영역이 확대되고 있습니다. 통신 인프라 발전과 스마트폰의 대중화, 인스타그램 등 SNS가 활성화 되면서 비정형 데이터양이 증가하게 되었습니다.

기업에서는 사물인터넷과 센서를 활용하여 스마트 공장 구축을 위한 기반 구축에 나서는 등 사회적으로 경제적으로 중요성이 증가하고 있습니다.


빅데이터의 처리기술에는 클라우드가 있습니다.

클라우드는 전통적인 데이터베이스나 시스템 환경에서 처리하기 힘든 대용량

데이터를 저장 분석 처리해 가치 있는 정보로 만들어 내는 일련의 과정을 거치기위한 컴퓨팅 기술이 필요합니다.

수억 또는 수십 억의 비정형 파일로 부터 정보를 추출하기 때문에 데이터양이 방대하여 고성능 컴퓨터를 이용할지라도 처리에 한계가 있으므로 여러 대의 서버가나누어 처리하도록 하는 병렬 처리 시스템인 클라우드 컴퓨팅을 사용합니다.

하둡은 대용량 데이터 처리를 위해 개발된 오픈 소스 소프트웨어로 클라우드 컴퓨팅을 이용해 안정적이고 효과적으로 빅데이터를 처리할 수 있으며 여러개의 저렴한 컴퓨터를 마치 하나인 것처럼 묶어 대용량 데이터를 처리하는 기술로 데이터의

위치를 추적하는 방식으로 분산 파일시스템을 구현합니다.

데이터 마이닝은 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 것입니다.

인공지능은 인지, 학습, 문제, 해결, 패턴 인식 등 인간이 가지고 있는 지적 능력 일부 또는 전체를 컴퓨터를 이용해 구현하는 지능에서 시스템에 의해 만들어진 지능입니다.

분석에는 R 언어를 사용합니다.

R은 통계를 포함한 데이터 분석 작업에 활용할 목적으로 개발된 프로그램 언어 중 하나로 1993년 뉴질랜드 오클랜드 대학의 로스 이아카와 로버트 젠틀맨에 의해

통계 프로그래밍 언어인 S-Plus의 무료 버전 형태입니다.

문서편집, 이메일 송신 등의 애플리케이션 프로그램을 만들기에는 적합하지 않지만

데이터 관리 및 분석하는데 효율적이며 데이터를 다루기 위해서 다양한 기능을 제공합니다.

R스튜디오는 R 프로그램을 작성하고 실행하기 위한 소프트웨어이고 R 스튜디오는

R 프로그래밍을 편리하게 작업할 수 있도록 도움을 주는 보조 소프트웨어입니다.

R로 데이터를 분석하는 방법을 이 책으로 조금이나마 알 수 있습니다.

R로 데이터 분석을 하는 방법을 배우고자 하시는 분은 이 책을 추천드립니다.

광문각출판미디어 출판사로부터 해당 도서 지원을 받아 작성한 서평입니다.

#R로쉽게시작하는빅데이터분석 #광문각출판미디어 #이안용 #박은수 #북유럽



댓글(0) 먼댓글(0) 좋아요(1)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo