-
-
혼자 공부하는 R 데이터 분석 - 1:1 과외하듯 배우는 데이터 분석 자습서 ㅣ 혼자 공부하는 시리즈
강전희.엄동란 지음 / 한빛미디어 / 2022년 1월
평점 :
21세기 가장 섹시한 직업?
비전공자의 배움의 길은 언제나 험난하다
빅데이터 공부의 좋은 가이드가 없을까?
책을 선택한 이유
21세기 가장 섹시한 직업은 무엇일까?
하버드 비즈니스 스쿨은 데이터사이언티스트를
선정했다.
데이터에서 숨겨진 의미와 패턴을 찾고
적절한 의사결정을 할 수 있도록 돕고
새로운 가치를 창출하도록 한다.
우리나라는 국가기술 빅데이터 분석기사라는
국가자격시험이 있다.
1차 필기시험과 2차 실기시험을 치룬다.
실기시험을 합격하기 위해서는
R 또는 파이썬을 공부해야 한다.
R은 통계, 데이터마이닝 프로그램으로
초보자가 쉽게 배울 수 있다.
파이썬은 프로그래밍 언어로 다소 어렵지만
범용성 있게 사용할 수 있다.
2022년 빅데이터 분석기사 시험 일정과
실기시험 과목이다.
분 |
등급 |
시험명 |
접수기간 |
수험표발급 |
시험일 |
결과발표 |
증빙서류 제출기간 |
빅데이터 분석기사 |
기사 |
제4회 빅데이터분석기사(필기) |
3.7 ~ 3.14 |
3.25 |
4.9(토) |
4.29 |
5.2 ~ 5.12 |
제4회 빅데이터분석기사(실기) |
5.23 ~ 5.27 |
6.10 |
6.25(토) |
7.15 |
- |
제5회 빅데이터분석기사(필기) |
8.29 ~ 9.2 |
9.16 |
10.1(토) |
10.21 |
10.24 ~ 11.3 |
제5회 빅데이터분석기사(실기) |
11.7 ~ 11.11 |
11.18 |
12.3(토) |
12.23 |
실기
실기과목명 |
주요항목 |
세부항목 |
세세항목 |
빅데이터 분석 실무 |
데이터 수집 작업 |
데이터 수집하기 |
- 정형, 반정형, 비정형 등 다양한 형태의 데이터를 읽을 수 있다.
- 필요시 공개 데이터를 수집할 수 있다.
|
데이터 전처리 작업 |
데이터 정제하기 |
- 정제가 필요한 결측값, 이상값 등이 무엇인지 파악할 수 있다.
- 결측값와 이상값에 대한 처리 기준을 정하고 제거 또는 임의의 값으로 대체할 수 있다.
|
데이터 변환하기 |
- 데이터의 유형을 원하는 형태로 변환할 수 있다.
- 데이터의 범위를 표준화 또는 정규화를 통해 일치시킬 수 있다.
- 기존 변수를 이용하여 의미 있는 새로운 변수를 생성하거나 변수를 선택할 수 있다.
|
데이터 모형 구축 작업 |
분석모형 선택하기 |
- 다양한 분석모형을 이해할 수 있다.
- 주어진 데이터와 분석 목적에 맞는 분석모형을 선택할 수 있다.
- 선정모형에 필요한 가정 등을 이해할 수 있다.
|
분석모형 구축하기 |
- 모형 구축에 부합하는 변수를 지정할 수 있다.
- 모형 구축에 적합한 형태로 데이터를 조작할 수 있다.
- 모형 구축에 적절한 매개변수를 지정할 수 있다.
|
데이터 모형 평가 작업 |
구축된 모형 평가하기 |
- 최종 모형을 선정하기 위해 필요한 모형 평가 지표들을 잘 사용할 수 있다.
- 선택한 평가지표를 이용하여 구축된 여러 모형을 비교하고 선택할 수 있다.
- 성능 향상을 위해 구축된 여러 모형을 적절하게 결합할 수 있다.
|
분석결과 활용하기 |
- 최종모형 또는 분석결과를 해석할 수 있다.
- 최종모형 또는 분석결과를 저장할 수 있다.
|
빅데이터 분석기사 시험은 관심이 있지만
비전공자가 실기 시험을 준비하기는 어렵다.
"혼자 공부하는 R 데이터분석"은
프로그래밍, 통계도 처음 배우는
비전공자의 눈높이에서
R언어에 대해 혼자 공부할 수 있도록 하여
선택하였다.
책의 구성
"혼자 공부하는 R 데이터분석"는
1장 빅데이터와 R
2장 데이터 분석을 위한 기본 다지기
3장 R프로그래밍 익히기
4장 데이터 다루기
5장 데이터 가공하기
6장 데이터 시각화
7장 프로젝트로 실력다지기
8장 데이터 분석 보고서 공유하기
등 총 8장으로 구성되어 있다.
기초 이론을 설명하고 손코딩 예제를 통해
이론을 이해하도록 구성되어 있다.
각 장 마지막에는 마무리로
핵심 이론과 연습문제를 통해
이해도를 점검하도록 하였다.
부록은 혼공 용어노트로
R의 용어집을 만들어
공부하면서 용어의 뜻이 궁금하거나
다시 찾아 볼 때 유용한 정보를 제공한다.
책을 읽은 소감
"혼자 공부하는 R 데이터분석"는
핵심키워드, 시작하기 전에, 말풍선,
손코딩, 좀 더 알아보기, 핵심 포인트,
확인 문제의 7단계로 구성되었다.
초보자도 각 단계를 거치면서
R 언어를 점층적으로 반복 이해할 수
있도록 하였다.
비전공자 입장에서 프로그래밍 언어를 배울 때
이해가 어렵고, 자주 잊어버리는 문제가 있다.
7단계의 반복 학습과 예제를 통한 실습은
비전공자인 초보자가 R을 배우는데
많은 도움이 될 것 같다.
빅데이터 분석에 관심이 있거나
빅데이터 분석기사 시험을 준비하는데
"혼자 공부하는 R 데이터분석"은
많은 도움이 될 것 같다.
책을 읽다가 궁금한 점이 있을 때는
질문에 대한 답변도 해준다.
비전공자로 빅데이터를 R로 배우려는
모든 초보 입문자들이 목표를 달성하길 기원한다.
한빛미디어에서 "혼자 공부하는 R 데이터분석"을
증정해주셨다. 감사드린다.