2023 원큐패스 빅데이터분석기사 필기 - 핵심 문제 무료 동영상 강의 수록
정수진 외 지음 / 다락원 / 2023년 3월
평점 :
장바구니담기


   빅데이터 분석 기사 자격증 시험을 준비하는 사람들에게 필요한 책이다. 필기 책이고 실기는 파이썬 또는 R을 사용한다고 하니 참고하면 된다. 실전 모의고사 4회분이 부록 편에 있어서 먼저 1회분 정도는 풀어본 이후에 처음부터 공부하는 것이 좋지 않을까 생각한다. 문제의 유형을 알아야 어떤 방식으로 공부를 시작할지 계획이 세워질 것이다.


   빅데이터 분석 기획, 탐색, 모델링, 결과 해석의 4과목으로 구성되어 있다. 처음 그냥 문제를 풀어봤을 때 다 과락인데 특히 빅데이터 결과 해석의 내용이 파악하기 어려웠다. 품질 기사 자격증 공부를 했거나, 통계 관련 지식이 풍부하다면 접근하기에 용이할 듯하다. 실전 미니 테스트를 풀어보고, 이론을 공부한 다음 다시 테스트를 본다면 기억에 더 오래 남을 듯하다.


   DIKW 피라미드 순서는 데이터, 정보, 지식, 지혜이다. 빅데이터 조직 구조 유형으로는 집중, 기능, 분산 구조로 구분된다. 분석 방법론 단계는 분석기획, 데이터 준비, 데이터 분석, 시스템 구현, 평가 순이다. 알고 보면 당연한 순서인데 몰랐을 때는 단계가 혼동된다. 데이터의 처리 기술에는 필터링, 변환, 정제, 통합, 축소가 있다. RPA에서도 데이터 추출, 정제, 변환 같은 규칙을 사용해서 작업을 하였던 것 같다. 파워 BI에서도 데이터 전처리로 변환은 필요하다. 데이터 사용에 있어 상태에 맞게 사용하는 것이 필요한 듯하다.


   데이터 통계 기법으로 추출(표본추출, 확률 추출, 비확률 추출), 기술 통계(확률분포, 표본분포), 추론 통계(점 추정, 구간 추정, 가설검정)가 있다. 모집단의 30개 데이터를 취하면 충분히 정규분포를 따른다는 중심극한 정리는 표본분포에 해당하는 내용이었다.


   분석 모델 구축 절차는 요건 정의, 모델링, 검증 및 테스트, 모델 적용 순으로 진행되며 이 가운데 분석 방향성을 정하고 협의하는 과정은 요건 정의 때 이루어진다. PDCA 사이클에서도 첫 단계가 중요한 것처럼 모델 구축에서도 방향성을 정하는 첫 단계가 중요한 듯 보인다.


   분석 결과의 시각화의 유형은 시간(막대그래프, 누적 막대그래프, 선 그래프, 영역 차트, 계단식 그래프), 공간(버블 맵, 등치 지역도, 등치선도, 도트맵, 카토그램), 관계(산점도, 산점도 행렬, 버블 차트, 히스토그램), 비교(히트맵, 체르노프 페이스, 스타 차트, 평행좌표), 분포(파이, 도넛, 트리맵) 시각화가 있다. 대부분 뉴스나 각종 문서에서 보는 데이터의 유형이지만 이름은 잘 몰랐는데 정리가 되는 듯하다.


[출판사로부터 도서만 제공받았습니다]


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo