출판사로부터 도서를 제공 받아 주관적인 견해에 의해 작성한 리뷰입니다.
데이터 분석은 수집된 데이터를 정리하고 가공, 해석하여 의미 있는 정보와 인사이트를 도출하는 과정이라고 정의할 수 있습니다.
데이터 분석은 단순히 숫자를 보는 것이 아니라 데이터를 통해 문제를 이해하고 의사결정에 활용하는 것이 목적입니다.
데이터 분석의 과정을 보면 설문조사, 웹 로그, 센서, 판매 기록 등에서 데이터를 수집합니다.
오류나 중복, 누락된 값을 수정하거나 제거하는 데이터 정제 과정을 거치고, 통계와 시각화를 활용해 데이터의 특징과 패턴을 파악합니다.
가설 검증, 상관관계 분석, 예측 모델 구축 등을 수행하는 분석 및 모델링 단계, 분석 결과를 바탕으로 문제 해결 방안을 제안합니다.
이렇게 정리된 데이터 중에서도 가장 많이 저지르는 실수와 올바른 해결법을 대비해 설명하는 것이 오답 노트입니다.
이 책 《데이터 분석 오답 노트》는 실전 중심의 교재로 실수에서 찾는 해법을 알려주고 데이터 분석을 위한 도구 사용법을 알려줍니다.
데이터 분석을 하며 어떤 실수를 하는지 알기 위해서는 분석을 위해 어떤 도구를 사용하는지 알아야 합니다.
데이터 분석에서는 빅쿼리, 파이썬, 구글 스프레시트, 루커 스튜디오와 같은 데이터 분석 도구를 사용합니다.
빅쿼리는 구글 클라우드 플랫폼에서 제공하는 데이터 웨어하우스 서비스로 큰 데이터를 빠르고 효율적으로 분석할 수 있게 도와주는 도구입니다.
데이터베이스에 저장된 수많은 정보를 꺼내고 조건을 걸고 필요한 형태로 가공하는 데 특화되어 있기 때문에 비교적 간단한 문법을 사용합니다.
파이썬은 개발 언어 중 문법이 비교적 단순하고 직관적이라 초보자도 빠르게 배울 수 있고 데이터 처리와 시각화 등 폭넓게 활용할 수 있습니다.
기능이 방대하고 다양한 라이브러리를 다루다 보니 기본기를 놓치거나 잘못 활용하는 경우가 적지 않습니다.
구글 스프레드시트는 엑셀이라고 생각하면 됩니다. 스프레드시트 프로그램 중 가장 유명한 프로그램이 엑셀이고 온라인에서 쉽게 사용 가능합니다.
별도의 설치 없이 웹에서도 바로 사용할 수 있고 여러 사람이 동시에 접속해 함께 작업할 수 있다는 점에서도 협업에 강점을 가지고 있습니다.
루커 스튜디오는 차트를 예쁘게 만드는 도구가 아니라 수많은 숫자와 지표 속에서 중요한 흐름을 드러내고 의사결정자가 한눈에 이해할 수 있게 합니다.
루터 스튜디오를 배우는 이유는 데이터를 분석하는 것만으로 부족하기 때문입니다. 분석 결과를 효과적으로 전달할 수 있어야 비로소 의미가 생깁니다.


