이것이 데이터 분석이다 with 파이썬 - 파이썬으로 배우는 데이터 분석 입문 이것이 시리즈
윤기태 지음 / 한빛미디어 / 2020년 2월
평점 :
장바구니담기


예전부터 빅데이터, 데이터 마이닝, 머신 러닝 등에 대해 공부하고 싶었지만 쉽지가 않았다. 관련 책들을 보기도 했지만 난해한 수식과 용어들로 인해 내용이 잘 이해가 되지 않았다. 그러던중 우연한 기회에 한빛미디어 서평 이벤트를 통해 이 책을 접하게 되었다.


이 책은 기본적으로 파이썬에 대한 사전 지식을 가지고 있는 데이터 분석 입문자를 대상으로 하고 있다. 개인적으로 회사에서 파이썬을 사용하고 있는 관계로 책의 내용을 따라 하는데 큰 무리는 없었다. 특히 이 책은 구체적인 이론이나 난해한 개념 설명보다는 "데이터 분석이란 이런 과정으로 진행된다"는 큰 흐름을 보여주고 있기에 전반적인 내용을 이해하는데 많은 도움이 되었다. 특히 일상 생활에서 흔히 접할 수 있는 데이터(영화 평점, 야구 선수 연봉, 비트코인 가격 등)들을 입력해서 분석하고 그 결과를 토대로 미래의 결과를 예상하는 과정을 보여주기 때문에 비슷한 성격의 데이터만 수집할 수 있다면 바로 실무에 적용 가능하겠다는 생각이 들었다.


책의 구조에 대해 알아보자면 각 장의 시작마다 핵심 개념을 간략히 잘 정리하고 있어서 독자가 이번 장에서는 무엇을 배우는데 집중해야 하는지를 미리 알 수 있다. 각 분석 예제의 마지막에는 "표로 정리하는 데이터 분석" 항목을 통해 데이터 분석의 핵심 내용과 결과를 한눈에 파악할 수 있다.


데이터 분석은 다음의 단계로 이루어진다.

1. 데이터 수집하기

2. 데이터를 분석하기 좋은 형식으로 가공하기 (데이터 전처리)

3. 수집된 데이터를 데이터 분석 라이브러리로 읽어 들이기

4. 데이터 분석하기

5. 분석된 결과 사용하기: 유의미한 결과 추출하기, 미래 예측


이 책의 특징은 다음으로 요약할 수 있겠다.

* 데이터 분석을 처음 시작하는 사람들을 위한 입문서 (단 파이썬에 대한 사전 지식 필요)

* 친숙한 예제를 통해 데이터 분석 과정을 쉽게 따라해볼 수 있다.

* 배경 지식이 없어도 데이터만 가지고 있다면 데이터 분석을 쉽게 적용해볼 수 있다.

* 데이터 분석에 대한 용어나 알고리듬에 대한 상세한 설명은 없으므로 깊이 있는 내용을 원하는 독자들은 책에 언급된 용어를 바탕으로 추가적인 학습이 필요하다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo