혼자 공부하는 데이터 분석 with 파이썬 - 1:1 과외하듯 배우는 데이터 분석 자습서 혼자 공부하는 시리즈
박해선 지음 / 한빛미디어 / 2023년 1월
평점 :
장바구니담기


#혼자공부하는데이터분석 #혼자공부하는데이터분석with파이썬 #혼공 #혼공시리즈 #박해선 #한빛미디어 #한빛미디어출판사 #서평 #서평이벤트 #yes24 #yes24리뷰어클럽 #데이터분석 #파이썬 #통계 #데이터 #혼공족 #혼공파 #혼공머신 #머신러닝

'YES24 리뷰어클럽 서평단 자격으로 작성한 리뷰입니다.'

yes24리뷰어 클럽에서 한빛미디어 출판사에서 출판된 <혼자 공부하는 데이터 분석 with 파이썬>이라는 책의 서평 이벤트를 하고 있었다. 데이터분석 공부, 통계 공부에 관심이 있어 책을 읽고 싶은 마음이 커서 서평 이벤트에 지원했고 당첨되어 책을 받게 되었다.



책의저자-박해선

기계공학을 전공했지만 졸업 후엔 줄곧 코드를 읽고 쓰는 일을 했습니다. 텐서플로 블로그(tensorflow.blog)를 운영하고 있고, 머신러닝과 딥러닝에 관한 책을 집필하고 번역하면서 소프트웨어와 과학의 경계를 흥미롭게 탐험하고 있습니다. 『혼자 공부하는 머신러닝+딥러닝』(한빛미디어, 2020), 『Do it! 딥러닝 입문』(이지스퍼블리싱, 2019)을 집필했습니다. 『머신러닝 파워드 애플리케이션』(한빛미디어, 2021), 『머신러닝 교과서 with 파이썬, 사이킷런, 텐서플로(개정 3판)』(길벗, 2021), 『파이토치로 배우는 자연어 처리』(한빛미디어, 2021), 『딥러닝 일러스트레이티 드』(시그마프레스, 2021), 『GAN 인 액션』

(한빛미디어, 2020), 『핸즈온 머신러닝(2판)』(한빛미디어, 2020), 『미술관에 GAN 딥러닝』 (한빛미디어, 2019), 『파이썬을 활용한 머신러닝 쿡북』(한빛미디어, 2019), 『머신 러닝 교과서 with 파이썬, 사이킷런, 텐서플로』(길벗, 2019), 『케라스 창시자에게 배우는 딥러닝』(길벗,2018), 『핸즈온 머신러닝』(한빛미디어, 2018), 『텐서플로 첫걸음』(한빛미디어, 2016)을 우리말로 옮겼습니다.

책의 목차

Chapter 01 데이터 분석을 시작하며

01-1 데이터 분석이란

__데이터 분석과 데이터 과학

__데이터 분석가

__데이터 분석을 위한 도구

[좀 더 알아보기] 데이터 마이닝과 머신러닝

[3가지 키워드로 정리하는 핵심 포인트]

[학습에 꼭 필요한 핵심 패키지]

[확인 문제]

01-2 구글 코랩과 주피터 노트북

__구글 코랩

__노트북

[좀 더 알아보기] 마크다운 서식

[5가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 텍스트 셀 툴바]

[확인 문제]

01-3 이 도서가 얼마나 인기가 좋을까요?

__도서 데이터 찾기

__코랩에서 데이터 확인하기

__파이썬으로 CSV 파일 출력하기

__데이터프레임 다루기: 판다스

__[문제 해결 과정] 적절한 데이터를 찾아서 업로드하고 읽기

[좀 더 알아보기] 공개 데이터 세트 대표 사이트와 유명 포럼

[5가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

[확인 문제]

Chapter 02 데이터 수집하기

02-1 API 사용하기

__API란

__파이썬에서 JSON 데이터 다루기

__파이썬에서 XML 데이터 다루기

__API로 20대가 가장 좋아하는 도서 찾기

__[문제 해결 과정] 공개 API로 웹에서 데이터 가져오기

[4가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

[확인 문제]

02-2 웹 스크래핑 사용하기

__도서 쪽수를 찾아서

__검색 결과 페이지 가져오기

__HTML에서 데이터 추출하기: 뷰티플수프

__전체 도서의 쪽수 구하기

__웹 스크래핑할 때 주의할 점

__[문제 해결 과정] 웹 스크래핑으로 HTML 수집하기

[좀 더 알아보기] merge() 함수의 매개변수

[2가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

[확인 문제]

Chapter 03 데이터 정제하기

03-1 불필요한 데이터 삭제하기

__열 삭제하기

__행 삭제하기

__중복된 행 찾기

__그룹별로 모으기

__원본 데이터 업데이트하기

__[문제해결 과정] 일괄 처리 함수 만들기

[6가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

[확인 문제]

03-2 잘못된 데이터 수정하기

__데이터프레임 정보 요약 확인하기

__누락된 값 처리하기

__정규 표현식

__잘못된 값 바꾸기

__누락된 정보 채우기

__[문제해결 과정] 데이터를 이해하고 올바르게 정제하기

[2가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

[확인 문제]

Chapter 04 데이터 요약하기

04-1 통계로 요약하기

__기술통계 구하기

__평균 구하기

__중앙값 구하기

__최솟값, 최댓값 구하기

__분위수 구하기

__분산 구하기

__표준편차 구하기

__최빈값 구하기

__[문제해결 과정] 데이터프레임에서 기술통계 구하기

[좀 더 알아보기] 넘파이의 기술통계 함수

[6가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

[확인 문제]

04-2 분포 요약하기

__산점도 그리기

__히스토그램 그리기

__상자 수염 그림 그리기

__[문제해결 과정] 통계량을 시각적으로 표현하기

[좀 더 알아보기] 판다스의 그래프 함수

[6가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

[확인 문제]

Chapter 05 데이터 시각화하기

05-1 맷플롯립 기본 요소 알아보기

__Figure 객체

__rcParams 객체

__여러 개의 서브플롯 출력하기

[5가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

[확인 문제]

05-2 선 그래프와 막대 그래프 그리기

__연도별 발행 도서 개수 구하기

__주제별 도서 개수 구하기

__선 그래프 그리기

__막대 그래프 그리기

__[문제 해결 과정] 맷플롯립으로 선 그래프와 막대 그래프 그리기

[좀 더 알아보기(1)] 이미지 출력하고 저장하기

[좀 더 알아보기(2)] 그래프를 이미지로 저장하기

[2가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

[확인 문제]

Chapter 06 복잡한 데이터 표현하기

06-1 객체지향 API로 그래프 꾸미기

__pyplot 방식과 객체지향 API 방식

__그래프에 한글 출력하기

__출판사별 발행 도서 산점도 그리기

__[문제 해결 과정] 맷플롯립의 다양한 기능으로 그래프 개선하기

[3가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

[확인 문제]

06-2 맷플롯립의 고급 기능 배우기

__실습 준비하기

__하나의 피겨에 여러 개의 선 그래프 그리기

__하나의 피겨에 여러 개의 막대 그래프 그리기

__원 그래프 그리기

__여러 종류의 그래프가 있는 서브플롯 그리기

__[문제 해결 과정] 맷플롯립으로 복잡한 그래프 그리기

[좀 더 알아보기] 판다스로 여러 개의 그래프 그리기

[5가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

[확인 문제]

Chapter 07 검증하고 예측하기

07-1 통계적으로 추론하기

__모수검정이란

__표준점수 구하기

__중심극한정리 알아보기

__모집단의 평균 범위 추정하기: 신뢰구간

__통계적 의미 확인하기: 가설검정

__정규분포가 아닐 때 가설 검증하기: 순열검정

[문제 해결 과정] 표본 데이터에서 의사 결정 도출하기

[6가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

[확인 문제]

07-2 머신러닝으로 예측하기

__알아 두면 좋은 머신러닝 용어

__모델 훈련하기

__훈련된 모델을 평가하기: 결정계수

__연속적인 값 예측하기: 선형회귀

__카테고리 예측하기: 로지스틱 회귀

__[문제 해결 과정] 도서권수로 대출건수 예측하기

[좀 더 알아보기] 평균제곱오차와 평균절댓값오차로 모델 평가하기

[8가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

부록 A 한발 더 나아가기: 데이터베이스와 SQL

부록 B 이 책에서 배운 함수와 메서드

부록 C 에필로그

__확인 문제 정답

__찾아보기



책의 특징

이 책은 '어떻게 하면 파이썬으로 데이터 분석을 배우기 시작한 학습자가 더 쉽고 빠르게 익힐 수 있을까?'라는 고민에서 시작한 책으로, 독자 30명의 실제 학습 결과를 기반으로 만들어졌으며, 독자의 의견을 적극적으로 반영하여 한 단계 더 업그레이드한 데이터 분석 입문서이다. 이 책은 기본 편과 고급 편으로 나누어져 있는데 기본 편 1장~4장에서는 데이터 분석의 정의를 알아보고 데이터를 다루어본다. 직접 데이터를 수집한 후 정제하고 요약하는 과정을 통해 데이터의 특징을 확인할 수 있다. 1~2장에서는 현실에 있을 법한 재미있는 스토리와 함께 파이썬으로 데이터를 어떻게 다루는지 알아보고, API와 웹 스크래핑으로 인터넷상의 실제 데이터를 수집해본다. 3~4장에서는 본격적으로 데이터를 다루고, 잘못된 데이터를 다듬어 분석의 정확도를 올리고, 수집한 데이터의 특징을 알아내는 과정을 배운다. 고급 편 5장~7장에서는 수집한 데이터의 특징을 시각화를 통해 직관적으로 표현하고, 데이터 분석 결과를 도출하고, 데이터의 특징을 파악한 결과를 바탕으로 가설을 검정(검증)하고, 비즈니스 문제를 해결하고 미래를 예측하는 방법을 알아본다.

책의 장점

이 책은 종이의 질이 좋아 만지고 넘길 때 부드럽다. 책의 글자가 예쁘고 선명해서 보기가 편하다. 책 곳곳에 <note>와 <여기서 잠깐>, <좀 더 알아보기>라는 칸이 있어서 추가 정보를 얻을 수 있다. 또 중요한 문장은 보라색으로 색칠되어 있어서 다시 찾아보기가 편하며, 중요한 내용을 인지하기에 편리하다. 각 장마다 <마무리>라는 코너에서 쳅터의 내용을 다시 정리해주어, 다시 공부하기에 좋으며, 각 장마다 확인 문제가 있어서 확인 문제를 풀어보면서 실력을 더 키울 수도 있다. 책에 컬러로 된 그림이 많고 귀여운 캐릭터들이 알려주어서 이해하기 쉽게 도와준다. 또 책의 마지막 부분에는 <한발 더 나아가기>라는 코너가 있는데 A 코너에서는 데이터베이스와 SQL에 대한 지식을 추가로 배울 수 있는 기회를 제공하고, B 코너에서는 이 책에서 배운 함수와 메서드를 표로 정리해놓아서 다시 복습하고, 쉽게 찾아볼 수 있도록 도와준다.

책의 후기

책을 읽고 파이썬과 통계, 데이터분석에 대해서 복습하고 새로운 지식에 대해서 배울 수 있었다. 한빛미디어 출판사에서 혼공(혼자 공부하는)시리즈 책을 여러 권 많이 출판했는데, 나는 <혼자 공부하는 데이터 분석 with 파이썬> 책으로 혼공시리즈 책을 처음 입문했는데, 이 책이 상당히 괜찮은 책이라는 생각이 들어 다른 혼공시리즈 책도 읽어보고 공부하고 싶은 마음이 생겼다. 기회가 된다면 다른 혼공시리즈 책들도 구매해서 읽어봐야겠다. 그리고 책에 있는 내용과 페이스북으로 <혼공학습단>이라는 활동도 하는 것을 알게 되었다. 기회가 된다면 <혼공학습단> 활동에도 참여해봐야겠다.

'YES24 리뷰어클럽 서평단 자격으로 작성한 리뷰입니다.'



댓글(1) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
dltkddnjs150 2023-01-20 01:37   좋아요 0 | 댓글달기 | URL
혼자공부하는데이터분석,혼자공부하는데이터분석with파이썬,혼공,혼공시리즈,박해선,한빛미디어,한빛미디어출판사,서평,서평이벤트,yes24,yes24리뷰어클럽,데이터분석,파이썬,통계,데이터,혼공족,혼공파,혼공머신,머신러닝