-
-
혼자 공부하는 데이터 분석 with 파이썬 - 1:1 과외하듯 배우는 데이터 분석 자습서 ㅣ 혼자 공부하는 시리즈
박해선 지음 / 한빛미디어 / 2023년 1월
평점 :
해당 책은 파이썬을 통한 데이터 분석 을 하는 방법을 점점 수준을 높여가며 하나의 프로젝트를 마치는 느낌으로 책이 완성 되어있다.
![](https://image.aladin.co.kr/Community/paper/2023/0124/pimg_7932441523721930.png)
chapter1. 데이터 분석
데이터 분석을 시작하는 단계에서는 데이터 분석을 하기 위한 기초 지식을 다루고 있다.
구글 코랩과 도서 데이터는 이책의 마지막까지 따라 다닌다.
꼭 학습해야될 내용이다.
import gdown
gdown.download('https://bit.ly/3eecMKZ','남산도서관 장서 대출목록 (2021년 04월).csv', quiet=False)
Downloading...
From: https://bit.ly/3eecMKZ
To: /content/남산도서관 장서 대출목록 (2021년 04월).csv
100%|██████████| 58.1M/58.1M [00:00<00:00, 96.4MB/s]
남산도서관 장서 대출목록 (2021년 04월).csv
import chardet
with open('남산도서관 장서 대출목록 (2021년 04월).csv', mode='rb') as f:
d = f.readline()
print(chardet.detect(d))
with open('남산도서관 장서 대출목록 (2021년 04월).csv', encoding='euc-kr') as f:
print(f.readline())
print(f.readline())
번호,도서명,저자,출판사,발행년도,ISBN,세트 ISBN,부가기호,권,주제분류번호,도서권수,대출건수,등록일자,
"1","인공지능과 흙","김동훈 지음","민음사","2021","9788937444319","","","","","1","0","2021-03-19",
import pandas as pd
df = pd.read_csv('남산도서관 장서 대출목록 (2021년 04월).csv', encoding='euc-kr', low_memory=False)
df.head()
gdown 을 통해 csv파일을 다운받아
![](https://image.aladin.co.kr/Community/paper/2023/0124/pimg_7932441523721932.png)
해당 csv read 로 데이터를 읽어온다.
df.to_csv('ns_202104.csv')
with open('ns_202104.csv') as f:
for i in range(3): print(f.readline(), end='')
![](https://image.aladin.co.kr/Community/paper/2023/0124/pimg_7932441523721935.png)
3번째 라인까지 해당 데이터를 읽어온다.
ns_df = pd.read_csv('ns_202104.csv', low_memory=False)
ns_df.head()
![](https://image.aladin.co.kr/Community/paper/2023/0124/pimg_7932441523721936.png)
ns_df = pd.read_csv('ns_202104.csv', index_col=0, low_memory=False)
ns_df.head()
![](https://image.aladin.co.kr/Community/paper/2023/0124/pimg_7932441523721938.png)
첫번재 열을 데이터 프레임의 인덱스로 지정한다.
2장 api사용하기
![](https://image.aladin.co.kr/Community/paper/2023/0124/pimg_7932441523721942.png)
해당 챕터에서는 api를 활용하기위한 기본적인 다뤄야되는 내용들에 대해 다룬다.
전체 책의 내용을 다 다루지는 못했지만 해당 csv파일을 가지고 수집 , 정제, 시각화 까지 점점 데이터 분석을 완성해 나가는데
통계와 머신러닝까지 데이터를 분석한다.
하나의 과제를 끝낸느낌으로 책을 끝낸다.
데이터를 시작부터 마지막까지 어떻게 데이터를 분석해야되는지 알려주는 책이다.
다양한 데이터 방법을 배우기위한다면 해당책을 추천한다.