혼자 공부하는 데이터 분석 with 파이썬 - 1:1 과외하듯 배우는 데이터 분석 자습서 혼자 공부하는 시리즈
박해선 지음 / 한빛미디어 / 2023년 1월
평점 :
장바구니담기


해당 책은 파이썬을 통한 데이터 분석 을 하는 방법을 점점 수준을 높여가며 하나의 프로젝트를 마치는 느낌으로 책이 완성 되어있다.



chapter1. 데이터 분석

데이터 분석을 시작하는 단계에서는 데이터 분석을 하기 위한 기초 지식을 다루고 있다.

구글 코랩과 도서 데이터는 이책의 마지막까지 따라 다닌다.

꼭 학습해야될 내용이다.




import gdown gdown.download('https://bit.ly/3eecMKZ','남산도서관 장서 대출목록 (2021년 04월).csv', quiet=False) Downloading... From: https://bit.ly/3eecMKZ To: /content/남산도서관 장서 대출목록 (202104).csv 100%|██████████| 58.1M/58.1M [00:00<00:00, 96.4MB/s] 남산도서관 장서 대출목록 (202104).csv import chardet with open('남산도서관 장서 대출목록 (2021년 04월).csv', mode='rb') as f: d = f.readline() print(chardet.detect(d)) with open('남산도서관 장서 대출목록 (2021년 04월).csv', encoding='euc-kr') as f: print(f.readline()) print(f.readline()) 번호,도서명,저자,출판사,발행년도,ISBN,세트 ISBN,부가기호,,주제분류번호,도서권수,대출건수,등록일자, "1","인공지능과 흙","김동훈 지음","민음사","2021","9788937444319","","","","","1","0","2021-03-19", import pandas as pd df = pd.read_csv('남산도서관 장서 대출목록 (2021년 04월).csv', encoding='euc-kr', low_memory=False) df.head()


gdown 을 통해 csv파일을 다운받아



해당 csv read 로 데이터를 읽어온다.

df.to_csv('ns_202104.csv') with open('ns_202104.csv') as f: for i in range(3): print(f.readline(), end='')


3번째 라인까지 해당 데이터를 읽어온다.

ns_df = pd.read_csv('ns_202104.csv', low_memory=False) ns_df.head()


ns_df = pd.read_csv('ns_202104.csv', index_col=0, low_memory=False) ns_df.head()



첫번재 열을 데이터 프레임의 인덱스로 지정한다.

2장 api사용하기


해당 챕터에서는 api를 활용하기위한 기본적인 다뤄야되는 내용들에 대해 다룬다.

전체 책의 내용을 다 다루지는 못했지만 해당 csv파일을 가지고 수집 , 정제, 시각화 까지 점점 데이터 분석을 완성해 나가는데

통계와 머신러닝까지 데이터를 분석한다.

하나의 과제를 끝낸느낌으로 책을 끝낸다.

데이터를 시작부터 마지막까지 어떻게 데이터를 분석해야되는지 알려주는 책이다.

다양한 데이터 방법을 배우기위한다면 해당책을 추천한다.







댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo