파이썬 라이브러리를 활용한 데이터 분석
웨스 맥키니 지음, 김영근 옮김 / 한빛미디어 / 2023년 5월
평점 :
장바구니담기












데이터 사이언티스트 가장 기본 중 하나가 데이터 분석이다



부트 캠프에서 공부하면서



가장 어려운 것도 데이터 분석이었지만



팀 과제 수행할 때



가장 재밌었던 시간도 데이터 분석하며 토론하는 것이었다



A라는 데이터가 있을 때 컴퓨터 공학 전공자도 있지만, 비전공자들도 있기에



각자 살아온 길이 다르고 데이터를 보는 시각도 달라서



이런 데이터를 이렇게 볼 수도 있구나 재밌게 느꼈다



하지만 데이터를 분석을 하려면



내가 데이터를 분석하는 방법을 알아야 하는데



난 아직 그 수준에 도달하기에 부족하기에



이번 달 서평 책을 데이터 분석 책으로 선택했다



사실 데이터 분석 관련 책이 한 권 있긴 하지만 데이터 분석에 대해 깊이 파고드는 책은 아니고



데이터 분석이란 이런 거야~라고 보여주는 책이라서



딱 데이터 분석이 뭔지 모르는 사람에게 알려주는 정도라



데이터 분석 공부에 갈증이 있었는데



이번 [파이썬 라이브러리를 활용한 데이터 분석] 책을 통해



그 갈증이 어느 정도 해소된 것 같아서 좋았다



책의 목차는 다음과 같다



총 13챕터, 부록이 2강이 수록돼있다



책은 파이썬의 기본과 주피터 노트북 사용법 설명까지



3장에 걸쳐서 할애해서 파이썬을 아예 모르는 사람이 아니라면



충분히 읽을 수 있을 것 같은 난이도라 생각했는데



한빛 출판사 홈페이지를 가서 난이도를 확인하니



초중급으로 돼있어서 딱 그 정도인 것 같았다



(여러분이 한빛 출판사 책을 사게 된다면 한빛 출판사 공식 홈페이지에 가면



책에 따른 난이도를 적어놨으니 확인해 보기 바란다)





난 이 책을 읽으면서



다른 건 몰라도



numpy, pandas, matplotlib 만큼은 제대로 공부하자고



생각하고 책을 펼쳤다



데이터 분석 라이브러리 기본 3가지를



제대로 다룰 수 있다면 앞으로 배울 많은 내용들에



살을 붙일 것이라 생각하고 그렇게 목표를 잡고 책을 읽으니



서평 기간 동안 수박 겉핥기로 읽는 것보다 일정 부분을 집중적으로 공부하며 읽으니



더 재밌게 실습하며 책을 읽었던 것 같다



당연하지만 워낙 유명한 책이라 예제 코드가 제공된다



https://github.com/wesm/pydata-book



GitHub - wesm/pydata-book: Materials and IPython notebooks for "Python for Data Analysis" by Wes McKinney, published by O'Reilly Media이미지 썸네일 삭제

GitHub - wesm/pydata-book: Materials and IPython notebooks for "Python for Data Analysis" by Wes McKinney, published by O'Reilly Media

Materials and IPython notebooks for "Python for Data Analysis" by Wes McKinney, published by O'Reilly Media - GitHub - wesm/pydata-book: Materials and IPython notebooks for "Pyth...


github.com




난 예제 코드를 받지 않고,



일부러 책의 실습 내용들을 일일이 적으며 공부했다



코드 타이핑은 개발자의 기본이기 때문에



아는 내용이 있어도 적으면서 공부하니 더 잘 머리에 들어온 것 같다



책은 Numpy와 Pandas, Matplotlib에 대해 자세히 기술하고 있어서



읽으며 실습하는데 시간이 꽤 걸렸다



책의 흐름은 데이터 분석에 맞게 기술돼 있기 때문에




파이썬을 배우고 - 넘파이 - 판다스 - 데이터 로딩과 저장 후



본격적인 데이터 분석(Matplotlib 포함)으로 들어간다



데이터 분석에서도



데이터 분석하는 방법만 나오는 게 아닌



NaN이 무엇인지



isna가 무엇인지



용어 설명도 함께 돼있어서 정말 좋았다



난이도 초중급이 읽기에 딱이었다





데이터에 누락된 데이터를 골라내거나,



데이터베이스 스타일리로 데이터 프레임을 합치는 등



정말 데이터 분석에 기본이 되는 내용들이 잘 기술돼 있었다




이외 시계열 기초, 파이썬 모델링, 데이터 분석 예제, 고급 넘파이 까지 있어서



정말 두고두고 봐야 하는 데이터 분석의 교과서 같은 책이었다



이 책은 파이썬을 어느 정도라도 할 줄 알고



데이터 분석에 관심이 있거나 데이터 분석 쪽 직무를 원하는 사람이라면



누구에게든 추천할 책이다




여러분도 데이터 분석이 어려웠다면



[파이썬 라이브러리를 활용한 데이터 분석] 책으로 공부해 보자







한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다





댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo