파이썬 라이브러리를 활용한 데이터 분석
웨스 맥키니 지음, 김영근 옮김 / 한빛미디어 / 2023년 5월
평점 :
장바구니담기


이 책은 제목처럼 파이썬을 이용하여 데이터를 분석하는 방법에 대해 설명하는 책이다

. 세상에는 많은 언어가 존재하지만 특히 파이썬은 범용적으로 사용할 수 있는 스크립

트 언어이면서도 저수준 언어로 개발된 레거시 라이브러리들을 손쉽게 불러 사용할 수

 있기 때문에 데이터 분석 및 머신러닝 분야에서 많이 사용되고 있다. 즉, 파이썬이라

는 언어를 통해 높은 사용성을 얻을 수 있을 뿐 아니라 기존의 저수준 레거시 라이브>러리를 사용하여 높은 성능도 얻을 수 있기 때문에 과학 계산용으로 인기가 높다.


거의 700페이지에 달하는 두꺼운 책이다 보니 개발 환경 구축 및 파이썬의 기초부터 데이터 분석 시 사용되는 라이브러리들의 사용법 데이터 조작 방법 마지막으로는 실제 데이터를 분석 예제를 통해 이해를 돕고 있다.


데이터 분석에 사용되는 파이썬 라이브러리들 * Numpy: 대부분의 과학 계산 어플리케이션에서 필요한 라이브러리를 제공한다. 고성>능 산술 계산 도구 * pandas: 구조화된 데이터나 표 형식의 데이터를 직관적이고 유연하게 다룰 수 있는 자료구조와 함수 제공 * Matplotlib: 그래프나 2차원 데이터 시각화를 제공하는 라이브러리 * IPython, Jupyter: 대화형 파이썬 실행 도구 * SciPy: 과학 계산 영역의 여러 기본 문제를 다루는 패키지 * scikit-learm: 범용 머신러닝 도구 * statsmodels: R 언어용 회귀분석 모델 작업을 기반으로 만들어진 통계분석 패키지


책의 목차

* 시작하기 전에

* 파이썬 기초, Ipython과 주피터 노트북

* 내장 자료구조, 함수, 파일

* 넘파이 기본: 배열과 벡터 연산

* 판다스 시작하기

* 데이터 로딩과 저장, 파일 형식

* 데이터 정제 및 준비

* 데이터 준비하기: 조인, 병합, 변형

* 그래프와 시각화

* 데이터 집계와 그룹 연산

* 시계열

* 파이썬 모델링 라이브러리

* 데이터 분석 예제

* 고급 넘파이


전반적인 책의 내용은 처음부터 손쉽게 따라할 수 있는 튜토리얼 형식의 책이라기 보>다는 오히려 레버런스나 사용자 가이드에 가까운 성격의 책이라는 생각이 들었다. 개>인적으로 데이터 분석 입문자라면 다음의 순서로 책을 읽기를 추천한다.


* 1장 ~ 3장까지는 실습 및 파이썬 언어에 대한 기초적인 내용이므로 순서대로 정독한다.

* 13장으로 넘어가서 데이터 분석 예제를 보면서 데이터 분석 라이브러리를 통해 어떤 일을 할 수 있는지 감을 익힌다.

* 13장의 데이터 분석 예제에서 사용하는 여러 라이브러리와 기능들을 보고 사용법과 

기능들을 앞의 해당 장으로 가서 간단한 예제 코드들을 실습하면서 익힌다.

* 자신의 주변에서 얻을 수 있는 데이터들을 가지고 이 책에 설명된 각종 데이터 분석 기능들을 사용하여 유의미한 내용을 찾아본다. 모르는 것은 그때그때 책이나 인터넷>을 통해 공부하면서 실제 업무에 적용해본다.


파이썬은 회사 업무에서 사용해보았기 때문에 큰 문제는 없었지만 데이터 분석과 관련

된 각종 수학적 지식들에 대한 이해도가 낮아 이 부분이 이 책을 읽은데 가장 어려운 점이었다. 그래서 역으로 실제 실생활에서 얻을 수 있는 데이터를 가지고 이 책에서 >설명된 예제를 참고하여 기능을 하나씩 적용하다보면 좀더 데이터 분석 기능에 익숙해

지지 않을까 생각한다.


"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo