-
-
파이썬 라이브러리를 활용한 데이터 분석
웨스 맥키니 지음, 김영근 옮김 / 한빛미디어 / 2023년 5월
평점 :

이제 파이썬은 전문 개발자든 아니든, 이공계든 인문계든 직업, 전공, 나이 상관 없이 많은 사람들이 사용하고 있는 #프로그래밍 언어가 되었다. 워낙 폭넓게 다양한 곳에서 쓰이다 보니, 마치 일반상식처럼 되어 가고 있다 느낀다.
요즘 인기인 챗GPT가 프로그램도 짜준다고 하지만, 모든 걸 다 알아서 해주는 것은 아니기에 적어도 인공지능이 제대로 만들었는지 알아 볼 수 있는 실력은 갖추고 있어야 한다. 결국 #파이썬 언어 기초 정도는 숙지할 필요가 있다는 것이다.

그래서 파이썬을 배우려는 분에게 도움이 되는 책 한 권을 소개해 보려 한다. 바로 '파이썬 라이브러리를 활용한 데이터 분석'이라는 책이다. 책 제목에도 나타나 있듯이 각종 라이브러리를 접하고 데이터를 다루는데 특화된 책이다. 이렇게 말하니 벌써 전문적인 냄새가 풍겨, 입문자에게는 어려운 책이 아닌가 할 수 있는데, 먼저 읽어 본 입장에서 그리 부담 가지지 않는 책이라 생각한다. 이미 다른 프로그램 언어를 경험했거나, 파이썬 초급 문법 책 정도 봤다면, 별 부담이 진도를 나갈 수 있을 것이고, 그런 경험이 없더라도, '파이썬 라이브러리를 활용한 데이터 분석'에 나온 설명대로 차분히 따라 할 수 만 있다면, 입문자도 충분히 볼 수 있는 책이다.
그도 그럴 것이 책의 3분에 1 이상이 되는 246쪽에 걸쳐 파이썬 설치와 기초 문법, 산술 계산에 가장 기본이 되는 #넘파이, 데이터를 다루기에 보다 좋은 #판다스 기초를 설명하고 있기 때문이다. 번역도 잘되어 있어, 문장들이 어색하지 않고 자연스러워 이해하기도 편하다.

그리고 파이썬을 배우려는 분에게 이 책을 추천하는 또 다른 이유는 책의 메인 주제가 데이터 분석, 데이터를 다룬다는 점이다. 프로그램을 배우면 배울 수록 알겠지만, 어딜 가나 데이터 다루는 것이 기본이다. 텍스트 자료, 엑셀 파일 등을 불러서 목적에 맞게 가공하고, 그것으로 실시간 저장 또는 그래프로 표현하거나, 분석하여 문서화 하거나 다른 기기에 피드백을 주는 등 프로그래밍에서 데이터 작업이 참 많은 부분을 차지한다. #빅데이터, #인공지능 에서 활용도 두말하면 잔소리다. 그러니 #파이썬라이브러리를활용한데이터분석 이 실전 프로그래밍을 배우는데 요긴한 책인 것이다.

여기서 한 가지 더 좋은 점은 내 경험 상, 프로그래밍 실력을 보다 빨리 쌓는 지름길은 어떤 목적이나 주제를 정해 프로그램을 개발해 보는 것이라 생각하는데, 이 책은 데이터 분석이 메인 주제라서 관련된 기술, 라이브러리를 종합적으로 만나볼 수 있고, 이를 이용해 그래프도 그려보고, 시계열 분석도 해본다. 마지막 장에서는 영화 평점, 이름 통계, 선거 데이터 이용과 같은 것을 간단히 해보며, 실전 개발의 경험도 느낄 수 있게 된다.

'파이썬 라이브러리를 활용한 데이터 분석'을 통해 얻을 수 있는 #프로그램 지식을 나열해 보면, 일단 파이썬 문법은 기본이고, 파이썬에서 가장 기본이 되는 산술 계산 #라이브러리 넘파이, 구조화 된 데이터나 표 형식의 데이터를 다루는데 빠르고 편한 판다스, 2차원 데이터 시각화 라이브러리, 맷플롯립, 대화형 환경을 위해 개발된 IPython, 과학계산을 위한 사이파이, 머신러닝 도구 사이킷런, 통계분석 패키지 statsmodels, patsy 등 매우 다양한 것을 다루는 방법을 배우게 된다. 여기에 추가로 부록편에서는 넘파이와 IPython의 좀 더 깊은 기능도 배운다.

게다가 저자 웨스 맥키니는 판다스 프로젝트 초기에 많은 역할은 한 사람이라서 그런지, 책 곳곳에서 판다스 관련 정보와 다양한 활용을 잔뜩 만날 수 있어서 판다스를 제대로 익히는데 많은 도움이 된다.
그리고 책을 보면 알겠지만, 무조건 뭐가 좋다, 파이썬이 최고, 그런 주장을 하지 않는다. 파이썬을 사용하는 이유, 사용하면 안 되는 이유를 나눠 설명하고 있고, 많은 라이브러리의 장단점, 어떻게 쓰는 것이 효율적인지 균형감을 갖춘 조언을 담고 있다. 경험 적은 프로그래머나 입문자에게 올바른 안내를 해주고 있다.

이래저래 '파이썬 라이브러리를 활용한 데이터 분석' 입문자, 초급자에게 많은 도움을 주는 내실 있는 책이다. 3판까지 나온 이유를 말하지 않아도 알 거 같은 책이다. 이번 3판은 최신의 버전과 정보를 반영했다고 한다. 아울러 이번 3판도 이전 1, 2판을 번역한 김영근 역자가 다시 맡은 책이라서 더욱 잘 다듬어져 나왔다 느껴진다.
'파이썬 라이브러리를 활용한 데이터 분석'은 단순히 정보만 제공하는 것이 아니라, 저자의 프로그래밍 경험을 함께 나눈 책이다. 각종 개발에 기본이 되는 데이터 다루는 기술을 차근차근 배울 수 있는 책이다. 파이썬 프로그래밍 능력이라는 벽돌을 하나씩 하나씩 튼튼하게 쌓는데 매우 적당한 #학습서 이다. 파이썬을 배우려는 분에게 적극 추천한다.