-
-
파이썬 머신러닝 판다스 데이터 분석 - 개정판
오승환 지음 / 정보문화사 / 2024년 6월
평점 :
데이터 분석을 열심히 해보고 싶은데 혼자 어떻게 해볼까, 하고 전전긍긍하고 있는 마음만 바쁜 초보 취미 프로그래머입니다. 이것저것 알아보다가 보니 파이썬을 활용하여 데이터를 분석하는 판다스라는 것이 있더라구요. 그리고 판다스에 대해 공부할 수 있는 책이 있고, 이번에 개정판이 나왔다는 것도 알게 되었습니다. 마이크로소프트의 엑셀과도 비슷한 점이 많아 활용하기도 쉽다고 하네요.


저자의 이름이 좀 많이 친숙했습니다. 야구선수의 이미지가 떠오르더군요. 그것과는 별개로 저자는 상당한 경력을 보유하고 있습니다. 제가 눈여겨 본 것은 비전공자이지만 독학으로 익혀 강사로 활동하고 있다는 점인데요. 독학으로 배웠기에 독학으로 배울 사람들이 짚고 넘어가야 할 점 등을 잘 가르쳐 줄 수 있을 것이라는 확신이 들었습니다.

아무것도 모르는 초보자 대상이 아닌, 어느 정도 프로그래밍의 경험이 있는 사람을 대상으로 하되, 파이썬 초중급자부터 배울 수 있다고 합니다. 엑셀이 익숙하다면 따라가는데 큰 무리가 없다고 하는데, 이는 대부분의 교수님(?)들이 생각하는 것과 비슷하였습니다. 이것 참 쉽지 않니? 하시던 교수님의 말씀이 귓가에 맴도네요.

환경을 준비하기 위한 절차를 설명한 부분입니다. 아나콘다부터 설치하고 주피터 랩 사용법을 설명한 뒤, 각종 필수 라이브러리를 설치합니다. 이렇게 하면 시작의 준비가 다 된 것입니다. 시작이 반이라고 하니 이미 저자와 함께 반을 한 셈이네요!


프로그래밍 책답게 어마어마한 내용이 들어가 있습니다. 파트 1부터 파트7까지 상세히 분류가 되어 있습니다. 판다스에 입문하여 알아봐야 하는 것들, 우선 왜 판다스가 좋은지부터 해서 데이터입출력과 같이 기본 중에 기본인 내용, 데이터를 뜯어 보는 방법에 데이터 사전 처리, 시각화, 응용법까지 잘 설명되어 있습니다. 물론 내용을 보면 각종 프로그래밍 언어와 숫자로 가득차 있겠지만, 프로그래밍 책은 다 그렇지 않나 싶네요.

그래도 모든 부분이 프로그래밍을 위한 숫자와 명령어로 도배되어 있거나 그렇지 않고, 위에 보여드리는 것처럼 도식화 한 부분이 많이 있습니다. 독학으로 배우신 분답게 독학으로 배우는 사람들을 위한 배려라는 생각이 드네요. 물론 기초 프로그래밍 지식은 있어야 이해가 갈 듯합니다. 어느 정도 시간과 공을 들여서 공부해야 따라갈 수 있겠네요. 저도 물론 충분한 시간을 들여 공부해야겠다고 마음 먹었습니다.

디지털 공간이 어느새 익숙해진 우리에게 데이터의 중요성, 그 중에서도 빅데이터라는 것이 우리에게 얼마나 중요한지 이제 다들 느끼고 계실 것이라고 생각합니다.
판다스는 프로그래밍과 관련 없다고 생각하는, 프로그래밍을 하지 않는 분들이라면 굳이? 하는 생각이 들 것이라는 생각이 드는데요. 엑셀을 활용하실 수 있는 분들이라면 판다스를 활용하는데 큰 무리가 없다고 생각합니다.
시간을 투자하면 그만한 가치가 있을 것이라고 생각합니다. 특히 빅데이터 활용이 필요하시다면요.
저자는 독학으로 하셨다지만, 유튜브에는 저자가 올린 몇 가지 강의가 있습니다. 이 책과 관련된 강의는 아직 하나이지만, 앞으로 더 올라오길 기대합니다.
(5) 판다스 스튜디오 - YouTube
프로그래밍을 시작하신, 하고 계신 모든 분들께
이 책과 함께 성장하는 기회가 있었으면 합니다.
이 서평은 컬처블룸 카페의 소개로 서적을 제공받아 주관적으로 작성하였습니다.
