파이썬 머신러닝 판다스 데이터 분석 - 개정판
오승환 지음 / 정보문화사 / 2024년 6월
평점 :
장바구니담기


데이터 분석을 열심히 해보고 싶은데 혼자 어떻게 해볼까, 하고 전전긍긍하고 있는 마음만 바쁜 초보 취미 프로그래머입니다. 이것저것 알아보다가 보니 파이썬을 활용하여 데이터를 분석하는 판다스라는 것이 있더라구요. 그리고 판다스에 대해 공부할 수 있는 책이 있고, 이번에 개정판이 나왔다는 것도 알게 되었습니다. 마이크로소프트의 엑셀과도 비슷한 점이 많아 활용하기도 쉽다고 하네요.


저자의 이름이 좀 많이 친숙했습니다. 야구선수의 이미지가 떠오르더군요. 그것과는 별개로 저자는 상당한 경력을 보유하고 있습니다. 제가 눈여겨 본 것은 비전공자이지만 독학으로 익혀 강사로 활동하고 있다는 점인데요. 독학으로 배웠기에 독학으로 배울 사람들이 짚고 넘어가야 할 점 등을 잘 가르쳐 줄 수 있을 것이라는 확신이 들었습니다.


아무것도 모르는 초보자 대상이 아닌, 어느 정도 프로그래밍의 경험이 있는 사람을 대상으로 하되, 파이썬 초중급자부터 배울 수 있다고 합니다. 엑셀이 익숙하다면 따라가는데 큰 무리가 없다고 하는데, 이는 대부분의 교수님(?)들이 생각하는 것과 비슷하였습니다. 이것 참 쉽지 않니? 하시던 교수님의 말씀이 귓가에 맴도네요.

환경을 준비하기 위한 절차를 설명한 부분입니다. 아나콘다부터 설치하고 주피터 랩 사용법을 설명한 뒤, 각종 필수 라이브러리를 설치합니다. 이렇게 하면 시작의 준비가 다 된 것입니다. 시작이 반이라고 하니 이미 저자와 함께 반을 한 셈이네요!



프로그래밍 책답게 어마어마한 내용이 들어가 있습니다. 파트 1부터 파트7까지 상세히 분류가 되어 있습니다. 판다스에 입문하여 알아봐야 하는 것들, 우선 왜 판다스가 좋은지부터 해서 데이터입출력과 같이 기본 중에 기본인 내용, 데이터를 뜯어 보는 방법에 데이터 사전 처리, 시각화, 응용법까지 잘 설명되어 있습니다. 물론 내용을 보면 각종 프로그래밍 언어와 숫자로 가득차 있겠지만, 프로그래밍 책은 다 그렇지 않나 싶네요.



그래도 모든 부분이 프로그래밍을 위한 숫자와 명령어로 도배되어 있거나 그렇지 않고, 위에 보여드리는 것처럼 도식화 한 부분이 많이 있습니다. 독학으로 배우신 분답게 독학으로 배우는 사람들을 위한 배려라는 생각이 드네요. 물론 기초 프로그래밍 지식은 있어야 이해가 갈 듯합니다. 어느 정도 시간과 공을 들여서 공부해야 따라갈 수 있겠네요. 저도 물론 충분한 시간을 들여 공부해야겠다고 마음 먹었습니다.


디지털 공간이 어느새 익숙해진 우리에게 데이터의 중요성, 그 중에서도 빅데이터라는 것이 우리에게 얼마나 중요한지 이제 다들 느끼고 계실 것이라고 생각합니다.

판다스는 프로그래밍과 관련 없다고 생각하는, 프로그래밍을 하지 않는 분들이라면 굳이? 하는 생각이 들 것이라는 생각이 드는데요. 엑셀을 활용하실 수 있는 분들이라면 판다스를 활용하는데 큰 무리가 없다고 생각합니다.

시간을 투자하면 그만한 가치가 있을 것이라고 생각합니다. 특히 빅데이터 활용이 필요하시다면요.

저자는 독학으로 하셨다지만, 유튜브에는 저자가 올린 몇 가지 강의가 있습니다. 이 책과 관련된 강의는 아직 하나이지만, 앞으로 더 올라오길 기대합니다.


(5) 판다스 스튜디오 - YouTube



프로그래밍을 시작하신, 하고 계신 모든 분들께

이 책과 함께 성장하는 기회가 있었으면 합니다.


이 서평은 컬처블룸 카페의 소개로 서적을 제공받아 주관적으로 작성하였습니다.







댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo