-
-
파이썬 머신러닝 판다스 데이터 분석 - 개정판
오승환 지음 / 정보문화사 / 2024년 6월
평점 :
‘데이터관련 직무를 하고 있다면’
_

수년전 데이터 관련 역량을 증진시키기 위해 데이터 시각화 강의를 판교에 가서 수강한 적이 있습니다. 당시는 데이터 관련 지식도 부족하고 경험도 일천한 관계로 시각화 관련하여 어떤 툴을 전문으로 역량을 쌓아야 할지 물어봤는데 당시 강사분께서 한 대답이 아직도 기억납니다. “조금씩 다 하시고 그 중에 가장 잘할 수 있는 것을 만드셔야 합니다” 좀 더 시간이 지나보니 해당 강사님의 말에 동의하게 됩니다. 데이터관련 직무를 한다면 결국 하나의 전문적인 영역을 처음부터 하는것보다 사업기획도, 분석도, 시각화도, 통계학적 지식도, 프론트엔드 백엔드 영역도 다할 줄 알아야 합니다. 모든 것이 유기적으로 연결되어있다보니 어느 하나만 해서는 차별화를 가질 수도 없습니다. 끊임없이 해당 분야에 대해 학습하고 역량을 늘려가야 주도적인 프로젝트 수행이 가능합니다. <파이썬 머신러닝 판다스 데이터 분석>을 만난 이유도 여기에 있습니다.

본서는 2019년 출간 이후 판다스 2.0에 대한 개정내용과 더불어 최신트렌드 내용을 가미한 신간입니다. 파이썬을 어느정도 다루는 분들이라면 판다스는 당연히 함께해야하는 데이터 분석 라이브러리이며 본서는 판다스의 기본 구조와 더불어 데이터 입출력 이후 Matplotlib에 연결되는 데이터시각화 도구를 사용하는 법과 실전 예제를 통한 데이터 전처리와 시계열 데이터 만들기, 이런 과정을 통해 만들어낸 데이터프레임을 활용하여 머신러닝 데이터 분석까지 진행하는 특정 데이터를 가지고 진행할 수 있는 프로세스일원화를 다루고 있는 서적입니다.
많은 데이터 혹은 프로그래밍 관련 서적은 정독보다는 발췌독이 유용한 경우가 많은 편입니다. 기초적인 내용을 알고 있다면 해당 내용을 넘어가고 실습예제풀이를 하거나, 아니면 관련 분야만 찾아서 본 뒤 프로젝트에 활용을 하는 등으로 넘어가는 것입니다. 하지만 본서의 경우 데이터분석과 머신러닝의 기초까지를 다루는 서적으로 발췌독보다는 각 파트별로 적어도 하루정도의 시간을 갖고 일주일 정도 책을 따라하면서 실습을 하는 것이 낫다는 생각입니다. 다행인것은 별도의 행간없이 본서의 내용자체가 상세하게 기술되어있기 때문에 책만 보고 따라해도 큰 무리가 없다는 사실입니다. 도식화가 잘 되어있어 텍스트로만 나와있는 내용보다도 이해하기 쉽다는 장점이 있습니다.
데이터 관련 직무를 하고 있는 분들이나, 이제 막 해당 영역의 업무나 자기계발을 시작한 분들이라면 본서와 같은 서적이 처음에는 지겹고 힘들지언정 일단 2-3권 정도를 실습하면서 독파를 하게되면 그 다음부터는 자기가 원하는 분야쪽은 깊이 파고들면 그게 실력이 됩니다. 저 역시 그 과정을 진행하고 있는 관계로 본서를 통해 계속 관련 영역을 확장중입니다.

‘완전 초보자를 대상으로 하지는 않습니다’
*출판사를 통해 도서를 지원받아 작성한 리뷰입니다