파이썬 머신러닝 판다스 데이터 분석 - 개정판
오승환 지음 / 정보문화사 / 2024년 6월
평점 :
장바구니담기


요즘 LLM인 챗GPT, 클로드, 제미나이가  프로그램을 짜줍니다. 물론 아직은 초보적인 프로그램만 가능하고  제대로 된 코딩은 기존 개발자가 많은 수정을 해가면서 완성이 가능하다고 합니다.  하지만 원리를 아는 사람과 모르고 챗GPT를 다루는 사람의 프로그램 결과물은 크게 다르며 시간도 단축도 상당히 다릅니다.  모른다고 안다의 차이는 결국 인공지능에 관해 공부를 하느냐안하느냐의 차이겠죠.  원리를 알고 챗GPT를 하는 사람이 좋은 결과를 산출할 수밖에 없습니다.  그 첫번째 능력이 데이터분석이라고 생각합니다. 현재 생성형AI시대로 빠르게 진입하고 있지만 4차산업혁명의 핵심이자 근원은 빅데이터분석일 수밖에 없습니다. 그래서  <파이썬 머신러닝 판다스 데이터분석(개정판)>은 파이썬언어로 판다스를 이용해서 데이터분석과 시각화까지 함께 공부할 수있게 했습니다. 



저자 오승환 대표는 핀테크스타트업과 인공지능강사를 하시는 분입니다. 과학고와 서울대를 졸업했고 중국에서 MBA를 하셨습니다. 금융기관과 대기업에서 전략기획업무를 담당했지만 소위 it 비전공자이면서  데이터분석과 인공지능을 독학으로 전문가가 되신 분입니다. 저의 멘토이신분이네요. 유튜브  판다스 스튜디오도 운영을 하십니다. 어디보죠. 34개의 알찬강의와 이 책의 해설영상도 올라와 있습니다. 꼭 보시길 바랍니다. 




판다스가 작년에 2.0이 나온 모양입니다.  기본적으로 최신판은  처리속도가 개선이 되었다고 합니다. 업그레이드는 기존 업그레이드방식을 사용합니다. 매우 쉽습니다.  이론만 설명이 되어 있는 것이 아니라 철저히 실습을 같이 할수있도록 했습니다.  그리고 판다스 자료구조, 인텍스, 블린인텍스 등을 배우고 판다스로 자료 입출력, 통계분석, 시각화처리, 그리고 가장 시간을 많이 들인다는 전처리과정, 데이터프레임과 머신러닝 활용법까지를 다룹니다. 이정도면  데이터를 불어오고 전처리하고 분석하여 시각화해서 인사이트를 꺼내는데는 문제가 크게 없으며  데이터분석을 자신의 스펙으로 삶아도 문제가 없을 겁니다. 그만큼 실습으로 방법을 익숙하게 하는데 많은 부분을 할애했기 때문입니다. 프로그램은 직접해야봐야 머리와 손에 익숙해지는 것이 확실하죠. 




이론을 익히는데 있어서 그림이 많이 사용되는데 대도록이면 칼러를 다양화해서 어떻게  진행되는지 신경을 썼습니다. 사실  프로그램을 익히는데는 동영상이 가장좋죠.  분명 책이 한계가 있습니다. 이를 극복하기위해  저자가 독자의 입장에서 책을 썼고 '여기서 잠깐'이라는 작은 코너를 두어서  프로그램을 배울때 생기는 팁을 배치해서 좀더 깊이 있게 알도록 해두었습니다.  데이터분석 자격증에 관심있는 독자는 '빅데이터분석기사'실기에 대비로도 완벽할 것으로 봅니다. 



IT비전문가라면 파이썬하면  애매한 측면이 있죠. 프로그래밍도 가능하고 데이터분석도 되고 인공지능도 된다고 하고 하면 혼란스러워집니다. 원래 프로그래밍을 위한 언어이기는 합니다만 여기에 라이브러리기능이 도입되어 데이터분석, 시각화, 인공지능 등을 쉽게 시도할 수있게 한겁니다. 특히나 머신러닝분야는 기존 통계분석의 연장으로 보지만  지도학습과 비지도학습으로 '학습'에 중점을 두고 있습니다. 이를 통해 기존의 회귀분석, 분류문제를  SVM,의사결정트리로 해결하고 비지도학습으로  군집으로 K-Means까지 배울수있게 했습니다.  매우 좋은 내용을 가졌지만 파이썬에 대한 설명은 거의 없기에 파이썬책은 한권정도 읽고 이 책에 도전해야 한다는 장벽은 존재합니다. 





댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo