파이썬 머신러닝 판다스 데이터 분석 - 개정판
오승환 지음 / 정보문화사 / 2024년 6월
평점 :
장바구니담기



AI 기술이 하루가 다르게 발전하고 있는데, 그 기반을 이루고 있는 머신러닝 라이브러리도 빠르게 개정버전이 릴리스되고 있다. 이번에 만난 정보문화사의 '파이썬 머신러닝 판다스 데이터분석' 개정판은 머신러닝에서 사용되는 판다스 라이브러리의 2.0 개정버전을 이용하여 개정판이 출간되었다.




이 책의 저자 오승환님은 국내 주요 금융기관과 대기업에서 기업분석 및 전략기획 업무를 담당하고 있는데, IT 비전공자이지만 데이터 분석과 인공지능을 독학으로 익혔고, 현재 핀테크 스타트업 대표이자 인공지능 강사로 활동중이다.



​이 책은 데이터 분석과 머신러닝을 배우려는 파이썬 초,중급자를 대상으로 데이터 분석에 필요한 필수 라이브러리 판다스와 기타 라이브러리를 소개하고 있다. 그리고 다양한 예제코드를 책 속에 수록하여 데이터 분석 실습을 통해 사용법에 익숙해지도록 했다. 수학과 통계학 이론에 대한 비중을 낮추고 실습에 필요한 최소한의 내용만 포함했다.



데이터 분석에 필요한 개발환경을 설정해야 하는데, 아나콘다 배포판을 설치하면 판다스, 넘파이, 맷플롯립 등 필요라이브러리가 설치되고, 개발도구는 주피터 랩을 선택하여 설치하면 된다.


PART 1에서는 판다스입문으로 데이터과학자가 판다스를 배우는 이유와 판다스를 이용하여 자료구조를 학습하는 과정으로 구성되어 있다.


PART 2에서는 CSV, Excel, JSON 파일을 읽거나 저장하고 API를 활용해 데이터를 수집하는 데이터 입출력를 학습한다.


PART 3에서는 데이터프레임 구조를 알아보고 판다스에서 지원하는 통계함수와 판다스 내장 그래프 도구를 확인해본다.


PART 4에서는 시각화 도구로 Matplotlib와 Seaborn 라이브러리를 실습해보고, Folium 라이브러리를 활용하여 지도에 표시하는 실습도 해본다.


PART 5에서는 누락 데이터, 중복 데이터 처리와 데이터 정규화 등 데이터 사전 처리와 시계열 데이터를 활용하는 방법을 학습한다.


PART 6에서는 데이터프레임의 다양한 응용 방법을 학습한다.


마지막 PART 7에서는 판다스를 활용한 회귀분석, 분류, 군집 등 머신러닝 데이터 분석을 학습한다.



책 속에 실습 예제코드가 많이 수록되어 있어 개념도 익히고, 실습을 많이 하면서 익히면 좋을 것 같다는 생각이 들었다. 저자의 경험에 비추어보면 전공자는 물론 비전공자도 포함하여 누구나 데이터 과학자가 될 수 있다고 한다. 책 속의 설명과 예제코드를 차근차근 실습하다보면 파이썬 데이터 분석에 익숙해지고 점점 전문가의 길로 들어설 수 있다고 응원하고 있다. 파이썬 데이터 분석에 입문하고자 하는 분들에게 이 책을 추천한다.




출판사로부터 도서를 제공받아 작성한 리뷰입니다


​#파이썬머신러닝판다스데이터분석개정판 #파이썬데이터분석 #판다스 #머신러닝 #네이버북유럽카페


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo