파이썬 머신러닝 판다스 데이터 분석
오승환 지음 / 정보문화사 / 2019년 6월
평점 :
장바구니담기



이 책은 파이썬을 이용한 머신러닝에 대한 책이기 때문에 파이썬을 조금이라도 아닌 초,중급자를 대상으로 한다.
이 책의 예제를 실습해보기 위해서는 컴퓨터에 아래와 같은 개발환경이 갖춰져야 한다. 책의 처음부분을 참조하면 개발환경 준비에 대한 내용이 있으니 참조하면 좋을 것이다.

python: python 3.7.x 이상
anaconda : 2018.12
개발도구(IDE): spyder 3.3.x 이상
필수 라이브러리: Pandas, NumPy, Matplotlib, SciPy, scikit-learn

지금을 빅데이터의 시대라고 불러도 이상하지 않을 요즘 AI와 빅데이터 기술이 빠르게 발전되고 있다. 특히 빅데이터를 통한 기술은 사람들의 삶의 패턴을 바꾸고 있다. 많은 사람들이 빅데이터에 대한 기술을 배우고 있는데, 이 책에서 설명하는 판다스는 데이터를 수집하고 정리하는데 최적화된 도구라 말할 수 있다. 특히 배우기 쉬운 프로그래밍 언어라고 인식되는 파이썬을 기반으로 하기 때문에 진입 장벽도 높은 편이 아니다.

이 책은 파이썬에 대한 설명은 별도로 하지 않고 책 제목대로 판다스와 그외 필수 라이브러리를 활용한 머신러닝 구현 및 데이터 표현법을 중점적으로 설명하고 있다.


책의 목차를 보면 다음과 같다.

PART1 판다스 입문
PART2 데이터 입출력
PART3 데이터 살펴보기
PART4 시각화 도구
PART5 데이터 사전 처리
PART6 데이터프레임의 다양한 응용
PART7 머신러닝 데이터 분석

1장에서는 판다스에 대한 간단한 설명을 다루고 있다.
2장에서는 판다스를 이용하여 데이터를 읽어들이고 또 이를 출력하는 내용을 다루고 있다.
3장에서는 데이터프레임 형태의 데이터를 확인하고 판단스 내부 메쏘드, 내장 그래프 도구를 활용하는 방법을 다루고 있다.
4장에서는 외부 라이브러리를 통해 데이터를 그래프로 표시하는 방법을 설명한다.
5장에서는 수집한 데이터를 분석에 적합하도록 사전 처리(Preprocessing)하는 방법을 살펴본다.
6장에서는 데이터프레임의 함수 매핑, 그룹 연산, 다양한 형태의 구조 변경 등에 대한 설명을 다루고 있다.
마지막 7장에서는 이 책의 최종 목표인 머신러닝을 이용한 데이터 분석을 다루고 있다.

프로그래밍 관련 내용을 다룬 책이기 때문에 각 설명에는 그 설명을 확인하는 예제가 있고, 그 예제의 실행결과를 함께 보여주며 설명한다. 특히 7장에서의 머신러닝 데이터 분석은 머신러닝 프로세스에 따라 각 과정을 설명하고 있다.

머신러닝 프로세스
데이터 정리 -> 데이터 분리(훈련/검증) -> 알고리즘 준비 -> 모형 학습(훈련 데이터) -> 예측(감증 데이터) -> 모형 평가 -> 모형 활용


이 책 한권을 통해 전문가 수준은 아니어도 파이썬을 통해 머신러닝을 수행해봤다는 성취감을 느낄 수 있을 것이다.
이 책에 다뤄진 예제는 다음 URL을 참조하면 다운로드 받을 수 있다.

정보문화사 홈페이지 > 자료실 > 통합자료실
http://www.infopub.co.kr/


그리고 궁금한 사항은 저자의 블로그에 방문하여 Q&A 게시판을 활용하면 좋을 것 같다.
https://okkam76.blog.me/

리뷰어스클럽으로부터 도서만을 제공받아 주관적으로 작성한 서평입니다

#파이썬머신러닝판다스데이터분석 #파이썬머신러닝 #판다스 #pandas #IT #머신러닝 #데이터분석



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo