누구나 파이썬 - 너도 데이터 가지고 놀 수 있어!, 전면개정판
민형기 지음 / 잇플ITPLE / 2020년 1월
평점 :
장바구니담기


문재인 정부 들어서서 4차산업혁명에 관련된 인공지능, 빅데이터, 핀테크, 자율주행자동차 등이 두드러지게 각광받고 있다. 인공지능과 빅데이터에서 데이터 분석을 위해 사용하는 언어가 파이썬과 R이 있다. 파이썬은 오픈소스이면서 로직이 간단하고 다루기 쉽다. 특히 파이썬으로 만들어진 각종 라이브러리들이 다양하고 기능이 강력하여 데이터 분석에 유리하다.


저자는 파이썬을 위한 첫걸음으로 아나콘다와 주피터를 소개하고 있다. 아나콘다는 파이썬을 위한 통합환경을 제공하고 있으며 가상환경을 자유자재로 만들 수 있어서 개발자 입맛에 맞는 개발환경을 구축할 수 있다. 또한 아나콘다에서 쉽게 설치 활용 가능한 주피터 개발환경은 우리에게 익숙한 웹 환경에서 개발 즉시 결과를 확인해 볼 수 있다.


파이썬의 자료구조는 인터넷에 널려 있는 각종 데이터를 읽어 들여 편리하게 조회 및 가공할 수 있다. 책에서는 파이썬의 DataFrame, Dict, list 형의 특징과 사용법을 자세히 설명하고 있다. 데이터 분석을 하고자 한다. 데이터분석을 위한 첫 걸음으로 파이썬에서 제공하는 자료구조는 자유자재로 다룰 수 있어야 한다.


'서울시 청소년 정신건강 분석'에서는 pandas 라이브러리가 제공하는 DataFrame은 2차원 표 형식을 제공한다. '운동량 데이터 분석해 보기'에서는 list 자료형을 저장하고 for 문을 이용해서 하나씩 처리하는 방법을 설명하고 있다.'얼굴인식 등의 이미지 관련 API 사용'에서는 dict형과 데이터를 주고 받을 때 자주 사용하는 json 형식을 설명하고 있다.


데이터 마이닝은 말 그대로 데이터로부터 숨겨진 법칙을 찾기 위한 데이터 분석 분야다. 저자는 루트와 가지, 잎으로 구성된 트리 구조를 이용하여 규칙을 찾아나가는 의사결정 트리를 사용한다. 또한 과거의 연속형 데이터를 이용하여 미래의 추세를 구하는 회귀분석 기법도 설명하고 있다.


여러 각종 분석 주제에 맞는 데이터 형태, 분석의 목적, 분석 기법을 선정하여 독자가 데이터를 친숙하게 다룰 수 있도록 쉽게 설명하고 있다. 책의 제목처럼 누구나 파이썬을 이용하여 데이터를 편하게 가지고 놀 수 있도록 예제가 풍부하다.



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo