-
-
프로젝트 30개로 완성하는 데이터 분석 - 파이썬의 필수 기능을 활용하여
곽경일 지음 / 위즈앤북 / 2024년 6월
평점 :
-출판사에서 책을 제공받아 작성한 리뷰입니다-
<프로젝트 30개로 완성하는 데이터 분석>은 파이썬과 데이터 분석, 챗GPT 등의 활용법에 대해 담아놓은 책이다. 데이터 분석 이론을 실전과 업무에 적용하는 방법을 기초부터 차근차근 알려주는 책이다. 파이썬 기초를 제목과 같이 30가지의 프로젝트를 배우면서 활용하는 방법을 익힐 수 있도록 되어 있다.
<프로젝트 30개로 완성하는 데이터 분석>에서는 가장 먼저 파이썬 기본 개념과 특징을 알려주고 파이썬 아나콘다에 대해서도 소개한다. 아나콘다 파이썬을 어떻게 설치해야 하는지 그 과정을 차근차근 보여주며 가상환경의 설치화 실행, 쥬피터 노트북의 설치와 실행 등 파이썬 기초를 배우기 위한 준비과정부터 돕는다.
파이썬 프로그래밍의 기초로 변수와 주석, 자료형의 종류와 코드 설명 등에 대해서도 가볍게 알려준다.
<프로젝트 30개로 완성하는 데이터 분석>의 2부에서 다루고 있는 프로젝트는 다음과 같다. 웹에 있는 정보 가져오기, 여러 페이지 정보 자동으로 가져오기, 웹의 표 데이터 가져오기, 3년 연속 배당금이 상승한 기업 찾기, 데이터프레임 합치기, 제한된 웹사이트에서 데이터 수집하기, 빈도 분석하기, 워드 클라우드 그리기, Chat GPT를 활용한 클릭율 높이는 블로그 작성하기, QR코드 이미지 생성하기, 머신러닝 분류 모델 만들기 등 다양한 분야의 기초적인 프로젝트가 나와 있다.
<프로젝트 30개로 완성하는 데이터 분석>의 첫 번째 프로젝트는 '웹에 있는 정보 가져오기'이다. 데이터 분석에 대한 책인만큼, 가장 복잡하고 중요한 과정 중 하나가 '데이터 수집'이기 때문이다. 파이썬 프로그래밍을 활용하여 다음 웹 사이트에 있는 로또 복권 당첨 번호의 데이터를 수지하는 방법에 대해 알아본다.
프로젝트 실습 준비 과정과 주의사항, 프로젝트를 실행하는 과정, 코드 설명과 실행 결과에 대해 자세히 나와 있기 때문에 책에서 설명하는 대로 차분히 따라하면 원하는 결과를 도출할 수 있다.
3년 연속 배당금이 상승한 기업 찾기 프로젝트도 있다. 이처럼 주식투자를 할 때 자료분석을 하는 데에도 파이썬을 활용한다면 유의미한 정보를 도출할 수 있다. 형태소 분석을 통해 데이터에서 중요한 키워드나 주제어를 추출할 수도 있고, 이를 바탕으로 글의 주제나 트랜드를 자동으로 파악하고 그룹화하는 것도 가능하다.
데이터 내에서 단어의 빈도를 분석한 후 워드 클라우드로 단어들을 시각적으로 표현할 수도 있다. <프로젝트 30개로 완성하는 데이터 분석>의 '워드 클라우드 그리기'프로젝트를 해 보면 매년 네이버 블로그에서 제공하는, 내 블로그의 1년 동안의 인기 키워드 분석하기와 유사한 결과를 만들 수 있다. 여기서 더 나아가 워드 클라우드를 예쁘게 꾸미면 하트 모양으로도 만들 수 있다.
파이썬을 이용한 기초 프로젝트를 하나씩 실행해 보면서, 데이터 분석에 익숙해지고 싶다면 또는 업무에 파이썬을 어떻게 활용해야 할지 고민이 된다면 <프로젝트 30개로 완성하는 데이터 분석>를 하나씩 실습해 보면서 파이썬에 익숙해져 보는 것을 추천한다.