코딩 자율학습 잔재미코딩의 파이썬 데이터 분석 입문 - Pandas, Plotly 사용부터 생성형 AI 활용법까지 한 권으로 배우는 데이터 분석 입문 코딩 자율학습
데이브 리 지음 / 길벗 / 2025년 4월
평점 :
장바구니담기


본 도서는 출판사로부터 무상으로 제공받아 주관적인 리뷰를 했습니다. 



AI가 본격화 되면서 빅데이터분석이 4차산업혁명의 핵심으로 떠올랐습니다. 지금도 많은 기업들이 자사의 다양한 데이터를 모아서 데이터사이언티스트에게 회사에 유용한 인사이트를 뽑아달라고 합니다. 요즘 노코딩 분석방법도 많이 소개되고 있지만 파이썬을 이용한 데이터분석은 정통이라고 할수있습니다. 파이썬은 가장 많이 사용되는 프로그램언어이기도 하고 다른 방면으로 사용할 수도 있기에 배워두면 매우 유용한 언어일겁니다. <코딩 자율학습 잔재미코딩의 파이썬 데이터분석입문>은 데이터분석, 시각화를 공부하고 실제 데이터를 이용한 실습과 ㅓ데이터 기반 의사결정 능력 강화로 영화, 부동산, 마케팅 데이터를 다뤄서 이 책을 통해 더 높은 단계로 올라갈수있는 단단한 계단을 마련할 수있습니다. 



저자는 Dave Lee 노이먼스 CTO십니다. 이력이 문이과를 왕래를 하셨군요. 고대 일문과를 나오셔서 연세대 컴퓨터공학 석사를 하셨습니다. 삼성전자와 쿠팡에서 20년간 개발자를 하셨다고 합니다. PM도 하시고요. 잔재미코딩이라는 유튜브채널도 운영중이십니다. 



데이터 분석은 데이터수집-데이터저장-전처리와 분석-의사결정-시각화 순으로 이루어져있습니다. 이 과정에서 흥미를 잃지 않고 잘 따라하도록 만드는 것이 중요하죠. 책의 코딩을 직접 따라 하려면 아나콘다의 주피터 노트북을 설치를 해야 합니다. 저자는 실제 설치하는 화면캡쳐부터 주코딩창인 주피터노트북의 활용법까지 소개합니다. 파이썬을 하려면 기본문법과 데이터구조를 배우는데 조건문, 반복문,함수등을 그리길지는 않지만 깔끔하게 설명해주고 데이터구조로 리스트, 튜플, 딕션어리,세트를 구분하는 매우 중요한 부분을 설명합니다. 사실 여기서 소개하는 기본문법과 데이터구조를 모르면 단계를 나갈 수가 없습니다. 칸이 널직널직하게 볼수있어서 좋습니다. 



Pandas 라이브러리는 데이터분석의 핵심이죠. 이를 잘해야 시각화나 의사결정추론이 가능한 형태를 만들수가 있고, 실제 분석하고 싶은 데이터를 다루는데 가장 중요한 범주죠. 이를 위해 시리즈와 데이터프레임을 다루는 법과 판다스를 통해 데이터를 불러오고 전처리까지는 이를 잘못하면 분석결과가 좋을 수가 없습니다. 데이터분석에서 전처리는 노가다라고 합니다. 실제 데이터분석작업의 거의 80%이상이 아닐까합니다. 그래서 파이썬보다는 판다스를 이용해서 데이터를 자유자재로 다룰 수있도록 자세히 다룹니다. 파이썬의 대표적인 시각화라이브러리로 떠오르는 Plotly를 이용해서 히스토그램, 막대그래프를 그려봅니다. 



기업에서는 주로 마케팅부서에서 데이터분석을 많이 하게 되는데, 직접 캐글에 올려있는 마케팅 캠페인 성과데이터를 통해서 구매전환율, 지역별 고객획득 비용등을 분석해봅니다. 실제 이런 실습이 실력향상과 실무에 사용할 수있는 능력을 길러줄겁니다. 마지막은 심화버전으로 영화데이터, 부동산데이터, 전자상거래 데이터를 한단계 더 들어가서 분석합니다. 입문서이지만 실제 데이터분석을 할 수있게 했고, 사실 데이터분석의 거의 80%가 이수준이 아닐까합니다. 빅데이터분석기사시험을 보면 모델링부분이 빠져있는데, 이 입문서를 통해 모델링까지 갈수있는 준비가 완성될 겁니다. 



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo