고객 니즈가 보이는 데이터 분석 with 파이썬 - 트렌드 분석자가 알려주는 실무 데이터 분석!
정인근 지음 / 길벗 / 2024년 4월
평점 :
장바구니담기


고객의 마음을 알수있다면 이것은  마케터뿐아니라 제품과 서비스를 제공하는 모든 사장님들의 마음일겁니다. <고객 니즈가 보이는 데이터분석 with 파이썬>는  떡볶이분석, 여성들의 건강고민, 최애쿠션찾기 등 실제 사례를 통해 자연어분석준비, 스크래퍼로 데이터수집, 수집한 데이터로 자연어분석 그리고 통계 마지막은 챗GPT를 사용하고 코랩실행법까지  실무로 데이터분석을 해서 마케팅의 의사결정에 이용하도록 했습니다. 파이썬을 모르는 분을 위해 초보적인 파이썬, 판다스 등의 사용법도 설명했고  통계를 통해 새로운 영역에 도전을 하고프도록 동기부여를 해두었습니다. 



저자는 정인근 와디즈 개발자입니다.  아모레퍼시픽에서 근무했고  AI서비스와 자연어처리분야에서 경력을 쌓으셨다고 하네요. 와디즈에 능력자들이 많으신듯합니다. 전에  마케팅팀분때문에 좋은 정보를 얻었는데요. 




고객니즈의 소스는 대부분 글로 되어 있습니다. 글은 자연어분석을 해야 합니다.  자연어분석은 다량의 글을 수집하고 분석해서 어떤 내용이 중요한지 파악하고 수치화하는 작업이라고 합니다.(18p) 즉 인간의 언어를 수치화해서 계산하는 방법입니다. 이 책을 끝까지 보고 실습까지 완료하면 자연어처리의 입구에는 들어선거죠. 코드편집기는 주피터노트북을 사용합니다. 이런 이유로 코랩도 사용이 가능합니다. 집이나 사무실에 AI서버를 두지 못하는 분은 코랩이 최고죠. 회사라면 월5만원짜리를 사용하면 몇일간도 사용가능합니다.  파이썬과 판다스는  실무에 사용할 수있는 것만 최소한으로 알려줍니다. 사실 파이썬이나 판다스 모두 실제 사용범위가 매우 넓고 판다스책도 1000P가 넘는 경우도 많습니다. 판다스는 데이터처리를 해주는 라이브러리죠. 여기에 넘파이는 덤으로 따라옵니다. 행렬을 처리해주는 라이브러리입니다. 이러한 기초부분은 필요한 함수만 꼭꼭 집어서 핵심만 정리해줍니다. 이를 경기도 인구데이터분석과 국민건강보험공단 진료내역종보전처리를 통해 익숙하게 실습하도록 돕니다. 




사실 있는 데이터만 전처리를 해서 데이터분석을 한다면 매우 편할겁니다. 그러나 현실은 그렇지 않죠.  인터넷에서 고객니즈와 관련된 데이터를 끌어 모아야죠. 주로 SNS자료를 퍼와야 하는데 그 기능이 스크래퍼라고 합니다. 성격은 좀 다르지만 크롤러라고도 합니다. requests.get함수를 통해 글 데이터를 수집하고 BeautifulSoup으로 html을 분석해서 데이터를 추출합니다. sns에 대부분 들어가있는 해시태그도 수집하여 처리도 가능합니다. 이를 통해 트렌드의 변화도 알수있는 거죠.   이를 좀더 깊게 분석을 할려면 계속 새로운 분석방법을 공부를 해야 합니다. 요즘 만큼 머신러닝 딥러닝의 방식이 계속 발전하는 분야도 드물겁니다.  현재는 의사결정트리모델, 로지스틱 회귀, 랜덤포레스트 등으로  다양하게 결과를 보지만 앞으로 계속 분석법은 나올겁니다. 



이 책은 고객니즈의 데이터를 수집하여 전처리하고 분석하는 과정을 배웁니다. 이러한 과정을 자연어처리과정이라고도 합니다. 인공지능은 요즘 컴퓨터비전과 자연어처리로 크게는 양분되어 있죠. 이 중에서 자연어처리를 이용한 데이터처리를 배웁니다.  컴퓨터비전은 용량도 크고 자료를 모으는데도 힘든걸 생각하면 자연어처리로 sns자료의 데이터를 수집하여  고객니즈를 아는 것이  현실적으로 사용범위가 넓을 겁니다.  데이터분석도 자주 해보는사람만이  전문가로  우뚝설수있지 않을까요. 



본 도서는 출판사로부터 무상으로 제공받아 주관적인 리뷰를 했습니다. 



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo