월 20달러로 고용하는 데이터 분석가 with 챗GPT - 코드 한 줄 없이 기초 통계부터 분석, 예측까지 누구나 프로처럼, 생활 AI
테리엇.Bob Lee 지음 / 한빛미디어 / 2024년 10월
평점 :
장바구니담기


이번 달에 읽은 책은 <월 20달러로 고용하는 데이터 분석가 with 챗GPT>이다.

데이터분석 강의를 하는 나로서는 제목이 끌려서 고른 책.

기존의 AI와 생성 AI의 차이점은 이제 많은 사람들이 알고 있을 것 같다. 할루시네이션을 주의해야 한다는 것도.

이 책은 챗GPT를 사용하기 위해 계정을 만드는 것부터 하나 하나 알려준다.

기본적인 프롬프트를 입력하는 방법부터 Data Analyst를 이용하는 방법, GPTs를 만들고 활용하는 방법도 차근차근 설명한다. 다음은 Data Analyst를 활용하는 사례이다.

PDF파일의 내용을 요약하고, PPT개요를 구성해서 다운로드 할 수 있는 파일 형태로 저장해주도록 할 수도 있다. 물론 다시 손보지 않아도 될 정도로 예쁘게 만들어 주는 것은 아니고 가장 기본적인 내용들을 채워준다. 내용을 다듬거나 더 풍성하게 하는 것은 사용자의 몫.

일단 책의 진행이 처음부터 두 사람의 대화로 이루어져 있는데, 두께가 좀 있는 책인데 계속 대화식으로 진행되니 나는 읽으면서 좀 답답한 면이 있었다. 앞부분은 대부분이 이미 알고 있는 내용들이라서 일단 큰 제목들만 훑었다. 하지만 아주 많은 사람들이 챗GPT를 한 번도 사용해 본 적이 없고, 어디에서 사용하는 건지, 어떻게 사용하는 건지조차 알기가 어려워서 그렇다는 말도 들었다. 그런 사람들에게는 친구나 상사가 옆에 딱 달라붙어 하나하나 가르쳐주는 것 같은 느낌을 받을 수도 있겠다. 즉, 챗GPT를 단 한 번도 사용해 본 적이 없는 사람에게도 진입 장면이 없다.

 

1/3 지점부터는 본격적으로 데이터 분석에 관한 이야기가 나온다. 용어에 대한 설명도 깨알같이 하고, 데이터의 종류, 그래프의 종류, 데이터 샘플링에 관한 이야기. 이 책에서 언급하고 있는 기능들을 다 사용해 보려면 제목처럼 '월 20달러(부가세 포함 22달러)'를 지불해야 하는 부담은 있다.^^

 

분석의 절차에 대해서도 알려주기는 하지만 사실 독자는 챗GPT에게 분석 절차나 주의할 점 등을 물어볼 수 있다. 챗GPT는 항상 친절하다. 어떤 때는 기대했던 것 이상의 답변을 준다. (수다스럽다) 이때 필요한 것이 프롬프트를 잘 쓰는 능력이다. 그리고 또 하나 앞에서도 언급했던 할루시네이션을 잘 구별해 내는 능력이다. 데이터 분석의 초보자에게는 할루시네이션의 늪에 빠지지 않기 위해 좋은 책이 필요한 것 아닐까. 비록 할루시네이션이 있다고 해도 때로는 챗GPT가 내가 생각하지 못했던 새로운 관점을 보여주기 때문에 충분히 활용할 가치는 있다. 게다가 이제는 '검색' 기능이 추가되지 않았나.

 

데이터를 파일 형태로 업로드하고 기술 통계량 확인, 중복 데이터 처리, 결측값 처리, 이상치 처리, 데이터 샘플링 등 전처리를 한 결과를 파일 형태로 다운로드 할 수도 있다.

본격적인 데이터 분석이 시작되는 부분부터는 본인이 관심 있는 데이터세트를 가지고 직접 실습을 따라하면 된다. 앞에서도 얘기했듯이 두 사람의 대화 형태로 계속 이어가기 때문에 내 입장에서는 읽기에 조금 답답한 면이 있었다.

내가 생각하는 챗GPT를 이용한 데이터 분석의 가장 큰 미덕은, 원시데이터로부터 기술통계량을 뽑아내는 것이 프롬프트 한 줄이면 된다는 것, 각 항목이 무엇을 의미하는지 모르면 대화형으로 바로 다시 질문할 수 있다는 것, 전체 데이터를 다 읽지 않아도 데이터로부터 인사이트를 뽑아준다는 것, 파이썬, AWS, MySQL, Django 등이 뭔지 전혀 몰라도 분석과 예측이 가능하다는 것이 아닐까 싶다. 물론 이보다 장점이 더 많다. 단, 결과를 사용하는 것은 사용자의 몫이다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo