-
-
데이터 천재들은 어떻게 기획하고 분석할까? - 직관을 넘어 핵심을 꿰뚫는 데이터 분석의 절대 법칙
조성준 외 지음 / 21세기북스 / 2022년 3월
평점 :

4차 산업 혁명의 바탕이 되는 것은 바로 빅데이터이다. 빅데이터는 생각보다 더 이전부터 언급되어온 것이지만 얼마 전부터 급부상하기 시작한 느낌이 든다. 빅데이터란 말 그대로 방대한 양의 데이터를 말한다. 그냥 데이터가 아닌 빅데이터인 이유는 그 양이 기가바이트는 물론이고 기본 테라바이트를 넘는 양이기 때문이다. SNS가 활발한 만큼 하루에도 엄청난 양의 데이터가 생성되고 있다. 하지만 빅데이터를 가지고 있는 것만으로는 더 이상 경쟁력을 갖출 수 없다. 이미 많은 공공데이터 포털에서 누구나 빅데이터를 수집할 수 있기 때문이다. 빅데이터를 분석하여 가치를 만들어내는 것이야말로 4차 산업 혁명 시대의 진정한 경쟁력이라 할 수 있다.

그러면 종류도 많고 양도 방대한 빅데이터를 어떻게 분석해야 할까? 이 책은 6개의 부로 나누어져 있으며, 여섯 명의 빅데이터 전문가들이 각 한 부마다 등장하여 다양한 데이터 분석법을 설명한다. 1부에서는 먼저 반드시 알아야 할 데이터 상식을 설명하며, 2부에서부터 본격적으로 데이터 분석법이 나온다. 데이터를 분석하는 가장 쉽고 효과적인 방법은 시각화이다. R이나 파이썬을 통해 박스 플롯을 만들거나, 엑셀이라는 비교적 친근한 프로그램으로 그래프를 만드는 등 지금 당장 데이터를 시각화할 수 있다. 3부와 4부에서는 더 깊이 들어가 분류와 예측, 그리고 군집이라는 방법을 가지고 머신러닝, 의사결정 나무 등 더 전문적인 용어들을 통해 인공지능에 더 가까이 다가가게 된다. 그러면 이 인공지능이라는 것은 무엇일까?

5부에서는 인공지능에 대한 설명이 나온다. 알파고가 인공지능인 건 알겠는데, 어떻게 탄생한 것인지, 인공지능이 어디에 쓰일 수 있는지 등을 비전공자도 충분히 이해할 수 있는 쉬운 설명으로 알려준다. 위에서도 언급했듯이 SNS가 활발한 덕분에 하루에도 엄청난 양의 데이터가 생성된다. SNS라 하면 개인의 SNS뿐만 아니라 기사, 커뮤니티 등 모든 것이 해당되며, 이러한 것들은 모두 텍스트를 기반으로 탄생한다. 즉, 가치를 만들어낼 수 있는 빅데이터는 대부분 텍스트 데이터이며, 이를 분석하는 것이야말로 인사이트를 도출하고 트렌드를 분석할 수 있게 되는 것이다. 바로 6부에서 비즈니스의 성패를 가르는 텍스트 데이터에 대한 설명이 나온다.

이렇듯 이 책은 데이터 분석을 통해 가치를 창출하는 다양한 예와 방법을 어떠한 기준에 맞게 분류해서 설명하거나 항목을 나눈 것이 아닌, 호기심의 흐름대로 설명을 하고 있다. 그래서 비전공자인 내가 읽기에도 잘 읽혔으며, 전문 용어들이 종종 등장하나 내용을 이해하는 데에 문제가 되지 않았다. 빅데이터가 무엇인지 아는 것도 중요하지만, 이를 어떻게 써먹느냐가 정말 중요하다. 교양 지식수준으로 빅데이터가 무엇인지 알고 싶은 사람, 그리고 데이터 분석에 입문하고자 하는 비전공자, 이미 관련 분야를 배우고 있거나 관련 분야에 종사하고 있는 사람 등 모두에게 추천하고 싶은 책이다.
출판사로부터 책을 제공받아 작성된 서평입니다.