데이터 천재들은 어떻게 기획하고 분석할까? - 직관을 넘어 핵심을 꿰뚫는 데이터 분석의 절대 법칙
조성준 외 지음 / 21세기북스 / 2022년 3월
평점 :
장바구니담기


이 책의 띠지에 이런 말이 있다.

'대한민국 AI · 빅데이터 분야를 이끄는 조성준 서울대 교수와 국내 최고 석학들의 절대 실패하지 않는 실전 데이터 분석법 대공개!'

(책 띠지 중에서)

아마 그 말을 보면 이 책에 호기심이 생길 것이다. 나도 마찬가지로 그 말을 보고 이 책에 관심이 생겼기 때문이다.

물론 제목 자체도 '데이터 천재들은 어떻게 기획하고 분석할까?'라는 질문으로 되어 있어서 거기에 대한 답을 알고 싶어진다. 하지만 일반인인 나에게 '데이터'는 주어져도 활용하지 못하는 무용지물 같은 것이니, 전문가들의 이야기를 들어보고 그들의 노하우를 차근차근 배워보고 싶은 생각이 들었다.

정말로 데이터 천재들은 어떻게 기획하고 분석하는지, 직관을 넘어 핵심을 꿰뚫는 데이터 분석의 절대 법칙을 알고 싶어서 이 책 『데이터 천재들은 어떻게 기획하고 분석할까?』를 읽어보게 되었다.



이 책은 조성준·조재희·김성범·이성임·조성배·이영훈 공동 저서이다. 조성준 서울대학교 산업공학과 교수, 조재희 광운대학교 정보융합학부 교수, 김성범 고려대학교 산업경영공학부 교수, 이성임 단국대학교 정보통계학과 교수, 조성배, 연세대학교 컴퓨터과학과 교수, 이영훈 서울과학기술대학교 산업공학과/데이터사이언스학과 교수가 이 책의 저자들이다.

데이터의 의미와 데이터를 바라보는 관점, 핵심 분석 방법인 시각화, 예측, 클러스터링, 그리고 이미지와 텍스트 데이터의 분석 방법 등은 전공과 무관하게 누구나 이해하고 활용할 수 있어야 한다. 빅데이터는 미래가 아니라 현재 우리의 일상에서 일어나는 일이고, 기업과 공공기관에서는 이를 활용해 중요한 의사결정을 하고 있기 때문이다. 무엇보다 이제 빅데이터는 더는 '알면 좋은' 대상이 아닌 '모르면 안 되는' 대상이 되었다. (10쪽 발췌)

이 책은 총 6부로 구성된다. 1부 '데이터 문맹 탈출, 반드시 알아야 할 데이터 상식', 2부 '데이터 시각화로 트렌드를 읽어라', 3부 '분류와 예측, 미래를 읽는 가장 확실한 방법', 4부 '데이터를 끼리끼리 뭉쳐 보는 군집분석의 힘', 5부 '인공지능, 더 빠르고 능숙하게 이미지를 분석하다', 6부 '비즈니스 성패를 가르는 텍스트 데이터에 주목하라'로 나뉜다.



이 책은 저자들이 한 부씩 맡아서 총 6부의 이야기를 엮은 것이다. 그렇게 보았을 때 자칫 보고서 형식으로 오해할 수 있겠다. 하지만 그렇지 않았다. 오히려 학생들에게 기본적인 부분부터 차근차근 가르쳐주는 느낌이 드는 책이어서, 어렵다는 생각이 들지 않고 부담 없이 편안하게 읽을 수 있었다.

데이터 마이닝, 즉 분석이란 무엇일까? 이를 이해하기 위해서는 먼저 '데이터'가 무엇인지 알아야 한다. 분석에서의 데이터는 우리가 흔히 말하는 '빅데이터'를 의미한다. 그렇다면 빅데이터는 무엇일까? 빅데이터는 VVV, 즉 3V로 설명할 수 있다. 3V는 바로 Volume, Velocity, Variety를 말한다. 이 중 'Volume'은 양이 많다는 것, 'Velocity'는 생성 속도가 빠르다는 것, 'Variety'는 다양성을 뜻한다. (19쪽)

이렇게 가장 기본적인 것부터 시작하여 쉽게 이해할 수 있도록 예를 들어 자세하게 풀어서 설명해주니 이해의 폭이 넓어진다. 어려울 거라 짐작하고 두려워하는 마음을 싹 잠재워주는 책이다.




서울대 조성준 교수를 포함한 여섯 명의 어벤저스급 필진이 모였다. 이 사실만으로도 우리는 이 책에 주목할 필요가 있다. 지난 30여 년간 국내 인공지능과 데이터 마이닝 분야를 이끌어온 석학들의 경험과 노하우가 이 책에 고스란히 녹아 있다. 데이터 분석이 멀게만 느껴지는 비전공자와 일반인에게 전문가들이 쌓아놓은 높은 진입장벽을 넘어설 수 있도록 도와주는 최고의 입문서다.

_황보현우, 하나금융지주 그룹데이터총괄 겸 하나은행 데이터&제휴투자본부장

'여섯 명의 어벤저스급 필진'이라는 점에 주목해 보아도 되겠다. 그리고 그 어벤저스급 필진이 일반인이자 데이터를 잘 알지 못하는 사람들의 눈높이에 맞추어 설명을 이어나가니, 이 정도면 이해할 수 있겠다는 마음으로 읽어나갈 수 있다. 마음의 장벽을 허물고 하나씩 짚어가며 이해의 폭을 넓힌다.

이 책은 입문서이다. 친절한 길잡이가 되어주는 책이다. 점점 데이터를 활용하는 시대로 나아가고 있으니, 이제는 정말 데이터는 꼭 알아야 하는 시대가 도래했다. 그런데 이제라도 데이터에 대해 알고 싶지만 무엇부터 보아야 할지 막막할 때에는 이 책을 기본서 삼아서 읽어나가면 되겠다.




댓글(0) 먼댓글(0) 좋아요(3)
좋아요
북마크하기찜하기 thankstoThanksTo