-
-
데이터 천재들은 어떻게 기획하고 분석할까? - 직관을 넘어 핵심을 꿰뚫는 데이터 분석의 절대 법칙
조성준 외 지음 / 21세기북스 / 2022년 3월
평점 :
데이터분석은 이제 이공대생뿐만 아니라 인문계출신들도 필수가 되고 있습니다. <데이터 천재들은 어떻게 기획하고 분석할까?>는 데이터분석부터 인공지능까지 어떤방식으로 분석하고 활용하고 분류가 어떻게 되는지 데이터분석과 인공지능이 궁금한 초보들에게 유익한 방향과 방법론을 설명합니다. 실제 데이터분석과 인공지능을 배우면 수식과 코딩을 하다보면 목적과 공부하는 이유를 잃을 때가 있습니다. 이 책을 통해 수식을 최소화하여 전반적인 기초 개념을 파악할 수있게 해줍니다.
대표저자는 조성준 서울대 산업공학과 교수이고 서울대 데이터마이닝센터 센터장입니다. 얼마전에 <빅데이터 커리어 가이드북>을 재미있게 봤던 기억이 있습니다. 조재희 광운대 정보융합학부 교수이고 창업지원센터장을 역임하셨습니다. 김성범 고려대 산업경영공학부교수이고 데이터마이닝이론과 응용분야에 200여편의 논문을 발표했습니다. 이성임 단국대 정보통계학과 교수는 서울대 통계학과에서 생존분석으로 박사를 했습니다. 조성배 연세대 컴퓨터과학과 교수는 연세대 AI대학원 원장이십니다. 두말이 필요없는 인공지능 전문가시네요. 이영훈 서울과학기술대 산업공학과 교수는 서울대 산업공학과 박사로 데이터마이닝을 연구하셨습니다.
데이터가 중요하다는 건 이제 많은 사람들이 압니다. 인공지능에게는 핵심이 데이터죠. 그런데 그 과정은 모르는 경우가 많습니다. 빅데이터에서 인사이트를 뽑고 여기에서 가치를 확인하는 것이 바로 데이터 분석입니다. 사실 처음 데이터분석을 대하는 사람은 무엇을 분석할지 혼란스러울수있습니다. 이를 해결하기위해 14가지의 예시를 들어줍니다. 실사용 예시는 데이터분석으로 무엇을 하지 방향을 보여주는 거죠. 이것의 방향은 의사결정입니다 의사결정을 위해 어떤 단계를 밟게 되는지 확인할 수있습니다.
데이터분석에서 '시각화'는 매우 중요한 단계입니다. 표로 보여주면 사람들이 무슨의미인지 알기 힘듭니다. 그래서 그래프를 통해 데이터를 표시하면 사람들의 이해와 설득에 매우 유용합니다. 나이팅게일은 장미 다이어그램을 통해 야전병원의 환경개선 자금을 받았습니다. 시각화도 데이터에 맞는 방식을 제시합니다. 데이터분석과 인공지능에 있어서 분류와 예측은 기본적인 방법론입니다. 이를 위해서 함수를 이해해야 하고 파라미터 등 관련 용어를 이해하면 실제 학습을 할때 배움의 과정이 덜 힘들겁니다.
분류와 예측을 배웠으면 군집화를 배워야 합니다. 이는 클러스터링이고 비지도학습입니다. 군집은 본격적으로 인공지능이 작동하는 방법이고 이를 통해 인공지능스스로 데이터를 분류하여 인사이트를 얻을수있는데 특히나 유사하고 다름이 명확하면 성능이 높아진다고 합니다. 그리고 본격적으로 인공지능이 활약을 한 이미지분석과 텍스트데이터 분석방법도 원리를 확인합니다. 이는 컴퓨터비전이나 자연어처리로 현재 인공지능을 이끌고 있는 방법론의 기초를 습득해줍니다.
부록으로 Q/A를 마련해서 컴튜팅과 알고리즘의 차이, 통계와 인공지능의 다른점, 딥러닝의 발전 등 인공지능을 배우는 사람들이 궁금해할 내용도 담았습니다. 인공지능은 계속 발전하고 끊임없이 공부를 해야 전문가로 성장할 수있는 분야입니다. 이를 위해서는 기초가 탄탄해야 발전의 과정을 쉽게 따라갈수있을 겁니다. 저자들은 데이터를 다루는 전반적인 방법과 활용을 위해 필요한 핵심을 선정하여 전달해줍니다.
본 도서는 출판사로부터 무상으로 제공받아 주관적인 리뷰를 했습니다.