-
-
그림으로 배우는 데이터 사이언스 ㅣ 그림으로 배우는 시리즈
마스이 토시카츠 지음, 김성훈 옮김 / 영진.com(영진닷컴) / 2024년 6월
평점 :
데이터과학, 데이터사이언스라고 불리는 책들이 처음배우는 분들에게는 매우 생소하죠. 데이터가 무엇인지를 시작으로 데이터를 어떻게 처리하는가 데이터처리가 되면 어떻게 분석할 것인가에서 통계학이 불쑥튀어 나옵니다. 요즘은 여기에 인공지능 공부도 같이 해야 하는 난코스도 있습니다. 그래서 초기에는 좀더 쉽게 개념이해가 매우 중요합니다. <그림으로 배우는 데이터사이언스>는 바로 쉽게 배우고 명확히 정의해주는 데이터과학의 개념을 세워주는 주는 역할을 합니다. 한페이지에 개념정리를 하고 다음페이지에 개념을 그림으로 정리해줍니다. 데이터사이언스 개념집, 요약집, 참고서로의 역할도 함께 할수있게 구성했습니다. 이제 데이터에 많은 사람들이 관심을 가지고 있고 정부와 기업들도 데이터양산에 신경을 크게 쓰고 있습니다.이 데이터를 어떻게 처리하고 분석해서 적용할까의 기초를 쌓을수있는 좋은 기회입니다.
저자는 마스이 토시카츠 마쓰이기술사무소대표시고 테크니컬 엔지니어이고 정보공학기술사이기도 하십니다. 79년생으로 오사카부립대학 대학원을 나오셨습니다. 다양한 소프트웨어를 개발하시고 컴퓨터분야 책도 많이 쓰신 분입니다. 한국에도 <프로그래밍 언어도감>,<알고리즘퍼즐 69>,<이토록 쉬운 기초수학> 등의 출간되어 있습니다.
21세기자원을 데이터라고 합니다. 데이터를 많이 생산하기 시작했고 이 데이터를 '발생한 상태'라고 표현을 합니다. 이를 사람들이 사용하게 한 상태를 '정보'라고 합니다. 이를 다시 도표로 보여주고 꿀팁처럼 'Point난을 오른쪽하단에 만들어서 간략하게 추가설명을 합니다. 거의 데이터사이언스검정시험이 있다면 수험서처럼 간략한 정리와 이해를 특징으로 하고 있습니다. 데이터의 기본, 데이터의 처리와 활용, 알아두고 싶은 통계학지식 등은 전체적으로 통계학에서 배우는 내용들입니다. 두꺼운 데이터과학책들은 주로 R이나 파이썬 언어를 이용해서 데이터를 처리하고 활용하고 통계학 방법을 적용하는 방식으로 진행이 되지만 저자는 개념을 명확히해서 기초를 튼튼히 하는 방식을 알려줍니다. 알아두면 좋은 AI지식은 빅데이터분석기사의 시험영역으로 인공지능의 딥러닝을 이해할 머신러닝, 강화학습, 과적합, 신경망, 경사하강법 등 딥러닝을 잘이해를 못한다면 저자의 촌촌살인것은 정리로 인공지능전영역도 정리를 할 수가 있습니다. 그리고 데이터사이언스에서 보안과 개인정보도 중요한 부분이어서 데이터를 모을 때 사용하는 크롤링, 스크레핑 등도 다룹니다.
데이터가 의미있는 것이 언어를 수치로 표현하면 통계도 낼수있고 비교도 가능해져서 다양한 예측이 가능하게 됩니다. 통계도 기본 줄기는 모두 다루고 있습니다. 확률분포, 표준오차, 검정, p갑 등의 통계기본 개념 설명을 알차고 간단하고 이해가 쉽게 해주고 있습니다. 그렇다고 모두 기본만 다루고 있지 않습니다. 인공지능에서 튜링테스트라는 처음시작부터 신경망, CNN등도 설명하고 수준을 높여서 서포트벡트머신, AutoML, 수리계획법과 확률적 계획법 등 개념설명을 합니다. 왼쪽에서 개념을 읽고 오른쪽에서 그림으로 구도를 확실히 알고 오른쪽하단에 POINT에서 보조적인 지식을 집어주는 것이 기억력을 높이는데도 도움이 되었습니다.
이제 데이터과학은 필수입니다. 앞으로 인공지능때문에 어떤 파장을 몰고 올지 모두 주시하고 있는 시기입니다. 지금은 준비할때라는 생각이 듭니다. <그림으로 배우는 데이터 사이언스>는 (정확히는 도표와 그래프에 가깝지만 ) 코드도 없고 수식도 많지 않습니다. 오로지 개념이해에 집중되어서 이책을 통해 다른 전문책으로 옮겨가기 가장 좋은 데이터과학책인듯합니다. 이 책으로 데이터과학과 친해지고 다양한 인공지능 정보를 받아들인다면 휠씬 쉽게 다른 사람에 비해 절대 뒤쳐지지 않고 남들보다 먼저 수익을 얻을 기회를 잡을 것이라 봅니다. '데이터분석부터 AI기본까지'까지 입문용으로 적절한 책이었습니다.
본 도서는 출판사로부터 무상으로 제공받아 주관적인 리뷰를 했습니다.