-
-
데이터를 읽는 사람은 언제나 강하다
노무라종합연구소 데이터사이언스랩 외 지음, 전선영 옮김 / 머스트리드북 / 2024년 11월
평점 :
- 본 서평은 출판사로부터 책을 제공받아 읽고, 주관적으로 작성한 서평입니다.
빅데이터와 AI란 거대한 시류의 변화에 휩쓸려 자의반, 타의반으로 관련 공부를 한지 꽤 흘렀다. 그렇다고 업무가 확 바뀐건 아니고, 맡아서 수행한 일들은 원래 그대로이지만, 전문가들과 협업하며 이를 어떻게 활용할지 어깨너머로 많이 배우고 교육도 열심히 들었다. 서당개 3년이면 풍월을 읊는다더니, 그덕에 꽤 아는 것도 많아졌다. 대신 여기저기서 주워들은걸 모아 조합하다보니 구멍이 많아 틈틈히 정리해가며 쌓아올릴 필요성을 느낀지 꽤 돼었다.
이번에 읽은 책은 '데이터를 읽는 사람은 언제나 강하다'란 책이다. 앞서 말한대로 내가 쌓아온 데이터에 관한 지식을 체계적으로 정리해보고 싶은 욕심이 있었고, 그간 접해온 노무라 연구소 발간자료들이 꽤 꼼꼼히 잘 정리되어 있었기에 도움이 되겠다 싶어 읽어 보았다.
저자는 노무라 연구소 내 데이터사이언스랩이란 조직으로 일반적으로 컨설팅과 IT솔루션을 제공하는 것으로 알려진 해당연구소에서 전사적으로 데이터 사이언스를 추진하기 위해 설립한 조직이라고 한다. 책은 우선 데이터 사이언스가 무엇인지 살펴보고, 다이내믹 프라이싱, AI발주, 피플 애널리틱스와 같이 현재 쿠팡이나 아마존, 우버등에서 널리 사용되는, 우리 실생활과 굉장히 가까운 기술들임을 주지한다. 이어 모집단과 표본부터 정규분포 등 통계의 기초개념, 회귀분석, 결정트리, 클러스터링같은 머신러닝부터 자연어처리, GPT-3과 같은 최신 AI 기술까지 소개한다. 이러한 배경이론을 기반으로 현실에서 어떻게 데이터 분석을 하는지 과정을 살펴보고, 아직 데이터 분석에 대한 이해도나 분위기가 무르익지 않았기에 현실에서 겪는 어려움등에 대해 살펴본다. 마지막으론 데이터 사이언티스트가 된 사람들과의 인터뷰를 통해 실사례, 장단점에 대해 알아보고 이 길을 걷기위해 필요한 자질이나 함양해야할 기술들에 대해 알아본다.
개인적으로 그동안 꽤 공부해왔다고 생각했는데 이번 책을 읽음으로써 주성분 분석, 베이즈 네트워크, 프로펫에 대한 이해가 부족했었다는 사실을 깨닫고 채워넣게 되었다. 또한 전처리가 8할, 아주 적은 데이터로 굉장히 많은 예측을 기대하거나, AI면 99~100%의 정확도를 기대하는 관리자들 등 데이터 사이언티스트가 현실에서 부딪히는 문제들에 극공감하며 재미있게 읽었다. 데이터 사이언티스트에 흥미를 갖고 있다면 전체적인 틀을 훑어보고 한번쯤 간접경험을 해 볼 수 있는 흥미로운 이번책. 강력이 추천하고 싶다.
#데이터를읽는사람은언제나강하다 #노무라종합연구소 #데이터사이언스랩 #시오자키준이치 #히로세야스히코 #전선영 #머스트리드북 #빅데이터 #AI #데이터사이언스 #데이터사이언티스트 #회귀분석 #딥러닝 #머신러닝