데이터를 읽는 사람은 언제나 강하다
노무라종합연구소 데이터사이언스랩 외 지음, 전선영 옮김 / 머스트리드북 / 2024년 11월
평점 :
장바구니담기



AI 시대이다.

수없이 쏟아지는 데이터를 활용하며 살 수밖에 없다.

이 데이터들을 나는 어떻게 활용하고 있을까?’ 생각해 보니 앱이나 사이트의 숨어있는 다양한 도구 속에서 생산자라 하기보다는 소비자였다.

미래 시대는 데이터를 어떻게 활용하느냐에 따라 삶의 질이 달라질 수 있다는 글을 읽은 기억이 있어 이 책을 읽고 싶었다.



이 책의 저자는 일본 노무라종합연구소 데이터사이언스랩의 대표인 시오자키 준이치와 상급 연구원인 히로세 야스히코다. 데이터 사이언스에 대한 흥미를 일깨우고 관련 지식과 기술을 익히는데 도움을 주고 싶은 마음을 담았다고 한다.

 

이 책은 데이터 사이언스의 필수 개념과 필요한 자질을 엄선해 인포그래픽을 곁들여 풀어낸 책이다. 자주 쓰이는 머신러닝 알고리즘과 통계기분 개념부터 현실 세계의 문제를 데이터 사이언스의 틀에 짜맞추어 넣는 법, 데이터 사이언티스트가 되기 위해 갖추어야 할 자질까지 압축하여 한 권에 담았다고 한다.

 

데이터가 우리 일상생활 속에 어떻게 활용되고 있는지 설명하는 1일상생활 깊숙이 스면든 데이터 사이언스에서는 데이터 사이언스가 어떤 일을 하는지, 왜 필요한지, 비즈니스 능력, 데이터 사이언스 능력, 데이터 엔지니어 능력을 왜 가져야 하는지, 앞으로 데이터 사이언스가 얼마나 필요할지 등 데이터 사이언스에 대한 기초 배경을 설명한다. 2030년이 되면 일본에서도 54만명이나 부족할 것이라 말하는 것을 보니 우리나라에서도 앞으로 데이터 사이언스의 요구가 증가할 것 같다. 아이들의 미래 진로와 연결지어 생각해 볼 수 있었다.

 

2자주 쓰이는 러닝머싱 알고리즘과 통계 개념들에서는 우리가 수학시간 배웠던 통계 관련 개념들과 AI 관련 주요 개념들을 예를 들어가며 상세하게 설명한다. 수학을 그리 좋아하지 않았는데 읽어가며 과정에 배운 내용을 상기하기도 하고, 일상생활에서 시계열 분석, 과학습, 교차검증, 블랙박스 문제 등 들었던 개념들을 접하면서 좀더 쉽게 이해할 수 있었다.

 

3궁금한 그 현상을 어떻게 데이터로 바꿀 것인가에서는 가장 관심 있던 분야라 더 집중하며 읽었다. 내가 찾아본 물건의 관련 정보가 결국은 구매 데이터 분석을 통해서이며, 단어 단위로 수없이 텍스트 마이닝을 분석하고, 특정량을 분석하는 내용들이 나도 모르게 일상 속 숨어있는 데이터의 활용 사례를 느끼게 되었다.

 


4현실에서 당장 부딪힌 예상 밖 낯선 상황들에서는 데이에터 전처리 과정의 중요성을 설명한다. 데이터 분석에서 전처리가 8할을 차지한다는 말에 놀라고 미래를 예측하기 위해 과가의 데이터가 중요한데 양이 적으면 분석이 제대로 되지 않으며, 잘못된 예측을 하게 되기에 전처리 과정이 그만큼 중요함을 강조한다. 데이터 분석은 시행착오의 연속이며, 환경이나 비용측면에서 제약이 많아 제한된 환경에서 분석을 해야 하는 어려움도 있음을 인지해야 한다고 말한다.

 

어쩌다 데이터 사이언티스트가 된 사람들에서는 데이터 사이언티스트가 되는 과정과 어려움을, ‘데이터 해석 능력을 키우기 위해서 갖추어야 할 능력들에서는 비즈니스 능력, 전문 내용을 전달하기 위한 가독성, 시뮬레이션의 힘, 상상력, 자격증 등이 필요함을 소개한다.

 

이 책을 읽으면서 데이터 관련 직업을 가지고 싶은 사람은 한 번 읽어보면 좋겠다는 생각을 했다. 데이터 사이언티스트에 대한 정보가 많기 때문이다. 아울러 전문적인 내용을 시각적인 자료를 활용하여 설명하므로 데이터에 관심이 있는 사람이라면 읽어보기를 권한다.

 

-이 글은 출판사로부터 도서를 제공받아 작성하였습니다.-



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo