비즈니스 데이터 과학 - 비즈니스 의사결정을 위한 통계학, 경제학, 인공지능의 만남
맷 태디 지음, 이준용 옮김 / 한빛미디어 / 2022년 6월
평점 :
장바구니담기



"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

"하지만 비즈니스 문제에 대한 더 깊은 분석을 위해서는 무슨 일이 일어났는지보다 왜 이런 일이 발생했는지를 파악해야 한다."


이래저래 데이터 과학이 화두입니다. 책 뿐만 아니라 온/오프라인 강의에도 데이터 분석을 가르치는 강의가 많아졌고요. 하지만 '데이터 분석'이 붙어있는 책이나 강의를 보면 파이썬 코딩 방법이나 머신러닝/딥러닝 정도를 가르쳐 주는 것이 대부분입니다. 실제 현장에서는 모델 구현이나 해당 모델의 결과값도 중요하지만 그 결과로부터 어떤 인사이트를 이끌어 낼 수 있는지도 중요한데 말이지요. 아무래도 후자의 내용을 다루는 곳은 많이 없는 것 같다는 느낌입니다.


다시 말해, 예측(Prediction)과 추론(Inference) 모두 중요한데 시중에는 전자에만 방점을 두는 책이나 강의가 많은 듯합니다. 그래도 최근에는 추론을 통해 프로덕트를 분석하고 이를 비즈니스에 적용하기 위한 움직임도 늘어나고 있는데요. 이에 따라 후자와 관련된 책 역시 하나 둘 나오고 있습니다. 그리고 이 책 역시 그런 흐름에 발맞춰 나온 책이라고 할 수 있겠고요.


회귀, 정규화, 분류 등 책의 전반적인 흐름은 기존의 서적과 유사합니다. 하지만 더 자세히 들여다보면 책의 특징이 보이는 곳이 많은데요. 기초만을 다루는 기존의 책과 달리 어떻게 하면 결과값을 더 자세히 해석하고 신뢰도 있게 바라볼 수 있을 지에 대해 여러가지 방법론을 제시하고 있습니다.

개인적으로 재밌게 읽었던 부분은 Chap 5, 6 에 걸쳐져 있는 '실험'과 '제어'에 대한 내용이었습니다. 실제 데이터 분석을 하면서 실험 설계가 되었는지 혹은 어떤 조건을 제외 혹은 포함해야 할 지에 대해 고민한 적이 있는데요. 그에 대한 힌트를 얻고 당시 어떤 생각을 했는지에 대해 반추해 볼 수 있어서 좋았습니다.


책의 내용은 좋지만 몇 가지 주의사항 역시 있습니다. 일단은 그리 가벼운 책은 아니라는 점인데요. 서문에서도 말하고 있는 것처럼 경제학에 대한 개념이 있어야 이해가 쉬운 부분도 있고, 수학 기호도 꽤 있어 이런 부분까지 모두 이해하고자 한다면 기초 수학에 대한 베이스가 있어야 하는 것도 사실입니다. 그리고 일련의 R 코드를 보고 이해하기에 문제가 없을 정도가 되어야 책을 보는데 문제가 없을 것 같습니다.


R 코드를 어느 정도 볼 수 있고, 기초 수학 지식이 있는 실무자가 실제 데이터 분석 과정에서 자신이 잘 하고 있는지 혹은 어떻게 하면 더 잘 할 수 있을 지를 고민중이라면 해당 책은 그에 대한 좋은 가이드가 되어 줄 것으로 생각됩니다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo