-
-
직장인의 교양 데이터 과학 - 데이터 과학에는 데이터를 이해하는 당신이 필요하다
타카하시 이치로 지음, 윤인성 옮김 / 프리렉 / 2021년 10월
평점 :
절판
불과 몇 년 전만 해도 빅데이터라는 용어가 생소했는데, 어느새 빅데이터 시대를 살고 있네요.
매일 데이터를 기반으로 한 서비스가 개선되고, 데이터가 경쟁력이 되면서 기업들간의 경쟁이 치열해지고 있어요. 이처럼 데이터가 비즈니스 성장의 핵심이 되었어요.
<직장인의 교양 데이터 과학>은 비즈니스맨이 알아야 할 데이터 과학의 모든 것을 담은 책이에요.
우선 데이터 과학이란 무엇일까요.
"데이터를 기반으로 컴퓨터 과학 또는 통계학 등으로 도메인에서 활용할 수 있는 유익한 지식을 도출해내고, 이를 도메인에 실제로 사용하는 접근 방법" (28p) 이라고 하네요. 데이터 과학 영역에서 도메인은 데이터를 활영하는 영역을 의미하며, 구체적인 예로는 영업 활동, 마케팅 활동, 조달 관리, 재고 관리, 생산 활동 등이 있어요. 쉽게 말하자면, 비즈니스 세계에서의 데이터 과학은 데이터와 도메인을 연결하는 다리라고 할 수 있어요. 그 다리를 생각하고 만드는 사람이 데이터 과학자인 거예요.
그러면 왜 일반적인 비즈니스맨이 데이터 과학에 대해 알아야 하는 걸까요.
빅데이터 시대에 데이터 과학자의 수요는 증가하고 있는데, 인재가 부족한 현실을 이야기하고 있어요. 데이터 과학 비즈니스에서는 데이터 과학자만으로는 아무것도 할 수 없다는 것이 가장 큰 이유예요. 기술력보다는 팀의 힘이 중요하기 때문에 데이터 과학자와 함께 협력하는 비즈니스맨이 필요하다는 거죠.
최근 데이터 과학에 대한 기대가 커지면서 마치 마법처럼 성공 전략이 저절로 만들어진다고 착각하는 경우가 있다고 해요. 저자는 아무것도 없는 상태에서 새로운 것을 창조하는 "0 → 1"은 비즈니스 세계에서는 가능한 방식이지만 데이터 과학에서는 불가능하다고 이야기하네요. 왜냐하면 데이터 과학이란 이미 무언가 있는 것,즉 데이터를 기반으로 효율화하고 규모를 확대하는 것에 굉장히 특화되어 있기 때문이에요. 미래에 기술적 특이점이 발생한다면 사람의 도움 없이 아무것도 없는 무의 상태에서 새로운 데이터를 만드는 인공지능이 탄생할 수도 있겠지만 현재로서는 데이터와 사람이 함께 협업해야 성장할 수 있어요. 따라서 "1 → 10"의 단계에서 데이터 과학을 활용하는 것이 효율화와 수익 확대에 도움이 된다고 볼 수 있어요.
데이터의 구조가 어떻게 되어 있는지, 어떠한 과정을 거치는지를 이해하기 위한 데이터 과학 구동 프로세스가 자세히 나와 있어요. 바로 PDCA 사이클, OODA 루프, CRISP-DM 이며 각 프로세스에 따라 구축되는 것을 그림으로 확인할 수 있어요. 데이터 모델을 구축하는 것이 수익 구조에 영향을 미치기 때문에 비즈니스에서 강력한 무기가 될 수 있어요. 데이터 과학을 시작하는 방법은 다양한 사례를 통해 소개하고 있어요. 작게 시작해서 크게 파급을 일으키는 경우는 반복해서 성과의 크기를 측정해보는 것이 중요한데, 이 과정을 거치면서 잠재성을 예측할 수 있다고 하네요.
앞으로의 시대는 데이터 과학의 시대이므로 데이터 과학에서 필요한 세 가지 기술인 데이터 과학, 데이터 엔지니어링, 비즈니스에 대한 이해는 필수라고 할 수 있어요. 이 책에 담긴 데이터 과학 지식이 곧 데이터 문해력을 위한 상식인 거죠. 결론적으로 "데이터를 지배하는 자가 비즈니스를 지배한다"고 요약할 수 있어요.
