-
-
직장인의 교양 데이터 과학 - 데이터 과학에는 데이터를 이해하는 당신이 필요하다
타카하시 이치로 지음, 윤인성 옮김 / 프리렉 / 2021년 10월
평점 :
우리나라의 잡코리아와 비슷한 미국의 소셜 구인사이트인 '글래스 도어(Glassdor)'에서 2016년부터 내리 4년 간 연봉 및 직업 만족도에서 1위를 차지하고 있는 직업이 있습니다. 바로 '데이터 사이언티스트(데이터 과학자, Data Scientist)'가 바로 그들입니다.
미국 이외 지역에서도 이러한 '데이터 과학자'에 대한 수요가 빠르게 증가하고 있으며, 기업 내부에서 데이터 과학자를 자체 교육하거나, 사내 데이터 과학자를 인정하는 제도를 도입하는 기업이 늘고 있다고 합니다. 신입 데이터 과학자가 다른 직종의 신입과 비교했을때 대략 1.5~2배의 연봉을 받는 것으로 알려져 있어 앞으로 데이터 과학자에 도전하는 분들이 점차 많아지리라 예상됩니다.

오늘 소개해 드리는 <직장인의 교양 데이터 과학>에서는 기업의 생존전략으로서의 '데이터 비즈니스'에 중요한 포인트를 제시하고 있습니다. 바로 '데이터 과학자 만으로는 아무것도 할 수 없다는 것 입니다. 즉, 데이터 과학자만으로는 요즘 유행처럼 회자되고 있는 AI, IoT, 빅데이터에 대해서 무언가 만들 수 없다는 이야기입니다.
저자가 밝히는 성공하는 데이터 비즈니스는 결국 기술력 보다는 '팀의 힘'이라 주장하며, 아래와 같은 '인재의 필요성'을 역설합니다.
1. 데이터 과학자(AI/ML 엔지니어 포함)
2. 데이터 엔지니어
3. 도메인을 연결하고, 데이터 과학을 이해하고 있는 비즈니스맨
4. 회사 내부에서 정치력이 있으며, 데이터 과학을 이해하고 있는 비즈니스맨
5. 회사 내부 IT 전문가들과 소통하며, 데이터 과학을 이해하고 있는 비즈니스맨
실제로 현장에서 컨설팅을 진행하다보면, 데이터 과학자 이상으로 부족한 인력으로 데이터 과학을 이해하고 데이터 과학자와 함게 협력하는 비즈니스맨을 언급하는 경우가 많습니다. 본서의 주요 타깃도 바로 이러한 데이터 과학을 이해하고자 하는, 그래서 추후 데이터 과학자와 협력하고자 하는 일반적인 비즈니스맨이 되겠습니다.
책에서 다루는 전반적인 내용은 결국 일반적인 비즈니스맨으로 하여금 데이터 과학의 정의와 필요성, 데이터 과학자와 협력하기 위해 일반 비즈니스맨이 지녀야 할 다양한 데이터 과학 기술 그리고 데이터 과학을 실현하는 과정 등을 저자의 전문가적인 식견과 경험을 통해 상세히 기술하고 있습니다.
데이터 과학의 구동 프로세스 중 대표적인 PDCA사이클 X OODA루프 X CRISP-DM에 대해 그림과 함께 설명하고 있어, 데이터 과학의 모델 구축(CRISP-DM)->관리(PDCA사이클)->실무(OODA루프)의 3박자를 명확히 이해할 수 있어 초심자들에게 큰 도움이 될 것으로 보이며, 데이터 비즈니스의 효과적인 전개를 위해 자사의 흐름에 따라 취사선택하고, 수정 보완하는 작업이 필요할 것으로 예상됩니다.
특히 '통계 해석(다변량 분석 등)'과 '머신러닝(기계학습)'의 차이를 '회귀모델'을 통해 설명하면서, 전자는 '데이터 뒤에 숨은 메커니즘(데이터의 특징, 규칙성 등)에 대한 이해를 강조하며, 예측의 정확도가 조금 떨어지더라도 사람이 이해할 수 있는 부분들을 더 중요시 합니다.
이에 반해 후자는 '미래에 대한 예측'의 느낌이 강해서 컴퓨터의 연산능력을 다앙하게 활용하여 '어떻게든 예측이 마는 모델'을 만들어 내고자 하는 노력이 더 중요시 된다 하겠습니다.
그렇다면 데이터 과학을 쉽게 시작하는 방법은 무엇일까요?
본서에서는 작게 시작해서 크게 만들라로 이야기 합니다. 아마 처음 목표치를 크게 잡고 볼륨을 크게 가져가면 그만큼 리스크가 커지기 때문일 겁니다. 즉, 가능한 가볍고 간단하게 시작해서 (자신의 부서 + 타 연관부서 1~2곳 정도), 그 성과를 조금씩 키우는 것을 추천합니다.
작게 시작하는 시점에서 크게 아래와 같은 3가지 진화 축을 제안하고 있어, 처음 데이터 과학을 테스트하는 매뉴얼로 활용해도 좋을 것 같습니다.
1. 축1(테마의 크기) : 테마 설정을 작게 시작한다. (예: 어떤 한정된 테마)
2. 축2(영향 범위) : 영향 범위를 작게 시작한다. (예: 사람 수)
3. 축3(모델링) : 입수하기 쉬운 데이터 또는 간단한 데이터 과학 모델링 기술 부터 시작한다. (예: 과거부터 있는 간단한 수학 모델 등)
저자가 말하는 것처럼, 이제 데이터 기반의 비즈니스 전략은 전 산업을 불문하고 대세로 자리매김하고 있습니다. 이런 과정에서 핵심적 역할을 수행하는 데이터 과학자와 그들을 자신의 특정 업무( 특정 도메인)와 연결해 주고, 그들과 협업할 수 있는 일반 비즈니스맨들이 필요합니다.
본서를 통해 보통의 직장인이 그들의 업무 영역에서 어떻게 데이터를 비즈니스와 접목하고, 데이터 과학자들과 협업할 수 있을지 확인해 보실 것을 추천합니다.