-
-
직장인의 교양 데이터 과학 - 데이터 과학에는 데이터를 이해하는 당신이 필요하다
타카하시 이치로 지음, 윤인성 옮김 / 프리렉 / 2021년 10월
평점 :
이세돌과 알파고의 세기의 대결이후에 인공지능이 주목을 받았고 그 핵심에 데이터사이언티스트가 있습니다. 데이터사인티스트는 '데이터과학'을 다루는 사람을 말합니다. 저자는 서언에서 데이터과학자는 요즘 생긴직업이 아니고 벌써 20년전에 생겨나고 숫자를 다루는 곳에서는 데이터를 분석하고 시스템을 구축해서 수학모델을 만들어서 컴퓨터프로그램으로 구현하는 일을 합니다. <직장인의 교양 데이터 과학>은 데이터과학 자체가 쉬운 영역은 아니지만 깊은듯 얕은듯 교양으로써의 액키스가 모아놓았습니다.
저자는 데이터분석일을 하는 타카하시 이치로대표입니다. 정부와 기업컨설팅을 주로 하십니다. 최근 일본은 끝났다 우리가 IT는 이겼다는 국뽕에 차오르는 소리들이 많이 회자되는 요즘, 저도 인공지능을 공부하고 있습니다만 컴퓨터 전문서적에서 일본의 비중은 상당히 높습니다. 한국저자들은 대부분 아직도 미국과 일본의 저서 코드를 카피해서 자신의 교재를 만드는 수준이고 해외에 수출해서 출간할 정도의 책은 아직 의문이 붙어 있는 상황이죠. 이책도 내용을 보면서 매우 논리적이고 분석적으로 데이터과학이 하는 일을 다뤄놓았습니다. 데이터과학으로 출간된 책중에 디자인은 멋지나 이정도 내용의 퀄리티가 얼마나 될지 아쉽지만 의문입니다. 어서 한국 개발자들도 좋은 퍼포먼스의 능력을 배양해서 출판에서도 극일할 수있는 기반이 빨리 마련되었으면 합니다. 우선 지식습득이 필요할겁니다.
몇년전부터 데이터가 주목을 받고 있습니다. 공공데이터를 모아놓는 정부 data포탈도 생기고 aihub라는 곳에도 데이터가 쌓이고 있습니다. 기업들도 자신의 기업에서 만들수있는 데이터가 무엇이고 이용할 수있는 데이터가 무엇인지 관심을 갖고 있습니다. 데이터의 시대가 도래한거죠. 데이터를 모으는 이유는 수익성있는 사업이나 의미있는 개선을 하기위해서 있습니다. 바로 데이터과학이 데이터와 비즈니스를 연결해주는 다리라고 표현합니다. 물론 데이터과학만이 연결은 아니죠. 도매인도 알아야 하고 데이터과학자를 지원하는 데이터엔지니어도 필수있습니다. 실제는 데이터과학자는 소수이고 데이터엔지니어가 더많죠. 그리고 데이터과학으로 나오는 산출물을 비즈니스에 활용하는 정치력(?)있는 비즈니스맨도 필수라고 합니다. 데이터과학자는 앞에 나서는 사람이 아니고 지원하는 파트인거죠.
데이터는 주로 0과1로 저장을 하죠. 2진수입니다. 그런데 저자는 데이터분석은 0에서 1로 만드는 작업이 아니라 1에서 10으로 만드는 작업이라고 심오한표현을 합니다. 데이터분석은 많은 데이터가 있어야 좋은결과를 낸다는 거죠. 그리고 이 좋은 결과를 내기 위해서는 목표가 명확해야 하고 활용스토리도 있어야 효과적으로 작동을 합니다. 활용목적- 활용스토리 -분석스토리로 이어지는 프로세스가 필요합니다. 이 방식은 PDCA OODA, CRISP-DM 등 데이터를 수집하고 처리하는 방법을 알아야 효과적인 성과를 냅니다. 데이터과학에서의 핵심은 통계해석입니다. 이는 머신러닝모델선택이라고도 합니다. 통계학과출신들은 의미를 생각하고 컴공전공자들은 다양한 모델을 돌려서 퍼포먼스만 나오면 채택하려는 경향의 차이도 실감나게 설명하십니다.
앞으로 다가올 미래는 데이터의 팽창을 하지 감소하지는 않을 겁니다. IOT가 일반화되면서 모든 사물에 센서가 들어가기에 여기서 나오는 데이터는 상상이상일겁니다. 이 데이터를 잘분석하여 활용하는 기업(도메인을 잘 연결하는 기업)만이 지속될 수있는 사업환경이되지 않을까요. 데이터가 풍부해지면 데이터는 공유하며 데이터에서 의미를 잘꺼내는 데이터과학자를 보유한 기업이 더욱 돋보일겁니다. 그리고 이들과 함께할 데이터문해력을 가진 비즈니스맨들의 활약도 매우 중요할 겁니다. 프로야구팀에 요즘은 대부분 전력분석관이 있죠. 경기를 영상으로 찍고 선수들 데이터를 모아서 선수와 감독에게 조언하는 역할입니다. 하지만 선수들과 코치진이 이 자료를 무시한다면 전력분석관의 역할은 들러리가 되죠. 어느 전력분석관은 선수들에게 제발좀 전력분석지좀 읽으라고 하소연하는 걸보면 전력분석의 필요성을 모르는 경우가 많기 때문이겠죠. 데이터과학도 마찬가지입니다. 데이터와 도메인을 이해하는 힘있는 비즈니즈맨이 있어야 데이터과학도 빛을 봅니다. 앞으로 분명 데이터과학덕분(?)에 사람들은 자리를 잃을 겁니다. 하지만 데이터과학자는 더많이 필요하다는것이 슬픈소식일지 혼란스럽기는 하지만 그 길로 가는 건 확실해 보입니다.
본 도서는 출판사로부터 무상으로 제공받아 주관적으로 리뷰합니다.