데이터 과학 - 더 나은 의사결정을 위한 통찰의 도구 DEEP & BASIC 시리즈 2
존 켈러허.브렌던 티어니 지음, 권오성 옮김 / 김영사 / 2019년 10월
평점 :
장바구니담기




경험에서 패턴을 찾아내 세상을 이해하려는 인간의 본성


데이터 과학, 데이터 사이언스는 요즘 가장 주목 받는 영역이다. 단순한 프로그램 영역을 넘어서 데이터를 기반으로 한 어떤 의사 결정에서 중요한 부분으로 작용하고 있고, 기획과 마케팅에서 많은 활용이 이뤄지고 있는 듯하다. 나는 공대가 아닌데? 나는 컴퓨터 공학과를 나온 것도 아닌데 어떻게 데이터를 활용할 수 있을까가 아니라 이제는 어떤 직종에 있든 ≪데이터 과학≫을 잘 활용해야 하는 시점이 온 것이다.


생각보다 데이터 분석, 통계학의 역사는 오래되었다. 하지만 많은 양의 데이터를 수집하고 해석할 수 있기에는 컴퓨터 발전 속도 등 기술적인 제한이 있었다. 하지만 17~18세기 기틀이 만들어지고 지금의 알고리즘이 기반이 되는 최소제곱법(선형회귀, 로지스틱 회귀, 인공 신경망) 등 19세기 유명한 수학자들을 통해 만들어진 것들을 적용할 수 있게 되었고, 현재 기술적인 부분과 어우러져 중요한 의사결정을 하는데 중요한 도구로 활용되고 있다.


단순히 데이터를 수집하는 것이 아니라 이를 해석해야 하기 때문에 데이터 과학자는 다양한 능력이 필요하다. 통계와 확률, 데이터 시각화, 기계학습은 물론 데이터베이스, 소통 능력 등 많은 부분을 이해할 수 있어야 한다. 이 책의 목적이 이런 전문적인 분야를 깊이 알자가 아니라 데이터 과학이 무엇인가라는 부분에 기틀을 잡는 것인 것만큼 전공자가 아니라도 이 책을 쉽게 접근할 수 있는 매력이 있다.


p.62

데이터 과학의 목적은 데이터를 이용해 통찰과 깨달음을 얻는 것이다. 성경은 깨달음을 얻기 위해 지혜를 찾으라고 우리에게 가르친다. “지혜가 제일이니 지혜를 얻으라 네가 얻은 모든 것을 가지고 명철을 얻을 지니라”


데이터가 많이 쌓인다고 중요한 것이 아니다. 데이터 수집부터 이를 사용할 수 있도록 데이터를 가공하고 이를 분석하며 활용, 이해할 수 있도록 데이터를 바꿔나가는 것이 데이터 사이언스의 핵심이다.


책을 통해 이러한 기틀을 이해하는 전체적인 그림을 이해할 수 있다. 어떻게 데이터를 잘 분석할 수 있는지, 어떻게 데이터 구조를 효과적으로 만들어 나갈 수 있는지, 데이터 분석 프로세스는 어떻게 이뤄졌는지 자세하게 설명이 되어 있다.


p.236

인간은 늘 세계를 추상화하고 경험에서 패턴을 찾아내 세계를 이해하고자 해왔다. 데이터 과학은 이런 패턴 찾기 행동의 최신 버전이다. 데이터 과학의 역사는 길지만 현대에 들어서 삶에 가져온 충격의 범위는 전례가 없다. (중략) 인간 삶과 이들 분야를 아우르는 공통의 요소는 의사결정이 들어가 있다는 점이다. 잘 수행되면, 데이터 과학은 더 좋은 의사결정과 궁극적으로 더 좋은 결과를 낼 수 있는 실행 가능한 통찰을 제공할 수 있다.


데이터는 실시간으로 다량의 서버를 통해 분산화 하여 빠른 속도로 처리하고 스스로 학습해 나간다는 것도 포인트이다. 점점 더 많은 부분에서 적용 사례는 더욱 늘어가고 그 쓰임새 또한 많아질 것이라는 것을 예측한다. 책을 통해 내가 하고 있는 분야에서 어떻게 적용될 수 있는지, ‘이런 분야에도 적용하면 좋을 텐데’라는 나만의 패턴 찾기도 상상해 보는 건 어떨까?




댓글(0) 먼댓글(0) 좋아요(2)
좋아요
북마크하기찜하기 thankstoThanksTo