엑셀만 알아도 할 수 있는 데이터 과학 - 데이터 수집부터 분석, 문제 해결까지!
우와후지 이치로우 외 지음, 진솔 옮김 / 한빛미디어 / 2019년 3월
평점 :
장바구니담기


 앞으로의 시대는 정보 전쟁이라고 할 정도로 정보, 데이터의 중요성은 점점 높아지고 있다. 빅데이터라는 이름 아래 수많은 기업들이 관련 분야 및 서비스에 연구개발과 투자를 하고 있다. 기업이 투자를 한다는 것은 곧 돈이 된다는 이야기이고, 데이터 분야의 미래를 밝게 보고 있음을 의미한다. 이러한 데이터 분석은 기업만이 하는 것도, 할 수 있는 것도 아니다. 데이터 분석의 예라고 보기에는 다소 애매하지만, 현재의 카카오버스와 같은 앱과 같이 처음으로 버스 승하차 정보라는 공공데이터를 사람들이 보기 편하게 제공한 사람은 개인이었다. 요즘은 그 때보다 더 많은 공공데이터가 개방되고 있으니 이를 가공해서 돈이 되는 서비스를 만들 수 있는 기회는 더 다양해졌다는 생각이 든다. 공공데이터가 없으면 직접 조사를 통해 데이터를 만들어 볼 수도 있을 것이다. 이 책에서는 이처럼 개인도 데이터를 충분히 얻고, 활용할 수 있다고 말한다. 또한 R과 파이썬 같이 전문적으로 데이터를 분석하려는 사람들이 활용하는 프로그래밍 언어가 아닌 우리가 실생활에서 흔히 사용하는 엑셀로도 가능함을 보여주고 있다.
 책이 데이터를 다루는 내용이기 때문에 통계학의 지식이 많이 담겨있다. 특히 7장을 시작으로 이와 같은 내용들이 많이 나오는데, 숫자에 대해 거부감이 큰 사람이라면 읽기가 다소 거북할 수도 있겠다는 생각이 들었다. 또 가장 흥미롭게 읽은 부분은 11장의 데이터로부터 예측하는 회귀 분석이었는데, 이는 두 변수간의 상관관계를 수치로 도출해내고 요인과 결과의 관계식을 통해 앞으로를 예측하는 것이다. 주식시장에서도 투자자들이 베타라는 계수를 사용해서 수익률 산정할 때 활용하는데 데이터에 있어서도 회귀 모델을 활용하는 것이 신기했다. 엑셀을 활용해서 회귀 직선을 만드는 내용이 나와있어 투자에도 이를 접목해 볼 수는 없을지 곰곰이 생각을 해보기도 했다.
 무엇이든지 분석하기를 좋아하는 사람들이 보면 좋을 책이다. 각종 변수들을 수치화하고 데이터를 가공하는 일련의 과정을 통해 현상을 분석하거나 미래를 조금이라도 더 체계적이고 합리적인 방법으로 예측해보고 싶다면 이 책을 통해 많은 도움을 받을 수 있을 것이다.

댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo