-
-
엑셀로 시작하는 데이터과학 실무
하야마 히로시 지음, 최서희 옮김 / 영진.com(영진닷컴) / 2021년 1월
평점 :
엑셀을 능수능란하게 다룰 수 있다면 할 수 있는 것이 꽤 많아지게 된다. 기본적인 기능만 알고 엑셀을 다루다 보니 멋지게 데이터를 조직화하는 모습이 종종 부럽게 느껴지고는 했다. 그런데 엑셀의 기능을 습득한다고 해서 데이터를 만족스러운 결과물로 만드는 것은 결코 쉬운 일이 아니다. 데이터를 어떻게 분석해야 하는지, 어떤 목적을 갖고 결과물을 만들 것인지에 대한 것부터 고민을 해야 하는데, 이 책은 그런 고민을 한 번에 날려줄 수 있는 길을 제시하고 있다. 가장 먼저 데이터 분석의 규칙에 대한 이야기로 시작한다. 데이터라고 하면 그대로 날 것의 것들을 의미하는데, 이를 어떤 목적으로 만들어 나갈지에 대한 것이 가장 중요하다고 한다. 방대한 범위를 갖고 있는 목표가 아니라 세부적인 목적으로 구분하여 데이터의 방향성을 정하는 것이 좋다고 저자는 말하고 있다. 이렇게 데이터의 목적이 정해졌다면 이제부터가 진짜 시작이다. 이 데이터를 적절한 형식으로 입력하고 이를 시각화할 것인지, 어떤 함수나 수식을 사용할 것인지에 대한 생각을 해야 한다.
이 생각하는 부분이 가장 어려운데 목적을 가진 데이터를 잘 분석해서 내가 필요로 하는 결과물이 무엇인지 정하기만 하면 된다. 이 책은 뒤에서 하나씩 다룰 내용을 앞에 그림과 설명으로 (어떤 페이지에서 구체적인 설명이 나오는 것까지 제시) 표기해 주고 있다. 이 두페이지에 걸친 요약을 보고 자신이 필요로 하는 형태를 취사선택하면 조금 더 빠르게 데이터를 구조화시킬 수 있다. 엑셀을 기반으로 하기 때문에 가장 어려운 것이 함수 부분이라고 생각한다. 도수분포표나 평균값, 표준편차, 순위, 시계열 분석까지 모든 것이 함수를 기반으로 이루어진다. 보통 엑셀을 다루는 책에서는 함수를 제시하기만 하고 이런 함수로 결과물이 나온다고 간단하게 설명하고 있다. 하지만 이 책에서는 함수를 제시하고 그 함수가 어디어디에 쓰이는 함수인지 잘 설명해 주고 있어, 함수에 대해 아무것도 모르는 사람도 이 설명을 통해 함수의 어떤 부분이 왜 사용되는지까지 쉽게 파악할 수 있다. 아마 이 책의 가장 큰 장점이 아닐까 한다. 시계열 분석이 가장 눈에 띄었는데 사용할 일은 거의 없겠지만 만들어 두면 가장 멋진 결과물이 나오는 것 같았다.
엑셀이 어렵기만 하다는 생각에 거부감이 조금이나마 있었는데 이제는 함수도 접근하기 쉽고, 나도 함수쯤은 할 수 있다는 생각을 갖게 해 주었다. 게다가 영진닷컴 사이트를 통해 예제를 같이 제공하고 있으니 눈으로 보는 것만으로는 안심이 되지 않는 사람들은 다운로드를 통해 직접 실습도 가능하다. 엑셀 함수에 대해 쉽게 접근하고 싶은 사람이라면 이 책을 보면 좋을 것이다.