엑셀로 시작하는 데이터과학 실무
하야마 히로시 지음, 최서희 옮김 / 영진.com(영진닷컴) / 2021년 1월
평점 :
장바구니담기


얼마전 수학, 과학 지식 부족으로 업무에 어려움을 겪는 직장인들이 많다는 기사를 보았다. 직접 수학문제를 풀 일은 없지만 재무제표나 통계 등 수치가 필요한 일은 많다. 그래서 이를 보다 간단히 작업하기 위해서 '엑셀'프로그램을 활용하게 된다. 특히 '데이터' 수집과 활용이 경쟁력인 시대인만큼 보다 쉽게 자료를 정리하고, 유의미한 해석을 찾아 깔끔한 형태로 보고할 수 있도록 '엑셀' 프로그램을 잘 다루는 능력이 그만큼 중요하다.

 

영진닷컴에서 나온 우리 회사 매출을 증대시키는 통계 활용법 <액셀로 시작하는 데이터과학 실무>는 "통계"에 초점을 두고 있다.

 

-시작하며 中-

통계학에 필요한 것은 특수한 재능이 아니라 상식을 잘 활용하는 능력입니다. 지금 있는 정보만으로도 신중한 절차를 통한다면 제대로 분석할 수 있습니다. 당연하게도 선입견이나 편견에 현혹되어서는 안 될 일입니다. 이를 돕기 위해 이 책에서는 계산 방법뿐만 아니라 데이터를 보는 방법과 특징을 파악하는 방법, 분석하고 사고하는 방법, 기술의 적용 상황, 의외의 함정 등을 상세하게 설명합니다.

 

순간 어렵게 여겨지는 말들이 등장해 당황했지만, 캐릭터들과 줄거리를 가지고 각 내용이 이어지기 때문에 이해가 쉽다.

 

영진제과의 입사 3년 차 차바울 주임은 사내 논문 콘테스트에 제출할 논문을 작성하게 된다. 하지만, 어찌할지 모르는 그에게 김경민 부장은 데이터 분석의 전문가 최윤정 선배를 소개해주고, 데이터 분석 방향 사용기법을 익히기 위한 일주일이 시작된다는 것이 큰 줄거리이다.

 

데이터 수집과 분석의 중요성은 다들 알지만, 출발점은?, 목적은? 어떤 작업부터? 라는 질문을 받는다면 쉽게 답하기 어려울 것이다. 그래서 책에서는 우선 데이터를 분석하기 위해선 목적을 명확히 하는 것부터 시작함을 강조한다. 이런점이 일반적인 액셀 기술을 향상시켜주는 책이라기 보다는 확실히 '데이터 분석'과 '활용'에 초점이 맞춰진 책임을 알 수 있었다.

 

 엑셀 프로그램을 실행시켜 어떤 셀에 커스를 놓고 어떻게 내용을 입력하느냐와 같은 아주 기초적인 내용은 없다. 그렇지만 자료 입력정도는 할 수 있지만, 이를 의미있게 활용하는 방법은 모르겠다 하는 독자라면 어렵지 않게 따라할 수 있다. 무엇보다 영진닷컴 홈페이지에 들어가면 모든 예제에 실습파일이 제공되기 때문에 다운 받아서 차근차근 따라하면 어렵지 않다.

 

융합교육이 대세인만큼 중고등학교 과정에서 '통계'를 배울 때 이 책을 활용하면 어떨까 하는 생각이 들정도로 '통계'와 관련있는 수학개념들을 만날 수가 있었다. 수학의 기본개념 없이 무작정 엑셀로 결과값을 얻는 것 보다 이렇게 기본 개념을 이해한다면, 활용 범위가 넓어질 것이라 기대되었다.

 

  예를 들자면

p.34 데이터의 개수를 도수라고 하고, 데이터가 몇 개 나타나는가를 빈도라고 합니다. (생략)

도수분포표는 도수, 즉 데이터의 개수가 어떻게 퍼져 있는가를 표로 나타낸 것입니다.(생략)

이러한 각각의 값의 범위를 계급 혹은 구간이라고 부릅니다.

 

  p.137 상관관계를 구하고 관계의 강도를 알아본다. 면적과 집세처럼 한쪽 값이 증가하면 다른 쪽 값도 증가하는 관계를 상관 관계라고 합니다. 상관관계를 수치로 나타내려면 상관계수가 필요합니다. 상관계수는 두 가지 변수의 관계 강도를 나타내는 값입니다.

 

  상관계수를 구하려면 CORREL 함수를 사용합니다.

 

  그래서 CORREL 함수로 면적과 집세의 상관계수를 구했다면, 구한 값이 0.9031이면 1에 가까우니 면적과 집세는 강한 관련이 있다와 같이 그 결과를 유의미하게 해석할 수 있는 것이다.

 

책의 마지막 부분에는 '용어집'이 있다. 책에서 소개된 통계 용어들이 그림, 해설, 표 등으로 정리되어 있어서 참고하기 좋다.

 

이 책을 읽고 실습하며 드는 생각은 프로그램들이 점점 사용하기 편리해져서 반대로 기본적인 개념도 모른채 단순히 자료를 입력해서 결과물만 얻으려고 하다보니 앞서 나아가기 보다는 따라가기도 어려워 헉헉거리는 것이 아닌가 하는 것이었다. 졸업만 하면 필요없을 줄 알았던 기초지식들. 그 지식들이 탄탄하게 쌓이고 이를 활용해야 발전해 나갈 수 있다는 것을 이제야 깨달은 것 같다. 그래도 지금처럼 다시 공부하고 공부하고 하다보면 더 나은 내가 되어있으리라 기대해 본다. 실무에서 사용할 데이터 과학을 배울 수 있었던 <엑셀로 시작하는 데이터 과학 실무>였다.

 

*출판사로부터 도서를 무료로 제공받아 읽고 솔직하게 작성한 리뷰입니다*


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo