엑셀만 알아도 할 수 있는 데이터 과학 - 데이터 수집부터 분석, 문제 해결까지!
우와후지 이치로우 외 지음, 진솔 옮김 / 한빛미디어 / 2019년 3월
평점 :
장바구니담기


이 책은 데이터 과학에서 시행하는 과정과 절차에서 데이터를 수집/가공/분석하는 작업을 할 때 엑셀을 활용해 수행하는 방법과 절차를 기술한 책이다.

책의 구성과 내용은 데이터 과학에서 진행되는 절차와 과정에 따라 13개 단원으로 이루어져 있다: 데이터 과학; 데이터 수집; 데이터 정리; 데이터 집계; 데이터 집단의 성향/경향 파악하기; 통계 그래프 만들기; 통계학 기초; 추측과 판단; 평균값 검정; 질적 자료 분석; 양적 자료 분석; 공공 데이터 사용하기; 데이터 과학의 문제.

표본 데이터를 생성하는 방법에서부터, 데이터를 직접 엑셀 차트에 입력하고, 데이터 전체와 속성 별로 나타내는 경향을 통계적으로 분석하고, 통계 분석 결과를 시각적인 표시인 그래프로 표현하고, 통계학 공식에 기반하여 모집단에 대해 혹은 샘플 집단끼리 비교해 추측/판단/검정하고, 데이터 사이의 연관성과 상관관계를 계산하는 방법과 절차들이 단계별로 서술된다. 공개적으로 얻을 수 있는 공공데이터를 활용하는 방법도 소개가 된다. 마지막으로, 데이터 과학이 기반하고 있는 데이터 통계학의 근본적인 한계점(표본 데이터의 크기, 정상 데이터 범위, 불완전 데이터의 보정)들과 해결 방법들이 다뤄진다.

 

------------------------------------------

 

저자도 밝혔듯이 정확한 정의는 없지만, 측정된 데이터를 가지고, 데이터의 성격과 특성을 분석하여 파악함으로써, 의미 있는 정보를 유추해내는 것이 데이터 과학인데, 보통은 통계학적 지식에 기반한 정보처리를 의미하는 것으로 알려져 있다.

그런 면에서, 이 책에서 다루는 내용은 대부분 통계학에 대한 지식을 요구하고 있으며, 실상은 엑셀 프로그램을 통계적으로 처리하는 방법과 절차들을 서술한 것이라고 볼 수 있다.

이 책에서 소개하는 통계 처리의 기능들은 대부분 엑셀에서 명목 상으로 함수 형태로 제공은 하고 있었지만, 제대로 쓰이지 않고 있었던 것도 사실이다. 냉정하게 보자면, 엑셀이 처리하는 데이터의 양이나 속도, 사양 면에서, 전문적인 통계 프로그램에 비해 떨어지기 때문이었다.

놀랍게도, 이 책을 통해 엑셀에 이렇게 많은 통계 관련 기능과 함수들이 많이 있었는지 새삼 깨닫게 되었다. 통계학적인 계산 공식과 수행 방법이 엑셀에서 구체적으로 어떤 함수를 호출하고 어떤 항목을 통해 구현이 되는지를 설명과 예시를 통해 자세하게 설명되는 것이 인상적이다. 어떻게 보면, 엑셀이 제공하는 통계 관련 함수들과 가능들을 활용하는 사용법을 이 책에서 통계적인 설명과 함께 활용 예시를 제공하는 일종의 가이드 책이라고 볼 수도 있다.

아마도, 사회과학이나 경영/경제 분야에서 많이 사용되는 표본 데이터의 기본적인 통계 처리와 분석 작업에도 적용할 수 있는 엑셀 사용법으로 활용도가 높다는 생각이 든다.

엑셀을 이용한 통계 처리법에 관심이 있다면, 일독을 권한다.

 


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo