수학보다 데이터 문해력 - 서울대 통계학과 정성규 교수의
정성규 지음 / EBS BOOKS / 2022년 11월
평점 :
장바구니담기


<수학보다 데이터 문해력>은 통계학을 다룬 책입니다. 언제부터인가 우리들은 4차산업혁명을 외치기 시작했고 그곳의 중심에 빅데이터가 있습니다. 그 빅데이터를 활용해서 정치, 경제, 사회, 경영, 마케팅, 심리학, 화학, 의학 등 많은 분야에 이용하기 위해서는 빅데이터를 통학계이라는 필터를 거쳐야 합니다. 요즘 활황이 붙고 있는 인공지능, 딥러닝도 기본엔진은 통계학임을 모두 인정을 합니다. 인공지능을 배울때 통계는 정말 기본이죠. 이러다보니 데이터가 있는 모든 곳은 통계가 있다라고 선언을 해도 되죠. 그런데 이러한 데이터를 통계로 표시하는데 중요한 것은 계산이 아니라 '생각'이라고 합니다. 저자는 '통계는 삶의 숱한 문제를 해결하고 복잡한 현상을 이해하는 요긴한도구이다"(16p)라고 확신을 합니다. 이러한 수준에 오리기 위해 통계의 기초부터 인공지능 그리고 통계의 문제점까지 통계학의 개념과 이론 검토를 합니다.

저자는 정성규 서울대 통계학과교수입니다. 서울대 통계학과를 나오셨고 미국 노스캐롤라이나대에서 박사를 받고 7년간 미국 피츠버그대학교 통계학과 교수를 하신 실력파십니다. 2018년부터 서울대에 자리를 잡으셨습니다. 저서로는 <비모수통계학 with R>이라는 전작이 있습니다.

통계학은 확률과 통계로 되어 있죠. 통계학을 알려면 확률과 통계를 알아야 합니다. 우선 확률은 인류의 역사만큼이나 오래된 '도박'과 함께 시작했다고 합니다. 주사위나 포커 등 도박을 할때 정말 확률을 생각할 수있는 선수는 아무생각없이 경험만 있는 사람과 판을 한다면 확률을 생각하는 사람을 이길수는 없겠죠. 이 확률은 '상식을 수학으로 표현한것'이라고 합니다 그럼 통계는 무엇일까요. 통계는 이어지도록 계산하는 거라고 합니다. 통계의 한자뜻이 그렇습니다. 그럼 서두에서도 이야기했지만 통계는 데이터가 있어야 가능합니다. 그래서 통계학은 데이터를 다루는 학문이라고 합니다. 문제는 데이터에 쓰레기가 많다는 거죠. 이 쓰레기를 정리하고 요약하는 것을 통계라고 합니다.


통계는 다양한 표본(데이터)을 사용하다보면 서로 다를 수있는 결과로 통계학자는 불확실성을 인정하고 조사결과를 해석하는 데 신중하라고 합니다. 그래서 통계학자는 데이터가 얼마나 달라지고 어떻게 변하는지 확인해야 합니다. 이를 위해 평균,중앙값, 표준편차 등을 공부시킵니다. 사실 통계학이라고 하면 참 구닥다리라고 생각했는데 최근 인공지능이 활성화되면서 통계학이 크게 눈길을 받고 있습니다. 통계를 모르는 데이터사이언티스는 없죠. 그래서 대부분 통계학 석사 박사를 한분들이 데이터과학자의 위치에 올라갑니다. 이들의 역할을 스팸이메일처리,유전자의 염기서열분석에도 사용이 됩니다.

 그렇다고 모든 분야에 인공지능이 사용되는건 아닙니다. IBM의 왓슨온콜로지로 의료계의 암판정에 도입이 되었지만 암판정데이터를 많이 확보하지 못한 이유로 IBM은 올해 왓슨온로지의 의료분야철수를 결정했습니다. 데이터에 신호와 소음이 너무 섞여있어서 통계를 낼수가 없었다고 합니다. 이외에도 새벽배송, 코로나19 등에도 인공지능은 점점더 깊게 사용되고 당연히 통계의 중요성은 더욱 높아집니다.


마지막은 통게의 거짓말을 알려줍니다. 이것은 미디어나 다양한 기관에서 제공하는 데이터통계정보가 어떻게 사람들 눈을 속이고 머리를 속이는지알려줍니다. 가장 심한 부분이 그래프와 차트의 크기로 사람들을 혼동을 주는 거죠. 이는 미국과 한국 가리지 않고 고의와 실수를 혼용되어 독자를 혼란시키는 경우가 너무도 많습니다. 그리고 필연성의 법칙으로 미국 미스아메리카의 나이와 살인건수가 연관이 있다는 황당한 주장을 한 통계도 잇었습니다. 통계는 보물섬이지만 쓰레기도 함께 포함되어 있음을 명심해야 합니다. 저자가 소개하는 통계의 설명은 총 58개이고 이는 하나하나 확률통계의 이론과 개념설명으로 이루어져있습니다. 시간날때마다 소제목과 내용을 매치하면서 다시 한번 생각해 본다면 통계학을 제대로 배울때 더욱 도움이 되고 많이 발표되는 통계수치의 문제점과 이면의뜻도 이해가 가능할겁니다.

본 도서는 리뷰어스클럽으로부터 무상으로 제공받아 주관적인 리뷰를 했습니다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo