-
-
데이터과학자의 사고법 - 더 나은 선택을 위한 통계학적 통찰의 힘
김용대 지음 / 김영사 / 2021년 2월
평점 :
운전하는 것이 스트레스고 시간낭비라고 생각하여 집에 차를 두고 대중교통을 타고 다니는 사람이 바로 나다. 차를 타고 다니면 시간도 절약은 물론 몸도 편하고 내가 좋아하는 음악을 크게 틀고 노래도 부르면서 출퇴근을 할 수 있지만, 차가 막히는 것이 싫어서 차를 기꺼이 두고 다니는데, 그런 나에게 <왜 내 차선만 막히는가?>에 대한 물음은 늘 있었다.
옆 차선을 봤을 때 차가 없어서 잽싸게 차선 변경을 하고 나면 정말 기가 막히게 내 차선이 막히기 시작한다. 내가 조금 전까지 있었던 차선은 뻥뻥 뚫려있고. 그러니 내가 화가 나 안나?
<데이터 과학자의 사고법>에서는 우리가 일상생활에서 흔히 마주하는 질문에 대해 데이터로 접근하여 속 시원하게 답해준다. 사실 수학과 과학에 관심이 1도 없는 나에게 -- 하지만 난 고등학생 때까지 이과였다 -- <데이터>라는 단어는 크다면 크고 어렵다면 어려운 단어인데, 데이터를 기반으로 한 답변들이 이렇게 속 시원하고 재밌을 수 있다는 것을 이 책을 통해 깨달았다.
<머피의 법칙>이라는 단어를 싫어한다. 왠지 내가 하려고 하는 일마다 잘 안 풀리고 내가 타는 버스만 만석인 것 같은 상황에 쓰이는 말이다 보니, 풍기는 뉘앙스 자체가 좋지 않아서 머피의 법칙이 싫다. 우연을 가장한 것도 싫고. 그런데 이 책에서 말하는 <머피의 법칙>은 우연을 가장한 필연이 아닌, 과학, 즉 싸이언스였다. 안 좋은 기억을 더 오래 기억하는 인간의 뇌 때문이라는 이론도 있다고 한다.
그렇담 내 차선만 유독 막히는 것 같고, 내가 타는 버스만 만석인 것 같은 것이 과학이라는 뜻인데, 도대체 왜 이러는 걸까?
(자세한 답은 책에 있으니 꼭 읽어보시길.)
저자는 독자들이 일상생활에서 마주하는 다양한 문제를 제시하고, 그에 대한 해답을 주기 위해 예시를 주는데, 사람들이 문제점을 제기하는 원인 중에 하나인 시민들과 정부 사이의 갈등에 대해 이야기한다. 그리고 시민 통계와 정부 통계 사이의 차이가 있을 수밖에 없는 이유를 <길이 편이 조사 (length biased sampling)>이라고 칭했다.
아하! 정보화 시대에 <데이터>를 올바르게 수집하고 제대로 분석하는 것이 왜 중요한지 깨닫게 되는 포인트였다. 또한, 저자는 서로가 서로를 잘 이해하기 위해서 데이터 과학을 이해해야 한다고 주장했다. 데이터라면 머리 아프다며 질색했던 나 자신을 돌아보게 된 충분한 계기가 되었다.
-
나는 앞으로 나에게 닥친 사소한 불행이 <나만의 것>이 아니니 개의치 않기로 했다. 내가 타야 할 버스만 안 오는 게 아니고, 내 차선만 유독 막히는 것이 아녔으니. 그리고 데이터 수집부터 분석까지, 거창한 것들은 아니어도, 적어도 내 삶에 가까이 있는 데이터부터 시작하여 차근차근 배워봐야겠다고 다짐했다. 그래야 혼돈의 세계에서 규칙을 발견할 수 있을 것 같아서.
"통계로 거짓말하기는 쉬워도, 통계 없이 진실을 말하기는 어렵다."