-
-
원인과 결과의 경제학 - 넘치는 데이터 속에서 진짜 의미를 찾아내는 법
나카무로 마키코.쓰가와 유스케 지음, 윤지나 옮김 / 리더스북 / 2018년 9월
평점 :
'빅데이터'가 유행어처럼 된 지금 누구나 간단히 데이터를 분석할 수 있게 됐다. 그러나 이는 데이터의 분석 결과를 정확하게 해석할 수 있게 됐다는 의미가 아니다. 빅데이터 시대에는 데이터 분석 기술뿐 아니라 데이터의 분석 결과를 해석하는 기술도 필요하다. (p. 21)
데이터들이 중요한 경제 요소로 자리 잡게 된 현재, 매일같이 쏟아져 나오는 데이터 홍수 속에서 데이터 분석 기술을 우리에게 아주 유용한 자산으로 자리 잡게 되었다. 데이터를 선별하고 활용하면서 나온 결과를 사용해 우리는 더 넓은 용도로 활용하고 있는데, 우리는 간혹 이 과정에서 오류를 범하는 실수를 저지르곤 한다. 《원인과 결과의 경제학》은 넘치는 데이터 속에서 진짜 의미를 찾아내는 법, 그러니까 데이터 분석 결과를 해석하는 과정에서 오류를 범하지 않기 위한 방법을 제시해준다.
'인과'란 문자 그대로 '원인과 결과'를 뜻하며, '추론'이란 '있는 사실을 토대로 판단을 이끌어내는 것, 추리와 추정을 통해 결혼을 이끌어내는 것'을 의미한다. 즉, 두 개의 사실이 각각 원인과 결과인지 평가해 결론을 이끌어내는 것이다. 일상생활 속에서도 인과관계와 상관관계의 차이를 이해하고 '정말 인과관계가 있는지' 명확히 하는 훈련을 해두면 착각이나 근거 없는 통설에 현혹되지 않고 정확한 판단을 내릴 수 있다. (p. 20)
《원인과 결과의 경제학》은 데이터가 제시하는 숫자에 현혹되는 우리에게 데이터 사이의 '관계성'에 주목하라고 한다. 데이터가 범람하는 시대에 살고 있는 우리는 '인과 관계'와 '상관관계'의 차이 속에서 혼란에 빠지는 경험을 한 적이 종종 있다. 사람들은 흔히 상관관계에 놓인 두 사실에 대해서 연결 지으며 오류를 범하기도 하거나 혹은 우연의 일치에 불과하는 것들을 바탕으로 인과 추론을 하는 오류를 범하기도 한다. 시간과 비용의 낭비를 막기 위해서는 이 오류가 바로 잡혀야 한다. 《원인과 결과의 경제학》에서는 그 해결책으로 '인과 추론'을 제시한다.
책의 저자 나카무로 마키코와 쓰가와 유스케는 굉장히 흥미로운 관계에 놓인 질문들로 데이터를 해석하는 방법을 설명한다. '건강검진을 받으면 장수할 수 있다?', '아이들이 텔레비전을 많이 보면 성적은 떨어진다?', '명문 대학을 졸업하면 연봉이 높다?'라는 사람들이 일상생활에서 생각해보거나 간혹 진실을 놓치지 쉬운 질문들을 통해 호기심을 유발하며 시작한다. 인과 추론의 영역이 더 이상 연구자들의 분야가 아니라는 사실을 강조하며 누구나 쉽게 인과 추론의 과정에 접근할 수 있도록 유도한다.
누군가의 성공 스토리에서 우리는 사실만 확인할 수 있고 반사실은 알 수 없다. 그런데도 사실만 보고 마치 인과관계가 있는 것처럼 착각해 무조건 텔레비전을 못 보게 하거나 무턱대고 건강검진을 받는다면 기대했던 목표를 달성하기는커녕 당신의 소중한 돈과 시간만 낭비하게 될지도 모른다. (p. 47)
《원인과 결과의 경제학》을 읽다 보니 한국 사회에서 대두되는 문제들이 일본 사회에서도 비슷하게 대두되고 있다는 사실을 알게 되었다. 최저 임금의 인상과 고용의 관계, 어린이집 대기제와 여성 취업률의 관계 등 한국 사회에서도 범하고 있는 오류들을 일본 사회에서도 종종 범하고 있어 그에 대한 데이터 해석 과정이 더욱 중요하다는 사실을 깨달았다.
어렸을 때부터 인과 추론 교육을 받은 미국에 비해 일본이나 한국 사회에서는 아이들이 인과 추론에 대해서 쉽게 배우지 못한다는 것이 아쉬웠다. 대학에서 전공 과목으로 미디어 조사 방법론을 수강하면서 두 가지 변인의 인과 관계를 밝혀내는 과정을 거치게 되었는데, 인과 관계라고 믿었던 두 가지 변인이 사실을 상관관계 속에 놓여 있었다는 사실에 경악하면서 모든 과정을 다시 시작했던 적이 있었다. 여전히 어려운 인과 추론이지만 《원인과 결과의 경제학》에서는 그 과정을 쉽게 설명하고 있으니 누구나 데이터 분석을 위한 쉬운 입문서로 활용할 수 있을 것이라고 본다. 그리고 당신도 할 수 있다!