원인과 결과의 경제학 - 넘치는 데이터 속에서 진짜 의미를 찾아내는 법
나카무로 마키코.쓰가와 유스케 지음, 윤지나 옮김 / 리더스북 / 2018년 9월
평점 :
장바구니담기







우리가 어떤 행동을 할 때는 상당한 돈과 시간이 든다. 그런데 인과관계가 있는 것처럼 보이지만 길은 그렇지 않은 통설을 믿고 행동했다가 기대했던 효과를 얻지 못할 뿐 아니라 돈과 시간까지 버리게 된다면? 이는 바꿔 말해 그 돈과 시간을 정확히 인과관계에 근거한 곳에 쓰면 좋은 결과를 얻을 확률이 그만큼 높아진다는 것이다.

최근 온갖 뉴스 매체에서 4차 산업혁명 시대에 빅데이터의 중요성을 강조하고 있다. 단지 뉴스에서만 접할 수 있는 이야기가 아니다. 정보의 홍수 시대를 넘어 정보의 범람해 그 속에 잠겨버릴 지경에 이르렀다. 실제 우리가 일상적으로 접하는 사회, 경제, 과학, 의학, 교육, 노동 분야에서 매일 수많은 데이터가 쏟아지고 있다. 데이터의 증가와 빅데이터는 더 이상 하나의 현상이 아니라  당면한 경제 현상이라는 사실을 부정하는 사람은 없을 것이다. 많은 사람들이 수많은 데이터를 토대로 우리는 다가올 현황과 더 나아가 미래를 정확하게 분석·예측하려고 한다. 그 이유는 이를 통해 경제적 이윤, 사회적 이윤 등을 얻을 수 있기 때문이다.

반가운 소식은 데이터에 대한 접근성이 과거보다 점점 낮아지고 있다는 점이다. 하지만 누구에게나 열려있다는 것이지, 누구나 분석·활용할 수 있다는 뜻은 아니다. 데이터를 분석하고, 활용할 수 있는 사람에게만 빅데이터는 유용하며, 그렇지 못한 사람에게 빅데이터는 오히려 현시대를 살아가는 데 불리할 확률을 높이는 요인이 될 뿐이다. 《원인과 결과의 경제학》의 저자는"빅데이터 시대에는 데이터 분석 기술뿐 아니라 데이터 분석 결과를 해석하는 기술이 필요하다"라고 말한다. 빅데이터 시대에 유용한 학문이 바로, "통계"다. 

통계에 대한 책을 썼으니, 저자가 당연히 경제학자라고 생각할 수 있다. 하지만 절반만 맞는 말이다. 《원인과 결과의 경제학》의 저자 중 나카무로 마키코는 환경정보학과 공공행정학, 교육경제학을 전공한 사람이고, 쓰가와 유스케는 의과대학을 졸업한 의사다. 의사와 통계가 낯설 수 있지만, 의료계의 거의 모든 논문은 통계를 이용하고 있다. 실제로 책 속 사례 가운데 의료계 관련 예시가 많은 이유도 여기에 있다. 동시에 인과관계가 확실하지 않은, 근거 없는 통설이 수없이 많은 곳 중 하나로 의료 분야이기에 저자는 의료 사례를 통해 인과 추론의 기본적인 개념을 잡을 수 있도록 만들었다. 

예를 들어 '건강검진과 장수와 상관관계가 있는가'라는 가설을 검증하기 위한 방법으로 '랜덤화 비교 시험'을 들어 설명한다. 실험군과 대조군을 나누어 건강 검진을 받은 사람과 받지 않은 사람을 랜덤하게 나누어 비교하여, 건강 검진의 효과를 판단하는 것이다. 그 결과 건강검진 결과 미래에 병에 걸릴 확률이 높은 사람에게 보건 지도를 하였고, 이를 토대로 생활 습관을 개선한 것으로 나타났다. 하지만, 생활습관을 개선했지만, 실험군과 대조군 사이의 사망률 차이는 통계적으로 유의미하지 않은 것으로 나타났다. 이처럼 우리의 기존에 그렇다고 생각한 것에 대해 데이터 분석 방법을 통해 그렇지 않다는 것과 왜 그렇지 않은지를 설명한다. 이 외에도  두 저자는 의료, 교육, 경제 등 우리 실생활에 가까운 사례를 통해, 통계 결과가 다양한 분야에서 적용 가능할 뿐만 아니라 매우 활발하게 활용하고 있음을 보여준다. 

《원인과 결과의 경제학》은 예시를 통해 통계에서 가장 기초적이고 중요한 데이터를 읽는 방법을 설명한다. '지브리의 저주(지브리 스튜디오 영화가 일본 텔레비전에 방영되면 미국의 주가가 떨어진다는 설)'와 같이 우연의 일치에 의한 거짓 상관관계를 읽어내는 방법, 트렌드를 고려하지 않은 채 안이하게 비교 분석한 통계로 내린 정책이 오히려 사회의 혼란을 야기할 수 있음을 일본의 교육정책, 보육정책을 예시로 들어 설명한다. 왜 그런지 설명할 수 없지만, 그렇다고 믿어지는 사회적 통념의 허와 실을 드러낸다. 저자는, 우리가 알 수 있는 것은 어떤 사안 간의 인과관계를 분석하는 것이 즉각적인 뇌의 판단으로 내릴 수 있을 정도로 간단하지 않다는 것을 증명해낸다. 또 더 나아가 우리가 쉽게 인과관계 혹은 상관관계가 있다고 믿은 사실이 통계적으로 유의미한 결과가 아니라는 것을 보여준다. 

이 책은 빅데이터를 어떻게 하면 정확하게 읽을 수 있는가에 집중한다. 하지만 통계학에서 배우는 어려운 용어나, 통계 프로그램, 수식은 빠져있다. 통계학을 공부하는 것이 아니라, 통계적 감각을 키울 수 있는 책이다. 우리의 삶과 닿아 있는 다양한 사례를 통해 데이터를 읽는 시각을 가질 수 있게 도와준다. 이를 위해 다양한 분야에서 예를 들고, 딱딱한 용어를 풀어서 설명하는 등 저자가 들인 공이 책 곳곳에 보인다. 다만, 일본인 저자가 쓴 책이기 때문에 일본의 예가 대부분이다. 과연 《원인과 결과의 경제학》이 우리나라 사람들이 읽기에 적절한지 '외적 타당성(연구 대상과는 다른 집단이 개입했을 때 같은 결과가 재현되는 정도)'을 의심하게 된다. 하지만 대부분 내용이 우리나라에서 겪는 문제와 크게 다르지 않았고, 일본과 우리나라의 사회문제를 비교할 때 대부분 외적 타당성이 유의미하다고 판단하니 크게 의심하지 않고 읽어도 좋을 듯싶다. 건강검진, 어린이집수와 여성의 노동참여율, 최저임금과 고용 간의 상관관계 등과 같이 의료, 교육, 고용 분야의 문제가 우리나라가 크게 다르지 않았다. 외적 타당성을 어떻게 비교할 수 있을지 생각하거나, 이 책을 읽는 내가 실험군으로 참여하는 건가라는 의문이 들지도 모른다. 이런 의심까지 든다면, 분명 재미있게 읽은 독자일 것이다. 

이 책은 데이터를 어떻게 하면 정확하게 읽을 수 있는 방법만 말한다. 하지만 그 정확성은 어떤 사회 현상의 진짜 원인을 짚어내고, 올바른 해결 방안을 찾을 수 있는 토대다. 그렇기 때문에 저자가 '인과 추론'이 빅데이터 시대에 필수 교양이라고 말한 것이다. 통계의 함정에 빠지지 않고 제대로 빅데이터 시대를 이해하고 싶거나, 빅데이터 시대에 필수 교양인 통계에 관심이 있다면 《원인과 결과의 경제학》을 읽어보길 추천한다. 가볍게 '인과 추론', '통계'를 만나기에 좋은 책이다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo