원인과 결과의 경제학 - 넘치는 데이터 속에서 진짜 의미를 찾아내는 법
나카무로 마키코.쓰가와 유스케 지음, 윤지나 옮김 / 리더스북 / 2018년 9월
평점 :
장바구니담기



앞서 읽었던「세상에서 가장 쉬운 통계학 입문」에서 저자는 "모집단이 정규분포라는 것만 알고 모분산은 모르는 경우, 소표본에서 모평균을 추정"1하는 것을 "통계학 초급의 수료지점"2이라 기술하고 있었습니다. ​--- 우리의 일상에도, 또한 업무적인 상황 하에서도 예의, 이처럼 부족한 데이터를 바탕으로 한 추론에 의거하여, 특정 결론에 도달하여야 하는 상황이 적잖이 있습니다만, 

'빅데이터'가 유행어처럼 되버린 요즘, 데이터를 이용한 분석이 범람하고 있다. 그러나 데이터는 그 자체만으로는 그저 숫자의 나열에 불과하다. 데이터를 '어떻게 해석할지'가 매우 중요하다. 상관관계에 불과한 데이터 분석을 인과관계로 오인해 버리면 잘못된 판단으로 이어질 수 있다. (p188) 


너무나 많은 양의 데이터가 존재하는 상황에서, 그 데이터를 잘못된 방법으로 분석함으로 인해 발생되는 피해 또한 분명 존재하기도 합니다. 그러하기에, --- 이 책「원인과 결과의 경제학」의 두 저자는 "데이터 분석 기술 뿐 아니라 데이터의 분석 결과를 해석하는 기술도 필요하다"(p21)라 강조하고 있지요. 그리고 그 핵심에는 (제가 누누히 강조했었던, '수단과 목적의 명확한 구분'과도 일맥상통하는) 바로 '인과관계'와 '상관관계'의 구분이 있습니다. 

두 개의 사실 중 한쪽이 원인이고 다른 한쪽이 결과인 상태를 '인과관계가 있다'고 한다. … 한편 두 사실이 서로 관계는 있지만, 원인과 결과의 관계에 있지 않은 것을 '상관관계가 있다'고 한다. (p11) …… 인과관계인지 상관관계인지 정확히 구분해내기 위한 방법로은 '인과 추론'이라고 한다. '인과'란 문자 그대로 '원인과 결과'를 뜻하며, '추론'이란 '있는 사실을 토대로 판단을 이끌어내는 것, 추리와 추정을 통해 결론을 이끌어내는 것'을 의미한다. 즉, 두 개의 사실이 각각 원인과 결과인지 평가해 결론을 이끌어 내는 것이다. (p20)


……………………………………………………………………………………… 

​"미성년자 학생의 어휘력과 발 크기는 강한 상관관계를 보인다. 그러나 이는 인관관계가 아니다. 새로운 단어를 습득한다고 발이 커지는 것도 아니고 발이 커진다고 단어가 저절로 외워지는 것도 아니다. 초등학생이 중학생, 고등학생으로 커갈수록 어휘력도 늘고 발도 커지는 것뿐이다. 나이라는 변수가 제3의 용인, 즉 혼동요인으로 작용한 셈이다."


- 류근관,「통계학」p113, 법문사, 2018.

이처럼 그저 단순한 상관관계에 있을 뿐인 두 사실에 대해, 우리는 종종 그것을 인과관계로 혼동하는 실수는 저지르곤 하지요. 이같은 실수를 방지하기 위해 저자는 두 변수 사이의 관계가 인과관계인지 아니면 상관관계인지 확인해보아야 하며, 그 확인에는 다음의 세 가지가 반드시 이행되어야 한다 적고 있습니다.3


(1) 우연의 일치는 아닌가?4  (2) 제3의 변수는 없는가?5  (3) 역의 인과관계는 존재하지 않는가?6 (p28)

이처럼 상관관계와 인과관계의 구분을 위한 통계적 기법으로 이 책은 '랜덤화 비교 시험', '메타 분석'7, '자연 실험', '이중차분법', '조작 변수법', '회귀 불연속 설계', 그리고 '매칭법'을 소개하고 있지요. --- 실제로 이런 통계 기법을 사용해야하는 사람을 대상으로 하고 있다기 보다는8, '원인과 결과' (혹은 '수단과 목적')를 구분하는 것이 그만큼 중요하다,라는 메시지를 독자들이 확실하게 이해해주기를 바라는 정도가 이 책의 의의가 아닐까 싶습니다.9 그런 점에서, 이 책을 읽기로 결정한 투자자의 입장에서도, 또한 다 읽어 낸 독자의 입장에서, 다음 한 가지만큼은 확실하게 이해하는 것이 좋지 않을까 하는 생각을 해봅니다. 


·

·

·

최저임금 인상은 종종 경기가 악화됐을 때 취해지는 정책으로, 임금을 올려 개인 소비를 진작시키는 것이 그 목적이다. …… 연구 분석10 결과, 최저임금 상승은 고용을 상승시키지 않는다는 것으로 드러났다. (pp111 ~ 112)


이 문장만을 근거로 한다면, 현재 우리나라에서 제기되고 있는 최저임금 인상에 따른 고용 감소는 단번에 반박되어지게 됩니다. 하지만 과연 그래도 될까요? 


"특정한 인과효과 추정치가 그것을 도출한 연구에서 대표하는 수준을 넘어서 다른 시간, 다른 장소, 그리고 다른 사람들에 대해 예측력을 가지고 있는가의 문제는 외적 타당성(external validity)이라고 부른다."


- 조슈아 앵그리스트 · 예른 슈테펜 피슈케,「고수들의 계량경제학」p114, 시그마프레스, 2017.


적잖이 언급했었던, 병 나음받은 자의 간증이란 건 오로지 그 사람에게만 해당되는 개인적인 경험일 뿐이지11, 그 사람의 간증대로 한다 하여 그 누구나! 병 나음을 받게 된다/받을 수 있다는 아님을 우리는 압니다. 이처럼 --- 특정한 한계를 지닌 집단을 대상으로 한 추론의 결과를 '보편적(universal)'인 것으로 간주하는 오류는, 개인의 차원을 넘어 불필요한 사회적 갈등 및 낭비까지를 초래할 수도 있기에, 그 적용에 매우 신중해야 하는 것이죠.  


인과관계를 검증하지 않고 언뜻 효과 있어 보이는 정책을 무턱대고 실시한다면 국민들에게 큰 위험 부담을 안기게 된다는 점을 결코 잊어서는 안 될 것이다. (p115)


이같은 '외적 타당성'과 관련하여, (조금은 다른 개념이지만) '반사실(反事實)'12과의 비교 또한 매우 중요합니다. 예를 들어, 


"이러한 성공은 내가 육감을 믿고 과감하게 투자했기 때문에 가능한 것이었다"13란 도널트 트럼프의 자기 확신은, 정확하게는 '그 시절, 그 장소에서 그 사람'에게만 유효했었던 것이지, 그 자체를 우리가 배워야 할 보편적인 '거래의 기술'로 받아들여서는 안 된다는 것이지요.14 --- "성공담에서 사회적인, 역사적인 운()은 대개 중요하게 취급되지 않고, 그들의 인간 승리만이 비춰진다"15라는 이건범의 일갈은 바로 이 '반사실'의 존재를 완전히 무시한 것에 대한 지적인 겁니다. 


누군가의 성공 스토리에서 우리는 사실만 확인할 수 있고 반사실은 알 수 없다. (p47)


……………………………………………………………………………………… 


그 시작은 예의 업무적 필요성 때문이었습니다만, 뭔가 이 프로젝트를 조금이라도 더 완벽하게 수행하고 이해하기 위해서 뿐만이 아닌, 이 참에 다시 한 번 옛 지식들을 renewal 해보고 싶다는 개인적 욕심이, 이 책「원인과 결과의 경제학」을 읽고나니 생겨나네요. 올 한 해 읽어내게 될 책의 권수를 어느 정도 희생하더라도, 앞으로 당분간은 연필과 연습장과 함께하는 (독서라기 보다는) 공부를 하게 될 듯...




  1. 고지마 히로유키,「세상에서 가장 쉬운 통계학 입문」p221, 지상사, 2009.
  2. 고지마 히로유키, 앞의 책 p226
  3. "두 변수가 인과관계에 있다면 다시 원인이 발생했을 때 같은 결과를 얻게 된다. 즉 '우연의 일치', '교란 요인', '역의 인과관계'는 존재하지 않는다는 것이다. 한편 두 변수의 관계가 상관관계에 지나지 않는다면, '우연의 일치', '교란 요인', '역의 인과관계' 중 하나가 존재한다. 상관관계의 경우, 그 원인이 다시 일어나도 같은 결과를 얻게 된다고 보기는 어렵다." (p35)
  4. "우연의 일치이기는 하지만, 두 변수가 매우 비슷한 움직임을 보이는 것을 '거짓 상관Spurious Correlations'이라 부른다. … 주가를 예측하는 사람들 중에는 우연의 일치로 발생한 사건들은 마치 '근거는 없지만 잘 맞는 경험 법칙''처럼 믿는 사람이 의외로 많다." (p30)
  5. 바로 위의 인용문.
  6. "원인이라고 오해했던 것이 결과이고, 결과라고 생각했던 것이 원인인 상태를 '역의 인과관계'라고 부른다." (p35)
  7. "메타 분석이란 복수의 연구 결과를 종합해 전체적으로 어떤 관계가 있는지 검증하는 방법이다. (p65) … 여기서 '메타'란 '고차원'을 의미하며, 복수의 연구 결과를 하나로 종합해 전체적으로 어떤 관계가 있는지 밝히는 기법이다." (p73)
  8. "이 책은 인과 추론의 개념을 철저하고 알기 쉽게 설명하기 위해 쓰여졌다. … 그리고 인과 추론과 데이터를 이용한 경제학의 연구 결과를 소개하고 그 해석, 즉 자료를 보는 방법에 대한 설명에도 지면을 충분히 할애했다." (p20)
  9. 통계 기법의 학습은 그 다음 단계가 되겠지요.
  10. 미국 뉴저지주와 펜실베이아주의 경계를 사이에 두고 있는 서로 이웃한 군을 대상으로 한 연구 분석
  11. 물론 신의 존재와 그 병 나음에 있어 발휘되었을지도 모르는 신의 능력까지를 부인하는 것은 아닙니다.
  12. "반사실이란 '만약에 OO을 하지 않았더라면 결과는 어떻게 됐을까?;라는 식으로 실제로는 일어나지 않은 사실을 가정하는 시나리오를 가리킨다. … 인과관계의 존재는 원인이 발생한 '사실'의 결과와, 원인이 발생하지 않은 '반사실'의 결과를 비교해 증명해야 한다는 것을 기억하도록 하자." (p37)
  13. 도널드 트럼프,「거래의 기술」p300, 살림, 2016.
  14. 트럼프의 그 책을 통해 우리가 배워야 할 내용은 아마도 다음의 내용이 아닐까 싶습니다. --- "겁낼 필요가 없다. 무슨 일이 벌어지든 당신의 자리에서 당당히 일을 하면 된다", 도널드 트럼프, 위의 책 p118
  15. 이건범,「파산」p13, 피어나, 2013.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo