-
-
신은 주사위 놀이를 하지 않는다 - 로또부터 진화까지, 우연한 일들의 법칙
데이비드 핸드 지음, 전대호 옮김 / 더퀘스트 / 2016년 4월
평점 :
구판절판
안전벨트를 착용하지 않았다가 경찰에게 걸리면 벌칙금을 내야 하지요. 근데 이게 가만 생각해보면 --- 내가 불편해서 안전벨트 안매고 운전하다가 길 옆 벽을 들이박아 (나 혼자!) 다쳤을 때, (따라서) 이게 뭐 누구에게 피해를 준 것도 아니고, 그렇다고 안전벨트 매고 똑같은 사고가 났을 때 국가에서 '안전벨트 착용하라 해서 착용했는데도 다쳤으니 미안해!'하면서 치료비를 대주는 것도 아니고, 그래 '대체 왜 법으로 (불편함을) 강제하고 (그것도 모자라) 범칙금까지 부과하는 거냐?'라고 경찰관에게 묻는다면 과연 어떤 대답을 들을 수 있는걸까요? 아마도 '우리 경찰은 법집행기관(law enforcement)이지, 입법기관(law maker)가 아니니 그런 걸 우리에게 따지지 마라!'라는 답변 정도가 아닐까요?
(범칙금의 부과같은 걸 설명하는 데에까지 '법철학' 같은 게 필요한건지는 모르겠습니다만, 그런 건 안배웠으니 모르겠고 배운게 도둑질이라고) 경제학적 논리로 생각해보자면 --- 국가가 일 개인의 안위를 걱정해 안전벨트 착용을 강제하는 것이 아니라, 사회 전체적으로 본 손실을 최소화하기 위해 모두에게 안전벨트 착용을 강제한다,라 이해가 됩니다. (즉, '당신의 목숨은 하나 뿐입니다'라는 표어로 마치 국가가 개인의 안전을 걱정해주는 듯 보여지지만 사실 '대한민국에게 인적자원은 단지 5,100만 명 뿐이기에'라는 게 진짜 이유죠. 많이 다치고 죽어가다 보면 게 중엔 정말 국가가 필요로 하는 사람들도 있을테니까요.) 이 논리는 마약 복용 금지의 경우에도 똑같이 적용되지요. 이처럼, 뭔가 내가 규제를 당한다 할지라도, 그 규제의 이유를 알고나 당하면 억울함이 조금이나마 덜해지듯이! (진짜?)
「신은 주사위 놀이를 하지 않는다」란 제목의 이 책은 '통계학적 사고(思考)'에 관한 소개를 해줌으로써 --- 흔히 '지극히 일어날 확률이 낮은 것'의 대명사격으로 언급되곤 하는 '걷다가 번개맞는 사고'가 분명 지구상의 누군가에게는 일어났었고, 앞으로도 분명 일어날 것이듯 (지구 위 어느 곳에선 어쩌면 지금 이 순간에도!) "아무리 상상해도 일어날 것 같지 않은 일"(p10)들이 때때로 그러나 실제로 발생하고 있다라는 사실을 부디 당황하지 말고 받아들이라고, 게다가 기실 그 사건들은 천지개벽할 '우연'이 아닌, 다 나름의 이유를 지니고 있다라 말해주고 있습니다. 심지어! 저자 데이비드 핸드는 여기에서 한 발 더 나아가,
우주의 작동에 불규칙한 면이 있다는 사실은 우리를 불편하게 한다. 우리는 현상이 일어나는 이유를 알고, 그 인과관계를 확립하고, 또 배후에 있는 규칙을 이해하기를 원한다. …… 만약 일어날 법하지 않는 사건을 예측할 수 있거나 나아가 통제할 수 있다면 그야말로 엄청난 위력을 지닌 셈이다.(p28)
마치 영화 <Minority Report>에서 보여졌던 바로 그 '엄청난 위력'이 현실이 될 수도 있는 것인 양 이야기하고 있기도 합니다. 물론! 저자가 그런 식으로의 '예측과 통제'를 원하는 것은 아니겠습니다만 어쨌든 --- "우연의 바탕에 깔린 '원인'들을 어떻게 이용할 수 있을까? 어떻게 하면 그 원인들을 조작하여 도움을 받을 수 있을까?"(p19)란 의문이, (최소한) 이 책의 초반부에서만큼은 저자가 독자들에게 던져주고 있는 가장 핵심적 메시지로 꼽아져야 한다라 생각합니다.
…………………………………………………………………………………
동전 던지기 20번을 해 각 던지기마다 앞·뒷면으로 돈내기를 가르는 게임을 한다 치죠. 19번의 시도에서 앞면이 2번, 뒷면이 17번 나왔다할 때, 20번째의 시도들에서는 '평균적인 확률 1/2로 비추어 보아' 뒷면이 나올 확률이 더 크다!라는 쪽에 돈을 거는 것은 과연 옳은 추론일까요?
통계학을 배운 사람일지라도 일상적/상식적 사고에 의해 순간 '그렇다'란 선택을 할 수도 있습니다. 앞서 19번의 시도에서 뒷면이 17번이나 나왔다는 건 분명 '일어날 수 없는 일'로 여겨지며, 따라서 이 기이한 결과를 결국 '일어나야 하는 일'로 되돌리기 위해선, 간단히 말해 (이 법칙을 알건 모르건) '대수(大數)의 법칙 Law of Large Numbers(LLN)'에 따르면 '그러하다'라 판단하는 것이 맞는 것처럼 보이니까요. 그러나!!! --- LLN이 '평균적인 확률 1/2'를 근거로 이 20번째의 시도에서 뒷면에 베팅을 하는 것이 통계학적으로 옳다,라는 걸 의미하는 건 결코 아닙니다. 1번째 부터 19번째의 동전 던지기가 그러했었듯, 20번째의 동전 던지기 역시 그 이전의 동전 던지기(의 결과)와는 완전하게 독립된 사건(event)이기 때문이지요. 그렇다면 LLN이 의미하는 바는 대체 무엇일까요?
한 집단에서 무작위로 뽑은 표본들의 평균은 표본들의 개수가 많을수록 집단 전체의 평균에 더 접근할 개연성이 높다.(p231)
즉, 앞서 19번의 시도에서 앞면이 많이 나왔다라는 결과가 '20번째 던지기에서 뒷면이 더 많이 나올 것'이라는 추론의 근거가 될 수는 없다라는 것일 뿐이며, LLN이 말해주는 진짜 의미는 단지! --- 전체적으로 "동전 던지기의 총 횟수가 증가함에 따라 (이론적 예측과 어긋난 앞서의 결과들이) 희석되어 미미해진다"(p68)라는, 단지 '개연성이 높다'라는 것 뿐인, 매우 애매모호한 조언이라는 겁니다. (동전 던지기의 결과를 예측하는 것은 '수학'이 아닌, '통계학'이라는 걸 명심할 것!) 이제 일상에서, 때로는 매우 중대한 판단의 순간에서조차 우리가 자주 혼동하게 되는 또 하나의 경우를 보죠.
·
·
·
'까마귀 날자 배 떨어진다'
(이 속담이 '떨어지느냐 마느냐의 임계점(臨界点) 상태에 있는 배가 달려있는 가지 위에 앉아있던 까마귀가 휙~하고 날아오르는 순간 그 반동으로 인해 배가 떨어졌다'는 걸 의미하지 않는 다는 전제하에) 하늘을 보니 까마귀가 막 날아오르기 시작하자(A), 저쪽에 있는 배나무에서 배가 떨어지더라(B)라는 동시적 발생이 전국 각지의 수많은 사람들에게 오랜 세월동안 보여졌었었기에 무려! 속담의 경지에까지 이르르게 되지 않았을까라 생각합니다. 정말 --- 까마귀가 날자마자(A) 배가 떨어지는 것(B)간엔 모종의 관계가 숨어 있는 것일까요?
한 사건에 이어 다른 사건이 일어나는 일이 놀랄 만큼 자주 반복되더라도, 첫째 사건이 둘째 사건의 원인이라고 단정할 수는 없다. 통계학자들은 이를 '상관성은 인과관계를 함축하지 않는다'라는 경구로 표현한다. …… 시간적 선후 관계는 인과관계의 필요조건이지만 충분조건은 아니다.(p32)
다시 말해, A라는 사건(event)과 B라는 사건 사이에 일종의 '상관관계'(correlation)'가 존재하는 듯 보이지만, 심지어는 실제 A와 B 사이에 강한 '상관관계'가 존재한다 할지라도! 그것이 반드시 둘 사이에 '인과관계(causation)'까지 존재함을 의미하는 것은 아니라는 사실을 미처 인지해내지 못한 데서 오는 오류라는 겁니다. 이러한 '인과관계(causation)과 상관관계(correlation) 간의 오해'가 극대화되는 경우가 바로 '나비효과'이지요. 예를 들어,
'경기(景氣)가 안 좋으면 여성들이 입는 치마의 길이가 짧아진다'라는 속설을 보죠. 이것이 꽤나 오랜 기간 동안 많은 사람들에 의한 관찰의 결과이기에, (그 연관관계까지는 정확히 알 수 없지만) 어쨌든 전혀 상관 없어 보이는 두 요인들을 하나의 문장으로 엮어낼 수 있는 일종의 '상관관계'가 성립된다,라 말할 수는 있을지언정 이 둘 간에 '인과관계(causation)'가 존재한다고, 즉 경기가 안좋아지는 것이 치마의 길이를 짧아지도록 초래(cause)했다라고는 결코 말할 수 없는 겁니다. 만약 이게 성립한다면 극단적으로 말해, 대한민국의 경기가 안좋아졌을 때 우린, 음흉한 현재의 재경부 장관을 성욕(性慾)을 초탈한 사람으로 바꾸면 되는 아주 간단한 해결책을 가지게 되는 것이겠죠. --;;
…………………………………………………………………………………
저자는 이 책에서 --- 자신이 '우연의 법칙(improbability principle)'이라 명명(命名)한 커다란 틀 속 일련의 법칙들을 이용해, 우리가 흔히 '일어날 법 하지 않은 일이 일어났어!'라 말하곤 하는 현상들이 기실 우연의 결과가 아닌, 충분히 그럴 수도 있음 혹은 그러할 수 밖에 없음이라는 걸 설명해주고 있습니다. 우선!
저자는 '사건의 확률(probability)'를 "사건이 일어날 법한 정도 또는 사건이 일어날 법하다는 믿음의 강도"(p62)라 정의하며, 이 책에선 "개연성이 매우 낮은 사건, 즉 확률이 0에 가깝지만 완전히 0은 아닌 사건"(p63)들을 중점적으로 다루고 있습니다. 실제로 발생했었던 '확률이 0에 가까운 사건들'의 적잖은 예들을 들며, 저자는 예의 "개연성이 극히 낮은 일 … 들은 전혀 예측 불가능한 것처럼 보이지만 실은 예상할 수 있고 예상해야 마땅하다. 그런 일들을 설명하기 위해 … 필요한 것은 확률에 관한 기본 법칙들뿐이다"(p57)라는, 노골적으로 이 책의 마케팅을 위한 멘트로 이 책을 시작하고 있기도 하지요.
저자가 '우연의 법칙'이라는 한 이름으로 묶어 낸, '일어날 법 하지 않은 일들의 발생'을 설명해주는 다섯 가지의 법칙들은 다음과 같습니다.
① 필연성의 법칙(law of inevitability) : 무슨 일인가는 반드시 일어난다는 사실.
② 아주 큰 수의 법칙 : 아주 많은 기회가 있으면, 아무리 드문 일도 일어날 가능성이 높다.
③ 선택의 법칙 : 당신이 사후에 선택한다면 확률을 마음대로 높일 수 있다.
④ 확률 지렛대의 법칙 : 상황의 미세한 변화로 미미한 확률이 엄청나게 높은 확률로 바뀔 수 있다.
⑤ 충분함의 법칙 : 일치한다고 간주할 만한 사람들의 범뮈와 사고들 사이의 시간 간격을 확장한다. 그리고 이를 통해 기묘한 우연의 일치인 듯한 사건을 목격할 확률을 때로는 아주 큰 폭으로 증가시킨다.
결론만 말해보자면 --- 저자는 이 다섯 가지의 법칙들 중 하나만 작동해도 "한 사람이 여러 번 로또에 당첨되는 일, 금융위기, 예지몽"(p277)등이 일어날 수도 있으나, 이 법칙들이 함께 엮여서 작동할 때 진정함 힘이 발휘된다라고, 즉 '걷다가 번개를 맞은 사람이, 두 주 연속 로또에 당첨되고, 2년 터울의 네 딸들이 모두 8월 3일에 태어나는 일'도 얼마든지 발생할 수 있다라 말해주고 있습니다...만!!!
뭐 그렇다 믿어주기로 하려해도 선뜻 믿어지지 않는, 천지개벽할 우연이 결코 우연이 아니라, "우연한 일들의 법칙"이다라는 게 결코 이 책을 통해 (출판사는 그렇게 마케팅을 하고 싶었겠으나) 저자가 하고 싶은 주장이라고는 생각되지 않습니다. 그럼 뭐냐?
·
·
·
pp212-213에 실려 있는 '검사의 오류(prosecutor's fallacy)'에서 잘 설명되어지고 있듯 "확률에 대한 직관적 이해가 부정확"(p210)하기 때문에 우리의 혼란/혼동이 시작되는 것이며, 잘못된 판단/결론을 내리게 되는 거라는, 즉! --- 사회 현상들에 대한 판단에 있어 아주 많은 경우, 확률(좀 더 넓게 보자면 통계학)에 대한 정확한 이해를 하고 있어야 하며, 이것만이 아니라 사회 현상의 기저에 깔려 있는 논리적 구조를 알 수 있어야만 정확한 이론(理論)의 적용이 가능한 것이라는, 한 마디로 '조금만 알고 나면 별 놀랄 일 아니고, 좀 더 많이 알고 있다면 꽤 정확한 예측도 할 수 있게 된단다'로 이 책을 정리해 낼 수 있다 생각합니다. 여기까지가 이 책이 지닌 장점이라면!
저자는 통계학의 배후에도 매우 정교한 이론(theory)들이 자리하고 있다라 설명을 전개해가고 있습니다만, 기실 이 책에 등장하는 수많은 '법칙들'은 2학기짜리 통계학 수업 내용 속에 모두 다 들어있는 것들이지요. 경제학에서도 그러하듯, 기본적인 가정(假定)들을 조금씩만 완화시켜 놓고 이후의 이야기를 풀어놓으면 뭔가 되게 멋있고 심오한 내용으로 들리는 것처럼 --- 이 책에 담겨 있는 저자의 주장들 역시 딱히 새로운 것이 아닌, 기본적 확률론/통계학의 서술 그리고 적절한 분량으로 가미된 '가정의 완화'를 통한 '뭔가 있어 보이는 듯한 설명'들이 전부일 뿐이라는 건, 어쩌면 대중교양서가 지닌 근본적 한계가 아닐까하는 생각을 하게도 됩니다. 어쨌든!!!
책의 한국어 판 제목관 달리, 통계학/확률론의 근원적 한계는 예의 '신은 주사위 놀이를 한다'라 말하는 것이 차리리 솔직한 의견이다라는 걸 보여주는 내용이 아닐까 하는 생각을 합니다. 그리고 그것이 바로 --- 수학과 통계학의 가장 근본적 차이점, (단지 차이점일 뿐 이것이 두 학문분야간의 우열을 말하는 건 절대 아닌)이기도 하겠구요.
※ 통계학에 관한 꽤 괜찮은 일반 입문서 : 최제호 著, 「통계의 미학」, 동아시아 刊, 2007.
- 안전벨트의 착용여부는 전적으로 자신의 안전을 위함이지, 설혹 차량 대 차량의 충돌이 발생했다 해도 내가 안전벨트를 매지 않았다 해서 상대방 차량의 탑승자의 상해 정도가 영향을 받는 것은 아니지요.
- 물론, 의료보험혜택이란 게 있기는 하지만 그것 역시 내 돈이 들어가 있는 것이니 국가의 선심(善心)과는 거리가 좀 있지요.
- 전인권 C가 제 아무리 '내가 골방에서 혼자 대마초 피우고, 그로 인해 영감이 떠올라 좋은 노래를 작곡해내는데, 왜 감방엘 가야 하느냐?'라 묻는 것 자체는 충분히 이해될 수 있는 것이지만, 국가가 국민 전체를 상대로 그처럼 각 개인의 사정을 보아가며 법을 적용할 수 없기에 그냥 일괄적으로 '대마초 피우는 사람은 감방행!'이란 기준을 만들어 놓은 것이지요. 대마초 피우고 깽판 치는 사람들이 명곡을 작곡해내는 사람들보다 훨씬 많은 건 부인할 수 없는 사실이니까 말입니다.
- 이 책이 통계학 교과서는 절대 아니나 어느 정도의 통계학 지식을 지니고 있는 독자에게, 그렇지 않은 독자에게보다는 훨씬 더 매력적으로 느껴질꺼라는 건 자명한 사실이지만, 사실은 '통계(학)'에 관한 책이라기보다, '사고(思考)'의 방식(way of thinking)을 배울 수 있는 것에 더 많은 의미를 부여하는 것이 합당하다라 생각합니다.
- 맞는 이유라도 알고 맞으면 덜 억울하지 않겠니, 뭐 이런 거죠.
- 다만, 책을 다 읽고나서 되돌아볼 때, 과연 그 정도 수준 - 원인들을 조작하여 도움을 받을 수 있는 - 에 도달한다는 것이 본질적으로 가능한가,라는 의문이 들기는 하더군요. 이 책에 대한 저의 생각을 미리 말해보자면 --- '신도 주사위를 던진다!'
- 이 책에선 '큰 수의 법칙'으로 번역되어 있더군요. 이 책이 통계학 교과서가 아님을 보여주는 대표적 예이지요.
- "우연한 사건을 예측할 수는 없지만 그런 사건도 모종의 규칙성을 띨 가능성이 있다는 생각은 만만치 않은 지성의 도약을 요구한다. 동전 던지기에서 앞면과 뒷면 중에서 무엇이 나올지는 전혀 모르더라도 동전을 1,000번 던지면 500번쯤 앞면이 나옴을 깨닫는 것은 엄청난 개념적 진보다. 이 깨달음은 중력이 모든 물체들 사이에서 작용하는 보편적인 힘이라는 깨달음에 못지않는 지적 발전이다. 이 지적인 진보가 얼마나 거대한 것인지는 오늘날에도 많은 사람들이 우연한 사건의 속성들을 이해하는 데 어려움을 겪는다는 사실에서 알 수 있다. 예컨대 동전 던지기를 하는데 처음 열 번의 시도에서 앞면이 뒷면보다 더 많이 나온 것을 보면 많은 사람들은 다음 시도들에서는 뒷면이 더 많이 나와서 균형이 회복되리라고 예상한다. 그러나 이 생각을 틀렸다. 이 오해는를 워낙 만연해서 '도박꾼의 오류 (gambler's fallacy)'라는 명칭까지 얻었다."(67)
- 즉, 그 이전의 던지기에서 어떠한 결과가 나왔었든 20번째의 동전 던지기는 그 이전의 결과들과 완벽하게 무관하다는, 그러니까 20번째의 동전 던지기에서도 여전히 앞면이 나올 확률과 뒷면이 나올 확률은 각각 1/2인 것입니다.
- "나비효과는 비유가 아니라 실제로 존재하는 현상이다. 그러나 나비의 날갯짓이 허리케인의 원인이라고 서술한다면, 이는 '인과'개념을 지나치게 확장하는 처사일 것이다. 나비의 날갯짓과 허리케인을 연결하는 사슬은 엄청나게 많은 중간 사건들의 사슬을 포함한다."(pp93-94)
- 이 책에서 저자는 제가 선택한 단어 '속설'을 '미신, 종교, 예언'등으로 세분화해 설명해주고 있습니다.
- "실재(實在)하는 인과관계를 반영하는 패턴과 그렇지 않은 패턴을 구분하는 능력 … 과학은 이 능력을 키우기 위한 끊임없는 노력일 따름이라고 할 수 있다. … 우리 눈에 띄지만 어떤 원인도 없고 단지 우연인 패턴은 보통 미신의 기반을 이룬다. 미신이란 실재로는 없는 인과관계가 존재한다는 믿음이다. 예컨대 도박판에서 주사위를 던지기 전에 입맞춤을 하면 6이 나올 확률이 높아진다는 믿음 … 은 미신이다."(p30) …… "일단 형성된 미신은 저절로 강화되는 경향이 있다. … 사람들은 자신이 품은 이론을 뒷받침하는 증거와 사건에만 주목하고 반례는 무시하곤 한다. 이런 경향을 일컬어 '확증 편향 confirmation bias'이라고 한다. 예컨대 내가 검은 고양이를 본 다음에 돌부리에 걸려 넘어졌다는 사실을 검은 고양이를 보면 불길하다는 증거로 간주하면서, 검은 고양이를 보고도 넘어지지 않은 경우들은 무시하는 것이 확증 편향이다."(p34)
- "이는 우리가 예상 밖의 일을 예상해야 함을 알려준다."(p10)
- "불가능성과 가능성의 경계에 위치한, 정말로 흥미로운 사건"(p63)
- 각 법칙에 대한 개괄적 내용은 각주로 돌리겠습니다.
- "만일 당신이 가능한 모든 결과들의 목록을 완전하게 작성한다면, 그 결과들 중 하나는 반드시 나타난다. 그러나 가능한 결과들의 목록에 등재된 결과 중 하나가 반드시 나온다는 것을 알 수 있을 뿐 그 결과가 어떤 것일지는 모른다."(p99) …… "이 법칙에 따르면 가능한 결과들 각각이 발생할 확률은 아주 작더라도, 그 결과들 중 하나는 확실히 발생한다. 필연성의 법칙은 개연성이 극히 낮은 사건을 확실한 사건으로 만든다."(pp277-278)
- "아주 큰 수의 법칙은 기회들의 개수가 아주 많으면 아무리 이례적인 일도 일어날 가능성이 높다는 것이다. 당신이 주사위들을 한 움큼 쥐고 던지기를 충분히 오래 반복하면, 언젠가는 모든 주사위에서 6이 나올 것이다. 한 움큼의 주사위들을 한 번 던졌을 때 모든 주사위에서 6이 나올 확률은 아주 낮더라도, 충분히 많은 기회가 주어지면 그 사건의 발생은 거의 불가피해진다."(p278)
- pp104-106에 등장하는 '주식으로 돈 벌기'가 가장 극명한 예.
- 이 책의 제목 앞에 붙어있는 문구.
- 예를 들어, 초중급 통계학에서 거의 만병통치약 수준으로 사용되고 있는 '중심극한정리(CLT : Central Limit Theorem)'의 가정을 완화시켜 '확률 지렛대의 법칙'이란 것이 결국 '예외로 보이는 것이 사실은 예외가 아니다'라 설명하는 방식처럼, 저자가 제시하고 있는 다섯 가지의 법칙들을 하나하나 곰곰이 따져보면 결국엔 우리가 '우연'이라 생각하는 것의 정의(定義)와 저자가 제시하는 우연의 정의가 혹 다른 것은 아닌가,하는 의문에 이르르게 되지요.