2장
동전 던지기의 확률은공정하게 나올까? - P27
내가 동전을 계속 던진다고 해보자. 공정한 fair 동전일 경우, ‘앞‘과 ‘뒤‘가 나올 가능성은 같다. 그러니까 앞과 뒤의 확률은 똑같이 1/2이다. 나는 동전을 던지면서 앞과 뒤가 나온 횟수를 계속 기록해나간다. 이때 나는 그 횟수가 어떻게 행동하리라고 기대해야 할까? 예컨대 어느 순간까지 뒤가 나온 횟수보다 앞이 나온 횟수가 훨씬 크다면 앞이 100번 더 많이 나왔다고 해보자 미래에는 뒤가 분발하여 앞을 ‘따라잡는‘ 경향을 보일까? - P29
다른 많은 상황에서도 똑같은 일이 벌어진다. 신문의 한 귀퉁이에는 로또에서 어떤 수들이 얼마나 자주 나왔는지 보여주는 표가있다. 당신은 그런 표를 참조하여 수를 선택해야 할까? 만일 어떤 지역에 평균 50년마다 대지진이 일어나는데 현재까지 60년 동안일어나지 않았다면, 곧 대지진이 일어날까? 비행기 사고가 평균 4개월마다 한 번 일어나는데 무사히 3개월이 지났다면, 머지않아 사고가 일어나리라고 예상해야 할까? - P30
이 모든 질문에 대한 대답은 "아니요"다. 하지만 대지진 문제에 대해서는 판단을 유보하자. 왜냐하면 대지진의 부재는 흔히 단층선을 따라 강한 변형력stress 이 형성되었다는 증거이기 때문이다. - P30
애초에 앞과 뒤의 불균형이 아무리 컸다 하더라도 마찬가지다. 심지어 이미 앞이 뒤보다 1000조 번 더 많이 나왔다 하더라도, 동전 던지기를 충분히 오래 하기만 한다면 뒤는 ‘거의 확실하게‘ 앞을 따라잡을 것이다. 어쩌면 독자들은 이 말이 ‘기억력이 없다‘는주장과 상충한다고 느낄지도 모르겠다. 그래서 서둘러 덧붙이겠다. 동전 던지기는 결국 고른 결과를 산출하는 경향이 없다는 말에도 일리가 있다! 예컨대 앞이 뒤보다 100번 더 많이 나왔을 때, 언젠가 앞의 누적횟수가 뒤의 누적횟수보다 최소한 100만 번 많아질 확률 역시 1이다. - P31
이런 질문에 대한 대답은 ‘큰 수의 법칙Law of large numbers‘으로불리는 확률론의 정리에 의해 주어진다. 큰 수의 법칙에 따르면, 시도가 오래 반복될 경우 사건들이 일어나는 빈도 frequency는 사건들의 확률에 매우 근접해야 한다. 공정한 동전을 던져 H가 나올확률은 1/2이다. ‘공정한‘의 정의가 바로 이것이니 당연한 얘기다. 이때 큰 수의 법칙이 가르쳐주는 바는 ‘시도가 오래 반복되면‘ 대략 50%의 결과가 앞이어야 한다는 것이다. T에 대해서도 마찬가지다. - P32
그런 독자는 아마 이런 식의 결과 열이 더 마음에 들 것이다. HTHHTTHTTHTHHTHTHHTT. 이결과에서 H의 빈도는 10/20=0.5 이고, T의 빈도 역시 10/20=0.5다. 이 열은 빈도들을 정확히 맞추었을 뿐 아니라 더 무작위한 것처럼 보인다. 그러나 이 열은 무작위하지 않다. - P33
그러나 무작위성에 대한 우리의 직관은 쉽사리 오류를 범한다. 정말로 무작위한 열은 반복을 포함해야 한다! - P33
무작위한 열은 흔히 부분적인 패턴과 반복을 나타낸다. 그러나그것들은 열이 무작위하지 않다는 것을 보여주는 증거가 아니므로 놀랄 것은 없다. 물론 계속해서 HHHHHHHHHHH………가 나온다면, 속임수가 있는 동전이 아닐까 의심하는 것이 옳다. - P34
TTTT의 확률이 1/16 이면, HTHH 의 확률도 1/16이라는 점에 주목하라. HTHH는 TTTT보다 ‘더 무작위한 것처럼‘ 보이지만, 두 묶음의 확률은 같다. 무작위한 것은 동전 던지기 과정이다. - P35
동전을 네 번 던지면, 평균적으로 당신은 정확히 두 번 앞을 얻는다. 이 말은 앞면 두 번과 뒷면 두 번이 확률이 높다는 뜻일까? [중략] 그러므로 정확히 두 번 앞을 얻을 확률은 6/16=0.375다. 반면에 정확히 두 번 앞면을 얻지 않을 확률은 0.625로, 오히려 앞을 얻을 확률보다 크다. 던지기를 오래 계속하면, 이 확률 차이의 효과는 더욱 두드러지게 된다. - P36
그럼에도 앞과 뒤가 결국 균형을 이루는 경향이 있다는 말은 흥미롭게도 일리가 있다. 중요한 것은 ‘균형을 이룬다‘는 표현의 뜻이다. 앞과 뒤의 횟수가 언젠가 같아진다는 뜻이라면, 이 말은 틀렸다. 그러나 두 횟수의 비율이 언젠가 1에 매우 접근한다는 뜻이라면, 전적으로 옳은 말이다. - P36
하지만 우리는 이 곡선이 언젠가 위치 0으로 돌아오리라는 것을 확률 1로(사실상 확실하게) 믿을 수 있다. 그러나 곡선은 10만 단계에서 위치 500에 도달했으므로, 위치 0으로 돌아오기까지는 아마 아주 긴 시간이 걸릴 것이다. 실제로 내 컴퓨터의 프로그램을 50만 회까지 실행한 결과, 최종 위치는 오히려 0보다 더 위로 올라갔다. - P38
약 2만 회째에 앞이 뒤보다 300회 많아지자 동전이 갑자기 앞뒤가 골고루 나와야 한다는 점을 상기하여‘ 4만회째에는 앞과 뒤의차이가 약 30이 되도록 돌아왔다고 생각하는 독자가 있을지도 모른다. 하지만 왜 동전은 더 일찍 혹은 더 나중에 기억을 되살리지않았을까? - P39
이런 집중이 일어나는 이유는, 곡선이 0에서 출발할 경우 신속하게 0으로 회귀할 가능성이 높기 때문이다. 실제로 0에서 출발하여 두 단계 후에 다시0으로 회귀할 확률은 1/4이다. - P40
우리의 차이 곡선처럼 매 단계에 무작위하게 행동하는 대상을 연구하는 이론을 ‘랜덤워크 이론random walk theory‘이라고 한다. 이 이론은 우리의 차이 곡선이 영원히 0으로 회귀하지 않을(앞이 영원히 뒤보다 많을) 확률은 0이라고 말한다. - P40
그러나 앞이 나올 비율과 뒤가 나올 비율은 점점 더 50%에 접근하는 경향이 있다. 대개 그렇다. 왜 그런지 살펴보자. 당신이 동전을 100번 던졌는데 앞이 55번, 뒤가 45번 나왔다고 해보자. 그러면 앞이 10번 더 나와 불균형이 생긴 것이다. 이때 랜덤워크 이론은 당신이 동전 던지기를 충분히 오래 계속한다면 앞뒤의 균형이(확률 1로, 즉 사실상 확실히 회복된다고 말해준다. - P41
아직 할 얘기가 더 남았다. 여기서 글을 마무리한다면, 앞뒤의 횟수가 언젠가 똑같아져야 한다고 주장하는 독자들에게 도리를 다하지 못한 셈일 것이다. - P41
랜덤워크 이론은 이런 말도 해준다. 만일 당신이 동전 던지기를 충분히오래 한다면, 당신은 앞의 횟수가 뒤의 횟수보다 100만 번 많은 상황에 도달할 것이다. 당신이 매우 특이한 직관의 소유자라면, 당신은 그 상황에서 실험을 중단할 수도 있다. - P42
그러므로 결국 모든 것은 ‘언젠가‘라는 말의 뜻에 달려 있다. 만일 우리가 던지기 횟수를 미리 정한다면, 그 특정 횟수를 채웠을때 앞의 횟수와 뒤의 횟수가 똑같으리라고 기대할 근거가 없다. - P42
2차원 랜덤워크에서도 궤도가 언젠가 원점으로 회귀할 확률이 1이라는 것을 증명할 수 있다. 그러나 수소폭탄의 공동 발명자로 잘알려진 스타니슬라브 울림Stanislaw Ulam은 3차원에서는 사정이 다르다는 것을 증명했다. 3차원 랜덤워크에서는 궤도가 언젠가 원점으로 복귀할 확률이약 0.35 다. - P43
가장 단순한 1차원 랜덤워크조차도 다른 많은 반직관적인 특성들을 가진다. 예컨대 당신이 아주 많은 던지기 횟수를 미리 정한다고 해보자. 이를테면 100만 번으로 말이다. 그리고 던지기를 진행하면서 앞의 누적횟수가 더 많은지 아니면 뒤의 누적횟수가 더 많은지 살펴보자. 앞이 더 많을 때와 뒤가 더 많을 때의 시간 비율이 평균적으로 어떠하리라고 예상되는가? - P44
|