-
-
법정에 선 수학 - 수학이 판결을 뒤바꾼 세기의 재판 10
레일라 슈넵스.코랄리 콜메즈 지음, 김일선 옮김 / 아날로그(글담) / 2020년 9월
평점 :
<법정에 선 수학>의 표지에는 이렇게 적혀 있습니다. '수학이 판결을 뒤바꾼 세기의 재판 10'. 하지만 이건 상황을 아주 거칠게 요약한 것이고, 더 정확히 말하자면 '수학을 알았다면 당하지 않았을지도 모를 세기의 범죄 10' 정도에 가까운 것 같아요. 제일 첫 장에 나와있는 폰지 사건의 경우 수학이 판결을 뒤집었다기보다는, 수학을 알았다면 애초에 그런 다단계 사기에 걸려들지 않을 수 있었다는 쪽에 가깝거든요. 다른 장에서도 어떤 사건의 경우 피해자와 가해자가 아주 명백하지만, 어떤 사건의 경우는 수학을 알고 정확한 확률을 계산해도 여전히 의문점이 남아있기도 합니다. 책 홍보를 위해 문구를 부러 강렬하게 선정한 것 같아요.
어떻게 이런 결과가 나올 수 있지?
제가 읽으면서 가장 신기했던 건 2장 UC 버클리대학교 성차별 사건에 나왔던 '심슨의 역설'이었어요. 모든 인종의 학생 성적이 높아졌는데, 전체적으로는 평균이 그대로 계속 유지되는 상황을 어떻게 이해해야 하는가? 뒷부분을 읽기 전에 왜 그런지 곰곰히 생각해봤는데, 역시나 잘 모르겠더라고요. 언뜻 생각했을 때는 전혀 말이 안 되는 일이 왜 벌어지는 걸까요?
2002년 SAT 독해 부문의 평균 점수는 1981년과 똑같았다. 그러나 평가 위원회가 분류한 인종별 점수는 동일 기간 동안 백인 8점, 흑인 19점, 아시아계 27점, 푸레르토리코계 18점, 미국 인디언계 8점씩 상승한 것으로 나타나 있다. 어떻게 각 집단의 점수는 향상되었는데 전체 평균은 21년간 변하지 않을 수 있는 것일까? - p.42
책에 소개된 재판으로 바꿔 말하자면, 뽑을 수 있는 모든 학과에서 여학생을 많이 더 많이 뽑고 있는데 어떻게 전체적으로 여학생 합격률이 현저하게 더 낮을 수가 있는가? 하는 문제입니다. 수학적으로 정확하게 통계를 내 접근하려고 하다 보니까 오히려 그 계산 안에 미처 넣지 못한 외부의 요소를 놓친다는 지점이 흥미로웠어요. 수학은 결코 만능 열쇠가 아니고, 모든 요소를 제대로 다 고려하지 않으면 엉뚱한 결론으로 우리를 안내할 수밖에 없다는 증거잖아요. 그리고, 만약 그런 맹점을 잘 알고 있는 누군가가 중간에서 교묘하게 장난을 친다면, 심지어 완전히 왜곡된 결과를 '팩트'로 믿게 될 수도 있다는 경고이기도 하고요.
'생일 문제' 같은 확률론은 은근히 많은 대중수학서에서 다루고 있는 부분이라 알고 있었는데, 그걸 뒤집으니까 또 새로운 문제가 되어서 재밌었습니다. '생일 문제'는 사람이 여러 명 있을 때, 생일이 같은 사람이 있을 확률이 50퍼센트가 되려면 도대체 몇 명이 모여야 할까? 하는 고전 수수께끼에요. 많은 사람들이 365명이나 그 절반인 183명이라고 생각하는데, 사실은 23명만 있으면 된다고 합니다! 사람들의 직관이 사실 수학적으로는 어긋나는 대표적인 사례인데, 정작 생일 문제를 알아도 그 비슷한 현실 사례를 가져오면 저도 모르게 잘못 생각하게 되는 게.. 정확하게 생각하는 훈련이라는 게 말처럼 쉽지가 않다는 걸 다시 한 번 느끼게 됐어요.
직관은 정답이 아니다
'생일 문제'를 뒤집은 건, 특정 날짜를 지정해놓고 - 1월1일이나 12월25일 같은 임의의 날짜 - 이 사람과 생일이 똑같을 확률이 50퍼센트인 사람이 방 안에 있으려면 몇명이 필요할까? 하는 문제입니다. '생일 문제'의 정답이 23으로 예상했던 것보다 훨씬 작은 숫자였다면, 반대로 이건 23은 물론이고 183보다도 더 큰 253이 정답이에요. 얼핏 비슷해 보이지만 아무 날짜나 생일이 같은 두 사람과, 특정한 날짜를 가진 생일이 같은 두 사람은 이렇듯 확률적으로 큰 차이를 보입니다. 이걸 현실에 적용한 게 바로 DNA 문제였어요. 범죄자의 DNA가 어떤 사람과 일치했을 때, 그 정확도는 얼마나 될까? 하는 문제요!
과연 어느 쪽이 옳을까? 범인이 아닌 무고한 사람의 DNA를 데이터베이스에서 검색할 때 결과가 일치할 확률은 110만분의 1인가, 3분의 1인가? 핵심은 이 확률을 어떻게 설명할 것인가에 있다. 둘 다 논리적이긴 하지만 어느 쪽도 푸켓이 범인인지 아닌지를 확실히 알려주진 못한다. 이 두 값은 서로 다른 값을 의미하고 있는 것임에 틀림없었다. - p.161
결론적으로 말하자면, 5장 다이애나 실베스터 사건에서 검사가 주장한 110만분의 1과 변호사가 주장한 3분의 1은 모두 틀린 확률이라고 합니다. 둘 다 용의자와 범죄 현장에 남겨진 DNA가 일치할 확률로 보기는 어렵다고 하네요. 164~167페이지에는 좀 더 정확하고 다양한 요소를 분석한 확률이 실려 있습니다. DNA 유전자 자리가 일치할 확률+그 사람이 백인일 확률+캘리포니아(범죄현장)에 거주하거나 출신일 확률+65세 이상의 성범죄자일 확률 등등을 모두 고려해서 계산을 해요. 누군가는 반드시 범인이 될 것이어야 하기 때문에, 저자는 반대로 이 조건을 만족하는 또 다른 진범이 있을 확률을 계산해봅니다. 이런 식으로 하면 70분의 1이라는 확률에 도달하게 되는데, 이건 말하자면 지금 잡힌 용의자가 범인이 아닐 확률이 최대 70분의 1이라는 거죠.
존 푸켓이 범인일 수도, 아닐 수도 있다. 분명한 것은 그가 받을 판결이 어떤 것이건 그가 무죄일 확률 이외의 다른 확률에 근거해서 판결이 내려져서는 안 된다는 점이다. 재판에서 수학이 활용된다면 올바르게 쓰여야 한다. 그렇지 않다면 재판을 웃음거리로 만드는 셈 밖에는 되지 않는다. - p.167
재판 과정에 쓰이는 수학을 대하는 저자의 대표는 시종일관 이렇습니다. 과학의 시대에 수학을 적극적으로 재판에 끌여들여야 한다면, 분명하고 정확한 계산과 확률과 숫자만 근거로 내세워야 한다는 것. 맞는 말이죠. 어떤 사람이 무죄일 확률이 110만분의 1이라는 것과 3분의 1이라는 것과 70분의 1이라는 건, 정말이지 하늘과 땅 차이잖아요. 우리는 좀 더 훈련받은, 섬세한, 정확한 분석을 할 줄 아는 눈을 필요로 해요!
사람들은 복잡해보이는 수식이 나오면 '그래서 결국 마지막에 나오는 숫자가 뭐야?' 하고 그 과정에는 별로 관심을 가지지 않기 마련입니다. 책에서도 그런 식으로 얼렁뚱땅 넘어간 확률론이 굉장히 많이 나와요. 아예 대놓고 증거 조작을 했던 드레퓌스 사건은 제외하더라도, '범인처럼 머리를 하나로 묶은 여성일 확률이 10분의 1이다' 같은 말도 안 되는 전제를 놓고 계산하는 콜린스 부부 사건 같은 케이스도 있습니다. 도대체 저 10분의 1이 어디서 튀어나온 것인지 알 수조차 없는데도 불구하고, 정작 재판 당시에는 저기에 딴지를 건 사람이 아무도 없었다는 게 놀랍죠;;; 아마 다들 복잡해보이니까 일단 결론만 듣자고 생각한 게 아닐까 싶어요;;;
책을 읽으면서 반성을 좀 했습니다. 전문가가 나와서 (사실은 수학 쪽 전문가가 아닐 확률이 상당히 높음) 이러이러할 확률은 몇분의 몇입니다~ 하고 선언하는 순간, 배심원들이나 법조계 사람들은 그 숫자를 의심없이 믿어버린다는 거예요! 왜냐하면 뭔가 복잡해보이고, 전문가가 계산했으니 어련히 맞겠지 하고 안일하게 생각한다는 거죠. 만약 저도 책에 나오는 사건들 중 하나에 배심원으로 들어갔다면 아마 똑같은 실수를 했을 가능성이 높지 않을까 싶어서 섬뜩했습니다. 좀 더 주의깊게 살피고, 특히! 특히! 특히! 전제가 되는 기본 확률이 어떤 식으로 선정되고 산출되었는지, 거기서 빠진 요소 혹은 인위적으로 더해진 요소는 없는지 다시 한번 내 머리로 생각해보는 과정을 꼭 훈련해야겠다 싶었어요.
대중이 알아듣기 쉬우면서도 중요한 문제를 많이 다루고 있어서 좋았습니다. 저자가 법과 수학의 연계에 엄청나게 깊은 관심을 가지고 있어서 앞으로도 꾸준히 책을 내줄 것 같은데, 앞으로 나올 다른 저서도 기대가 되네요!