위험한 숫자들 - 숫자는 어떻게 진실을 왜곡하는가
사너 블라우 지음, 노태복 옮김 / 더퀘스트 / 2022년 3월
평점 :
장바구니담기




크라우드펀딩 저널리즘의 시초 <코레스폰던트>의 수학 전문기자이자 계량경제학 박사, 네덜란드 고등연구소 전속 저널리스트 사너 블라우의 숫자에 관한 경고 <위험한 숫자들>. 코로나19 팬데믹으로 숫자가 우리 삶에 우리 삶에 끼치는 영향을 이토록 실감하던 때가 있었던가요. 수치로 감염자 수를 알고, 몇 시까지 영업할 수 있는지, 모임을 해야 하는지, 등교를 해야 하는지, 결혼식장에 참석할 수 있을지, 회식을 할 수 있을지 여부가 정해졌습니다.


코로나바이러스 통계, 인공지능, 미래 예측 등에서 숫자가 어떻게 사용되는지, 숫자의 오용에 관한 사례를 통해 숫자에 의해 돌아가는 세상을 <위험한 숫자들>에서 살펴봅니다. 많은 수치가 결코 객관적이지 않음을 보여줍니다. 숫자는 사실 잘못이 없습니다. 실수는 하는 쪽은 사람입니다. 숫자는 측정하는 순간 이미 객관성을 잃는다고 합니다. 무엇을 어떻게 측정하는지가 애당초 주관적인 결정이기 때문이라고 말이죠. 어느 정도의 의심과 상식이 있다면 우리는 이 속임수를 알아차릴 수 있습니다.


"숫자를 잘 이해하는 일은 중요하다. 숫자가 사회에 중요한 역할을 하는 때에는 그 숫자를 나쁘게 이용하려는 동기가 생겨나기 때문이다." - 책 속에서


숫자의 힘에 집착하게 된 건 겨우 200년도 안 된 19세기입니다. 위생이 엉망이어서 죽지 않아도 될 군인들이 죽어나간 크림전쟁 때 나이팅게일이 숫자를 무기로 사용했습니다. 850쪽에 달하는 보고서가 묻힐까 봐 화려한 도표로 표현합니다. 수치로 정부를 설득하는데 성공한 나이팅게일의 사고방식은 이후 세상에서 가장 널리 쓰이는 '수' 언어의 화려한 확장을 불러일으킵니다. 대규모로 수을 모으기 시작하고, 분석하기 시작하면서 통계 기반의 의료 연구가 표준화되었습니다. 수는 직감, 오류, 이해관계라는 장애물을 무너뜨리는 게 성공합니다. 하지만 이 숫자가 때로는 틀리기도 한다는 사실을 잊지 말아야 합니다.


1차 세계대전 동안 지능검사를 받은 미군 신병들의 결과는 참담했습니다. 백인 미국인 정신연령이 13세, 동유럽과 남유럽 이민자는 더 낮았고, 맨 아래 흑인이 자리 잡고 있었습니다. 역사적으로 백인과 흑인의 IQ에 대한 논란에 불을 지핍니다. 강제 불임 수술 법률까지 정당화했을 정도입니다. 그리고 정치적 결정의 근거로 꾸준히 여전히 사용되고 있습니다. 우리가 만들어낸 척도에 우리가 사로잡힌 셈입니다. 숫자는 그것을 사용하는 이들의 믿음이나 요구에 맞는 방식으로 해석되었습니다. IQ 점수가 지능과 동의어가 되면 문제가 됩니다. <위험한 숫자들>에서는 숫자의 한계를 알아차리고 그 이면에는 모든 것을 셀 수는 없다는 사실과 숫자가 알려주지 못하는 내용도 있다는 걸 알려줍니다.


트럼프 대통령 선거 당시 여론조사 신뢰성 문제도 기억납니다. 당시 오차범위 내 조사 결과도 언론의 잘못으로 논란이 되었습니다. 표본은 세상을 이해하기 위해 사용하는 렌즈입니다. 킨제이 성 보고서에 담긴 조사 결과에 대해 통계학자 세 명이 표본을 사용할 때 벌어질 수 있는 중대한 실수들을 조목조목 짚은 일이 있는데요. 잘못된 질문, 대표성 부족, 소규모 인터뷰 집단, 무응답, 오차범위 간과 등 과학적 외투를 뒤집어쓴 사례를 알려줍니다.


상관관계와 인과관계 문제도 빠질 수 없습니다. 흡연과 폐암에 관한 담배 업계의 치밀한 마케팅은 혀를 내두를 지경입니다. 담배 업계는 담배가 건강에 좋다고 증명할 필요가 없었습니다. 그저 해로움이 증명되지 않았다고만 주장하면 됐습니다. '더 많은 연구가 필요하다.'는 문장만 들어가면 되는 거였습니다. 대부분 중요한 결정은 짐작되는 인과관계를 바탕으로 이루어집니다. 하지만 인과관계인 척하는 상관관계가 무척 많습니다. 숫자놀음의 진실을 짚어낸 스테디셀러 <새빨간 거짓말, 통계에서도 이미 짚어낸 내용이지만, 여전히 세대마다 등장하고 기사에서도 매일 등장합니다.


통계의 허구에 관한 많은 책이 있지만 <위험한 숫자들>은 빅데이터 시대에 걸맞은 사례도 풍성하게 다루고 있습니다. 표준화, 데이터 수집 및 분석은 어떻게 이루어질까요. 표본의 문제를 해결하는 데 빅데이터가 유용하지만, 여전히 상관관계로는 충분하지 않은 수준이라고 합니다. 대출을 받을 때 누군가가 이미 정해준 내 신용점수는 신뢰성의 척도일 수도 있지만 순전히 운의 척도일 수도 있다는 걸 짚어줍니다. 알고리즘이 새로운 불평등을 만들어내는 과정을 이해하고 나면 알고리즘도 결코 객관적이지 않다는 걸 알게 됩니다.


데이터가 어떻게 표준화되었는지, 수치가 어떻게 수집되었는지, 인과관계가 있는지 등 숫자를 의심하는 연습도 도와줍니다. 수의 오용에 관한 문제는 단순히 지식만으로는 해법이 되지 않습니다. 수가 그릇되게 사용되고 있음을 알아차리고 싶다면 수 뒤에 누가 있는지를 살펴보면 됩니다. 수치를 해석하는 데에는 심리도 관여하고 있음을 짚어줍니다. 그 수치를 바라볼 때 나의 편견도 들어가는 겁니다. 숫자 소비자로서 숫자의 쓸모를 제대로 이해할 수 있도록 도와주는 <위험한 숫자들>. 숫자에 지배당하지 말고 똑똑하게 세상을 바라보는 눈을 키울 수 있는, 진실을 꿰뚫는 힘을 키울 수 있습니다.




댓글(0) 먼댓글(0) 좋아요(1)
좋아요
북마크하기찜하기 thankstoThanksTo