[넘버스, 숫자가 당신을 지배한다]를 읽고 리뷰 작성 후 본 페이퍼에 먼 댓글(트랙백)을 보내주세요.
-
-
넘버스, 숫자가 당신을 지배한다 - 모르면 당하는 확률과 통계의 놀라운 실체
카이저 펑 지음, 황덕창 옮김 / 타임북스 / 2011년 3월
평점 :
절판
책을 처음 받았을 때, 경제학을 공부했지만 경제수학이나 통계보다는 경제사상이나 경제사를 더 좋아했던 전형적인 문과생으로서 제목의 'numbers', '숫자'라는 단어를 보고 겁부터 났다. 게다가 통계에 관한 책이라니! 과연 끝까지 읽을 수나 있을까 싶었다. 하지만 두려움을 안고 첫 장을 폈더니 너무나도 친숙한 '디즈니랜드'라는 단어가 눈에 들어왔다. 디즈니사는 새로운 놀이기구나 더 개발할 일이지, 왜 통계학자를 고용했을까? 줄 서지 않고 즐기는 놀이공원이 가능할까?
그러고보니 몇 년 전 명절에 친척들과 집 근처 L월드에 놀러간 일이 떠올랐다. 다들 같은 생각을 했는지 놀이공원은 엄청 붐볐다. 그래서 우리 일행은 고작 3분짜리 놀이기구를 타기 위해 발을 동동 구르며 3시간을 기다려야 했다. 왜 놀이기구는 늘 붐비는 것일까? 기다리지 않고 놀이기구를 탄다면 얼마나 좋을까? 디즈니랜드는 나처럼 관람 시간의 절반은 줄을 서느라 허비하는 관람객들의 불만을 해소하기 위해 통계학자를 고용하여 예약을 하면 대기 시간 없이 정해진 시간에 놀이기구를 탈 수 있는 '패스트패스'라는 제도를 만들었다. 물론 결과는 대성공! (우리나라 놀이공원에서도 현재 이런 제도가 시행 중이다) 그런데 나중에 조사를 해보니 놀랍게도 관람객의 총 대기 시간은 그리 달라지지 않았다고 한다. 하지만 사람들은 전보다 만족스러워 했다. 그 이유는 예약을 함으로써 시간을 관리할 수 있는 권한을 관람객에게 부여했기 때문이다.
이 사례는 통계가 엄청 대단하고 신비한 수단이라는 것을 의미하는 것이 아니다. 그보다는 숫자나 통계같은 데이터는 인간이 어떻게 활용하고 판단하느냐에 따라 그 가치가 달라진다는 것을 보여준다. 가령, 교통 체증을 해소하기 위해 미네소타 교통국에서는 통계학을 활용하여 '램프 미터링' 기술을 발명했다. 하지만 디즈니랜드의 '패스트패스'가 관람객들로부터 열렬한 환영을 받은 것과는 달리, '램프 미터링'은 이용자들의 비난만 샀다. 이는 도로 상황에 따라 차량에 진입을 해도 되는지 안 되는지 신호를 보내는 제도인데, 이용자들은 신호를 기다리느니 시간이 더 걸려도, 도로가 아무리 막혀도 스스로 알아서 운전하는 게 낫다고 판단했다. 이렇게 숫자와 통계 자체는 아무런 잘못도 없고 거짓말도 안 하지만, 이를 두고 사람들이 잘못된 판단을 하거나 때로는 악용하기까지 하기 때문에 문제가 발생한다. 저자는 이 같은 잘못을 범하지 않기 위해서라도 통계적 사고가 필요하다고 주장한다.
|
|
|
|
증권 관련 정보가 홍수처럼 넘쳐나는데도 대부분의 사람들은 떼돈을 벌지 못한다. 모든 식품 캔과 포장에는 영양 정보가 표시되어 있지만 사람들은 대부분 다이어트에 실패한다. 정보통신 기술에 막대한 돈을 들여도 교통체증 문제는 날로 심각해진다. 이처럼 현대인들은 수많은 정보와 숫자에 둘러싸여 있지만 그만큼 현명해지지는 않았다. 그 어느 때보다도 많은 정보를 모으고 분석하지만 그 결과는 만족스럽지 않다. 지금 우리에게 필요한 것은 바로 통계적인 사고다.(소개글) |
|
|
|
|
범죄 수사에 활용되는 거짓말 탐지기 또한 무턱대고 신뢰할 경우 큰 문제를 낳을 수 있는 통계적 자료 중의 하나다. 거짓말 탐지기, 과연 신뢰할 수 있을까? 이 부분은 마침 요즘 보는 미국드라마 <라이 투 미(Lie to me)>가 연상되어 더욱 흥미로웠다. 이 드라마는 인간이 거짓말을 할 때 보이는 표정, 몸짓, 목소리 등 신체적인 특징을 통해 범인을 찾는다는 설정으로부터 출발한다. 이런 방법도 통계적으로 도출된 자료에 기반하기 때문에 과학적이고 신뢰할 수 있다고 하고, 어느 정도 수긍이 된다. 하지만 이따금씩 '정말 저렇게 범인을 찾을 수 있는 것일까? 그렇다면 과학수사대가 왜 필요한 것일까?'하는 의문이 들곤했다.
저자 역시 인간의 신체적인 반응을 활용하여 도출된 데이터가 과연 신뢰할만한지 문제를 제기한다. 더군다나 데이터 자체가 믿을만한 자료라고 해도, 이를 해석하고 판단하는 사람을 어디까지 믿을 수 있는 것일까? 실제로 미국에서는 다른 증거가 하나도 없는데도 배심원들이 거짓말 탐지기에 의해 나온 자료만 가지고 무고한 사람을 범인으로 지목하여 십여년간 옥살이를 시킨 케이스가 있다고 한다. 통계와 이에 대한 해석은, 잘못하면 사람의 인생을 송두리채 바꿀 수도 있다.
|
|
|
|
마케터들이 회사의 제품에 대해서 어떤 소비자들이 긍정적인지를 알기 위해서 데이터 마이닝을 활용하는 경우, 거짓 양성 판정은 잘못 선택된 소비자들에게 스팸 메일을 뿌리는 결과를 낳는다. ... (중략)...하지만 이 정도 불편이야 '수다죄'로 육체적 고통을 받고 인생이 망가질 수도 있는 문제에 비하면 별것 아니다. 무고한 사람을 감옥에 가두고 시민으로서 누려야 할 자유를 박탈하는 것만이 아니다. 정보기관들이 수백만 건의 거짓 경고를 추적하는 일이 얼마나 비도덕적이고 값비싼 대가를 치러야 하며, 역효과가 얼마나 큰지를 생각해야 한다. (p.228) |
|
|
|
|
SNS 서비스로 해외 각지에 있는 사람들과 실시간으로 대화하고, 스마트폰 하나면 못 하는 일이 없는 이런 시대에 여전히 교통체증에 시달리고 '묻지도 따지지도 말고 전화만 걸라'는 스팸문자 때문에 골치가 아픈, 이런 비효율적인 일이 발생하는 요인 중 하나는 바로 통계다. 정확히는 통계를 제대로 활용하고 있지 못한 나, 그리고 당신! 통계 자료를 볼 때 숫자라고 일단 겁부터 먹고 피하거나 무분별하게 받아들일 것이 아니라 비판적으로 생각해보고, 만약 이러한 통계 자료를 활용하는 입장이라면 어떤 식으로, 오류나 함정 없이 활용할 것인지 고민해봐야 할 것이다.