숫자는 거짓말을 한다 - 통계와 그래프에 속지 않는 데이터 읽기의 힘
알베르토 카이로 지음, 박슬라 옮김 / 웅진지식하우스 / 2020년 10월
평점 :
장바구니담기


몇 년전부터 해마다 연말이면 책을 선물해주는 지인이 있다. 첫 선물은 청와대에서 추천한 책들중에 몇 권을 골라서 보내줬는데 이후 그 해 이슈가 됐던 책들중 선정을 한다고 한다. 선물을 받으면 감사의 의미로 밥을 사는데 책을 고르는것도 일이라고 하길래 부담 갖지 말고 아무 책이나 괜찮다고 했다. 내 자신이 골라서 읽는것도 의미가 있지만 이런식으로 큐레이팅한 의외의 책을 읽는것도 상당히 즐거운 일이다.

이 책은 코로나로 인해 갑자기 격리 통보를 받고 2주일 동안 혼자 지낼때 받았던지라 더욱 반가웠던 책이다. 6개월간의 숙성기간을 거쳐 이제야 읽어보게됐다. 금융회사에 입사했을때 선배들에게 격언처럼 들었던 말이 있다. 숫자는 거짓말을 하지 않는다며, 숫자 검증 똑바로 하지 말라는 이야기인데 이 책의 제목은 숫자는 거짓말을 한다로 반대의 의미다.

사실 숫자는 거짓말을 하지 않는데 이를 왜곡시키면 엄청난 거짓말을 하는 수단으로 활용될 수 있다. 제목은 숫자지만 정확히 말하지만 숫자를 이용해 만들어지는 차트를 올바르게 읽는 방법을 서술한 책이다. 저자인 알베르토 카이로는 표, 그래프, 인포그래픽 등의 시각 자료를 통해 뉴스를 전달하는 비주얼 저널리즘 분야의 세계적 권위자로,  현재 마이애미대학교에서 나이트 석좌교수로 재직 중인분이다.

[숫자는 거짓말을 한다]는 저자의 세번째 책으로 ˝객관성과 신뢰도의 상징과 같은 차트가 어떻게 데이터를 왜곡해 우리를 오해와 착각의 늪으로 이끄는지 밝힌다. 뉴스나 기사, 소셜 미디어에서 흔히 접하는 표와 지도, 막대그래프, 산점도, 거품 차트 등 160여 개의 차트를 수록해, 데이터에 숨겨진 욕망과 의도, 패턴을 정확히 읽어내는 안목을 길러준다.˝

서두는 트럼프가 승리한 선거결과를 인용한 차트로 시작된다. 힐러리와 트럼프의 표차는 거의 나지 않았고 총 득표수는 힐러리가 많았지만 미국 선거제도의 특이한 방식 때문에 결과를 교묘하게 조작하면 미국 전역에서 공화당이 압승한걸로 보이는 차트를 만들 수 있다. 저자는 이 점을 지적하며 결코 차트에 현혹되지 말고 어떻게 하면 숫자에 속지 않을 수 있는가에 대한 방법을 알려준다.

책은 총 6장으로 구성되어있으며 각 장의 내용은 다음과 같다.

˝1장에서는 차트를 구성하는 요소를 살펴본다. 데이터를 각각의 속성에 맞게 기호(점, 선, 원, 막대 등)와 시각적 부호(길이, 위치, 면적, 색깔 등)로 어떻게 나타내는지도 설명해준다. 어디선가 한 번쯤 봤을 법한 표와 지도, 원 그래프, 막대그래프를 비롯해, 거품 차트, 평행좌표 그래프, 선 연결 산점도, 트리맵(treemap), 테이블 히트 맵(table heat map) 등 조금은 낯설지만 새로운 차트들까지. 지적이고도 눈이 즐거운 차트의 파노라마가 펼쳐진다.

2장부터 6장에서는 잘못된 차트를 가려내는 5가지 기준을 제시한다. 척도와 비례(2장), 데이터 신뢰도(3장), 데이터 선별과 모집단(4장), 불확실성(5장), 인과관계(6장)다. 기업의 실적 보고나 광고에서 쓰이는 3차원 시각 효과가 위험한 이유, 캔자스주가 미국에서 가장 높은 포르노 시청률을 기록한 사연, 태풍 예보도 속 원뿔에 관한 오해 등, 흥미와 놀라움을 자아내는 차트 이야기들이 가득하다. 그 밖에도 선거 판세, 경제 전망, 출산율, 범죄율, 코로나19 현황처럼 우리의 삶과 밀접한 사회 현안들이 많이 다뤄진다. 본문에는 160여 개의 차트가 수록되어 있어 독자들의 직관적인 이해를 돕는다.(소개글 발췌)˝

한국의 19대 대선 결과도 인용된다.

˝헌정 사상 최초 대통령 탄핵의 결과, 2000년대 최고 투표율, 개표 방송 실시간 시청률 40%, 장미 대선 등 여러 수식어가 뒤따랐지만 그중에서도 모두가 기억하는 것은 문재인의 압승이었다. 그 중심에는 후보자의 득표율을 기준으로 전국의 시와 도를 파란색 또는 빨간색으로 채운 선거 지도가 있다. 전국의 3분의 2가 파란색으로 물든 이 지도를 더불어민주당과 여러 언론에서는 압도적인 지지의 근거로 제시했다.

그러나 당시 문재인의 득표율은 41%로 과반을 넘지 못했고, 맞수였던 자유한국당 홍준표는 24%, 국민의당 안철수는 21%의 표를 얻었다. 안철수는 득표율이 세 번째로 높았지만 지도에 표시되지도 않았다. 문제의 선거 지도는 누가 이겼는가를 보여줄 뿐 얼마나 지지받았는가는 알 수 없다. 일종의 착시 효과가 생겨난 것이다.˝

요즘 국민의 힘이 약진하는걸로 보이지만 사실 문재인 대통령의 지지율은 40프로 언저리였고 그 결과가 지금 보여주는 지지율이다. 어떻게 보면 상당히 선전한 결과로 볼 수도 있다. 수 많은 악재에도 불구하고 탄탄한 지지층이 있음이 밝혀진 조사결과이기 때문이다. 이 책을 통해 속지 않고 정확하게 통계나 차트를 볼 수 있는 방법을 길러보자.

댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo