숫자는 거짓말을 한다 - 통계와 그래프에 속지 않는 데이터 읽기의 힘
알베르토 카이로 지음, 박슬라 옮김 / 웅진지식하우스 / 2020년 10월
평점 :
품절


지금 미국은 대통령 선거 결과를 기다리며 혼란이 예상되고 있습니다. 국민들이 투표를 하고, 각 주의 투표 결과에 따라 득표수가 결정되면, 대통령이 누가 될지 정하면 되는 아주 단순한 통계이지만, 우리나라의 선거 시스템보다는 뭔가 허점이 많다는 것을 보여주고 있습니다. 이미 앞 선 미국 대선에서도 예상을 뒤엎고 트럼프가 당선되었던 것을 기억하고 있습니다. 이 때의 예상이란 선거전까지의 다양한 분석, 조사, 정보를 이용하여 나름의 알고리즘으로 산출한 통계 결과에 따른 것입니다. 이렇게 예상과 다른 결과가 나온 것은 가짜 정보나 잘못된 정보로 인하여 통계에 오류가 생겼다고 볼 수 있습니다.


우리나라의 방송에서도 거의 매주 대통령이나 각 정당의 지지도 또는 시청률 등을 발표하고 있습니다. 이러한 숫자와 차트들을 만들기 위해서는 데이터가 필요할 것입니다. 이 데이터를 어떻게 분석하고 해석하느냐에 따라 보여지는 차트들은 달라질 수 있습니다. 이 책에서는 차트를 단순히 보는 것이 아니라 정확하게 읽고 해석하는 방법을 알려주고 있습니다. 그래야, 데이터가 전하는 진실을 정확히 알 수 있기 때문입니다. 책에서는 믿을 만한 데이터를 가려내는 법을 설명하고 있습니다. 먼저 데이터를 비판적으로 사고하기 위해서, 데이터 출처의 신뢰성을 판단할 수 있는 감각을 기르라고 합니다. 여기에는 저자가 추천한 몇 권의 책을 읽으며 통계를 읽거나 추론을 할 때 흔히 저지르는 실수를 피하는데 도움이 될 것이라고 합니다. 이와 함께, 저자의 경험을 바탕으로 한 데이터 신뢰성을 판단하는 방법을 알려주고 있습니다.


매주 새로운 영화들이 개봉을 하면서 관객수, 수익 등 흥행 결과가 나오고 있습니다. 이런 박스 오피스 수익에는 물가 상승률, 개봉관 수가 반영되지 않은 문제점이 있다고 합니다. 따라서, 흥행 수익의 차트로만 보면 최근에 개봉한 영화들이 최고 기록을 가질 확률이 높을 수 밖에 없습니다. 또한, 전체 기록이 아닌 개봉 첫 주의 기록만을 비교하는 차트이기 때문에 실제 각 영화의 실적과는 차이가 날 수 있습니다. 책에서는 1975년에 나온 죠스와 2015년에 나온 스타워즈 깨어난 포스와의 비교를 통해 어떻게 통계를 내느냐에 따라 흥행 수익 등수가 달라지는 것을 알려주고 있습니다. 이 외에도 영화에서 순이익, 투자 수익률, 홍보비, 마케팅 비 등 시대에 따라 다양한 변수가 존재한다는 것을 알 수 있고 어떻게 반영하고 분석하느냐에 따라 다양한 결과가 나올 수 있다는 것을 보여주고 있습니다.


신뢰 있는 각 종 지표나 통계를 만들기 위해서는 생각보다 다양한 지식과 판단 능력이 필요하다는 것을 알게 되었습니다. , 세계적 기업들이 빅데이터를 모으고 이를 분석하고 활용하기 위해, 최고의 인재들을 확보하기 위해 경쟁하는지 이해할 수 있었습니다. 잘못된 차트는 잘못된 판단과 연관된다는 것도 알게 된 시간이었습니다. :)


(출판사로부터 도서를 제공받아 작성한 리뷰입니다.)



댓글(0) 먼댓글(0) 좋아요(2)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo