-
-
숫자는 거짓말을 한다 - 통계와 그래프에 속지 않는 데이터 읽기의 힘
알베르토 카이로 지음, 박슬라 옮김 / 웅진지식하우스 / 2020년 10월
평점 :
<숫자는 거짓말을 한다>, 알베르토 카이로 지음, 박슬라 옮김, 웅진지식하우스, 2020
숫자 가득한 표는 많은 정보를 담고 있지만 한 눈에 파악하기는 힘들다. 오랜
시간 숙련되어 숫자를 직접 비교하는 것이 편하다 할 사람도 있겠지만, 데이터를 시각화한 차트가 보다
직관적이기 때문에 쉽게 파악할 수 있다고 믿는다.
보통 보고서를 쓸 때 데이터를 표로 표현하기도 하지만, 전달하고자
하는 핵심 내용을 직관적으로 보여주고, 설득력을 높이기 위해 차트를 그려 넣기도 한다. 설득력이라는 이유로 척도가 무시된 차트를 그리거나 척도가 다른 차트를 비교하는 오류를 범하곤 한다. 차트가 가진 강력한 설득 능력이 오히려 거짓 정보를 양산하고, 거짓말의
도구로 사용될 수 있는 것이다.
비주얼 저널리즘 전문가인 알베르토 카이로는 <숫자는 거짓말을
한다>를 통해 차트의 강력한 설득력으로 인해 거짓 정보를 전달하는 도구가 될 수 있음을 경고하고
올바르게 차트를 이해하는 방법을 전하고 있다.
알베르토 카이로는 먼저 차트 디자인은 글쓰기와 차트 해석은 글 읽기와 비슷하다고 이야기한다. 또한 “불변의 법칙은 드물고, 우리가
지닌 것은 대부분 수많은 예외와 위험 부담이 수반된 융통성 있는 원칙과 지침”이라고 이야기한다.
이 책의 핵심 메시지 중 하나는 바로 차트 디자인이 글쓰기와 비슷하다는 것이다.
차트 해석은 글을 읽는 것과 유사하다.
다만 차트 해석은 전통적인 읽기와 달리
항상 선형적으로 진행되지 않는다는 점만 다를 뿐이다.
이 글쓰기 비유를 차트에 적용하면
‘지나치게 좁고 높은 그래프’는 과장된 표현이고,
‘지나치게 길고 낮은 그래프’는 절제된 표현이라고 할 수 있다.(106쪽)
차트 디자인은 글쓰기와 마찬가지로 과학이자 예술이다.
불변의 법칙은 드물고, 우리가 지닌 것은 대부분 수많은 예외와
위험 부담이 수반된 융통성 있는 원칙과 지침이다.(102쪽)
차트에 위험부담이 따르는 것은 차트가 강력한 설득력을 가졌기 때문에 이를 악용해 잘못된 정보를 전달할 수
있기 때문이다. 또한 우리가 가진 확증 편향과 인지부조화에 의한 자기합리화 등 심리적 영향으로 잘못
이해할 수 있기 때문이다. 차트가 가진 위험부담을 피하고자 한다면 차트를 올바로 읽는 역량(도해력)을 길러야 한다고 강조한다.
차트의 강력한 설득력은 대가를 초래한다.
차트가 거짓말할 수 있는 이유는 우리가 스스로에게 거짓말하는 경향이 있기 때문이다.
인간은 차트와 숫자로 기존의 이견과 편견
그리고 확증 편향이라는 심리적 경향을 강화한다.(41쪽)
차트를 읽을 때 흔히 마주치는 문제(…)
상관관계와 인과관계, 합병 패러독스
그리고 생태적 오류(…)
차트는 표시되어 있는 것만 보여준다.(…)
생태적 오류는 개인을 그가 속한 집단의 속성에 근거해 분석하려 할 때 발생한다.(…)
개인이나 집단 등 분석 수준이 다르면 필요한 데이터 세트도 달라진다.
예를 들어 집단을 연구하기 위해 데이터를 생성하고 요약했는데
이를 받아들이는 대상이 그보다 작은 집단이나 지역, 도시 또는 개인일 경우
데이터의 효용성은 크게 줄어든다.
여기서 합병 패러독스가 발생한다.
데이터를 일부분만 이용하거나 취합하는 방식에 따라
특정 패턴이나 추세가 종종 사라지거나 역전되는 것이다.(218~220쪽)
차트는 좋든 나쁘든 세상 어디에나 존재하며 설득력이 무척 강하다.
이러한 요소들이 결합하면 틀린 정보와 가짜 뉴스라는 거대한 재앙으로 이러질 수 있다.
그러므로 차트를 읽을 때는 신중하게 주의하며 정확한 정보를 인지해야 한다.
즉, 도해 능력을 키워야 한다.(43쪽)
그렇다면 차트를 올바로 읽는 방법은 무엇일까?
먼저 제목, 설명, 출처를
살펴보라고 한다. “쓰레기를 넣으면 쓰레기가 나온다”는 말과
같이 신뢰할 수 있는 데이터를 넣어야 신뢰할 수 있는 차트가 된다는 것이다. 다음으로 측정 대상, 단위, 척도, 범례 등
차트의 스캐폴딩 정보를 확인하고, 시각적 부호화한 내용 자체를 살필 것을 권한다. 이때 차트 위에 가상의 사분면을 그리고 각각 이름을 붙이거나 데이터의 중심을 관통하는 가상의 선을 그리는 것이
도움이 된다고 한다. 이어서 주석도 읽고, 폭넓은 시야로
패턴과 동향, 관계까지 파악하라고 이야기한다.
차트를 해석하는 5단계 법칙
1) 제목, 설명 출처 : 차트에 제목과 설명이
있다면 그것부터 읽자.
출처가 명시되어 있다면 역시 살펴본다.
2) 측정 대상, 단위, 척도, 범례
차트는 무엇을 어떻게 측정했는지에 관한 정보를
문자 또는 시각 자료로 표시해야 한다.
3) 시각적 부호화
4) 주석을 읽어라
5) 폭넓은 시야로 패턴과 동향, 관계를 파악하라.(78~80쪽)
좋은 차트는 데이터를 얼마나 정확하게,
그리고 올바른 비례에 맞춰 부호화했느냐에 달려 있다.
하지만 그 전에 고려해야 할 사항이 있다.
바로 데이터 자체의 신뢰성이다.
차트를 읽을 때는 가장 먼저 데이터의 출처에 주목해야 한다.(118쪽)
차트의 스캐폴딩과 시각적 부호화 방법(…)
차트를 정확히 읽으려면 내용을 뒷받침하는 구성 요소(차트의 스캐폴딩)와
내용 자체(데이터의 표현 또는 기호화 방식)에
주목해야 한다.
스캐폴딩은 제목과 범례, 척도, 제작자 이름, 출처 등으로 구성된다.(50쪽)
차트를 읽는데 유용한 요령(…)
첫째, 언제나 가장 먼저 척도를
살펴보라.
이 차트가 무엇에 관한 것이고, 무엇을 측정했는지 파악해야 한다.
둘째, 산점도에 이름이 붙은 데에는 이유가 있다.(…)
세번째 요령은 차트 위에 가상의 사분면을 그리고 각각 이름을 붙이는 것이다.(…)
네 번째 방법은 원이 집중된 구역의 중심을 관통하는 가상의 선을 그리는 것이다.
(59~60쪽)
차트는 우리를 똑똑하게 만들고 유익한 대화를 나누도록 돕지만
그러려면 특정한 조건이 충족되어야 한다.
그 조건의 하나는 차트의 디자인이고
나머지는 우리가 그것을 읽고 해석하는 방법이다.(…)
또 하나의 조건은 논의를 발전시키기 위해 차트에 접근해야 한다.(…)
우리는 차트가 거기 표시되어 있는 것만 보여준다는 원칙에 충실해야 하며
너무 많은 것을 읽어내려 해서는 안 된다.(…)
차트를 사용하는 목적이 중요하다.
(259~260쪽)
주의할 점은 차트는 표시되어 있는 것만 보여줄 뿐임으로 ‘너무
많은 것을 읽어내려 하지 말고, 오차를 오류로 혼동하지 말고, 데이터를
통해 국가, 지역 등의 집단과 개인을 비교하고 싶다면 같은 수준의 데이터를 비교해야 한다고 이야기한다. 그리고 백분율과 비율로 표시된 통계 수치는 인간성이 제거되어 우리를 관념적으로 만들 수 있다는 점도 경계해야
한다고 강조한다.
오차의 종류는 다양하다.
그중 하나는 오차 범위는 여론조사의 불확실성을 표현할 때 흔히 접할 수 있다.
오차 범위는 신뢰구간의 2가지 요소 중 하나다.
다른 하나는 신뢰 수준으로, 백분율 수치로 나타내며 주로 95%나 99%다.(…)
따라서 수치가 불확실한 차트를 볼 때는
최종 결과가 보이는 것보다 더 작거나 클 수 있다는 사실을 명심해야 한다.(199쪽)
각각의 추론에는 그에 걸맞은 수준의 데이터 통합이 필요하다.
한마디로 국가 또는 지역별 종교와 행복의 상관관계를 알고 싶다면
국가 또는 지역 수준의 통합 데이터를 비교해야 한다.
개인에 관해 알고 싶으면 국가나 지역 수준의 차트는 필요하지 않다.
이 경우 차트는 개인과 개인을 비교해야 한다.(227쪽)
인류의 진보를 논할 때 백분율이나 비율만 고려하면
통계 수치에서 인간성을 제거해 우리를 자기만족에 안주하게 만든다.(…)
<숫자에 속아 위험한 선택을 하는 사람들>의
저자 게르트 기거랜처는
백분율은 필요한 것보다 더 숫자를 관념적으로 만든다고 말했다.(178~179쪽)
당파성을 가진 가짜 뉴스가 범람하는 시대에서 가짜 정보에 현혹되지 않고 좋은 정보를 골라내는 능력은 반드시
필요하다. 차트를 올바르게 읽는 방법을 안다면 거짓 정보, 왜곡된
정보 등을 충분히 걸러낼 수 있을 것이라 믿는다.
아울러 ‘평균’이
가진 허상을 날카롭게 지적한 토드 로즈의 <평균의 종말>(21세기북스, 2018)과 인간의 가진 본능으로 인해 차트와 통계를 잘못 이해함으로써 세상을 오해하고 있다고 지적한 한스
로슬링의 <팩트풀니스>(김영사, 2019)를 함께 읽는다면 올바른 데이터 읽는 법을 익히는데 도움이 될 것이다.
* 해당 도서는 출판사로부터 무상으로 제공받았으며, 제 주관에 따라 솔직하게 작성했습니다.