책 머리말에 세계에 관한 지식 테스트 질문 13개가 제시되어있다. 저자는 13개의 질문에 대한 응답자들의 정답률이 매우 저조하고, 이는 침팬지가 무작위로 정답을 맞출 가능성보다 낮은 확률이며 설문에 응답한 사람들 즉, 대부분의 사람들은 현 세계를 잘못 이해하고 있다고 결론 짓고 있다. 저자가 이책의 핵심을 머리말에 제시했다고 가정 했을 때, 통계학자 시각으로 이 내용들을 점검하지 않을 수 없다.
데이터 자체는 아무것도 우리에게 이야기 하지 않는다. 적절한 method을 사용해 분석하고, 분석된 결과를 올바르게 해석하는 과정을 거쳐야 비로소 데이터의 실체가 드러나게 되는 것이다. 따라서 자료를 모으기 시작 전의 단계에서부터 목적에 적합한 데이타 수집계획은 설정되어져야하고 자료수집방법에서도 타당성이 검증되어야 한다. 이러한 일련의 단계 중, 적절한 메져(measure)를 선택하는 일은 데이터를 분석하는 단계 뿐만 아니라, 결과를 도출하는 단계까지 영향을 미치게 되기 때문에 아주 중요한 단계라 할 수 있다. 예를 들어 날씨를 지표하는 여러가지 measure들 중에 기온이라는 하나의 measure만을 사용했을 경우에는 "기온이 낮다, 높다, 또는 기온이 일정하다" 라고만 설명할 수 있다. 하지만, 전체적인 날씨를 평가하기 위해서는 기온 이외 다른 measure (습도, 바람, 미세먼지 등)여러가지가 함께 고려되어야만 객관적이고 합리적인 종합적인 결론을 내릴 가능성이 높다. 적절한 메져를 선택하는 문제는 선택된 measure가 얼마나 연구목적에 합당하지가 기준이 될 수 있고, 더불어 연구자의 가치관 문제이기도 하다. 로슬링이 제시한 13개의 질문 중 하나를 예로 들면, "3. 지난 20년간 세계 인구에서 극빈층 비율은 어떻게 바뀌었을까?" 질문의 가정은 극빈층의 비율의 감소가 좀 더 나은 삶으로의 변화되었을 것이라는 가정이다. 분배보다는 성장주의, 상대적인 빈곤보다는 절대적인 빈곤이라는 개념에서 기반된 질문을 던진 것이다. 빈곤이라는 정의를 살펴보면, 절대적 빈곤과 상대적 빈곤으로 구별되어 나누어진다. 생존에 필요한 결핍을 의미하는 절대적 빈곤의 개념과는 별개로 상대적 빈곤은 문화적, 또는 정신적인 부분도 포함이 되면서 각 인간의 필요는 모두 동일하지 않다는 가정에서부터 출발하기 때문에 기본적으로 다른 의미이다. 로슬링이 사용하는 빈곤은 절대빈곤에 대한 개념만 사용한 것이다. 그 선택은 연구자의 판단이며 이는 연구자의 가치관 및 세계관의 반영이다.
로슬링 연구진의 논리는 이러하다. 성장된 세계는 평균적으로 괜찮아졌으며, 사람들이 로슬링 연구진 생각에 동의하지 못하는 것은 그들이 가지고 있는 (제한되고 편협한)정보를 알지 못한 탓이고, 그러한 무지의 결과는 세상을 오해하게 만든다는 것이다. 로슬링 연구진은 그들의 세계관을 반영한 measure들을 선택해 목적에 부합한 설문지를 만들었지만 저조한 정답률은 그들을 실망시켰다. 로슬링은 전세계 사람들이 자신과 같은 방식으로 세상을 바라보기 원하는 것이었다.
한가지 더 짚고 넘어갈 점은 개인의 가치관과 세계관은 시대의 변화와 사회의 흐름의 영향과 무관하지 않다는 것이다. 시대가 변화함에 따라 새로운 시각과 관점이 새로이 생성되며, 가치판단에도 변화를 일으킨다. 앞에서 언급한 빈곤이라는 문제를 다시 보면, 빈곤이란 절대적 빈곤과 상대적 빈곤으로 분류되어지는 문제뿐 아니라 빈곤이라는 measure도 시대의 변화에 따라서 수정 또는 새로운 measure가 추가 될 가능성도 있다는 것이다.
며칠 전 본 기사가 생각났다. 스콧트랜드는 생리용품을 무료로 배급하기로 결정하였다고 한다. 세계최초라고 한다. 스코트랜드는 젊은 여성중 약 2000명, UK에서는 10%의 여성들이 평균 5일의 생리기간동안 생리용품을 사기 힘든 period poverty 집단이 있다고 한다.
( 관련 기사: https://www.bbc.com/news/uk-scotland-scotland-politics-51629880?fbclid=IwAR2NV8NlwPuCy1OPftcFMgffyEpOwziYVmhMKgRC8-KMk1gcZw8SzxQF4QI)
"사실은 세계 인구의 절대다수가 중간 소득수준을 유지한다. 이들이 우리가 중산층이라고 생각하는 사람은 아닐 수 있지만, 극빈층도 아니다. 딸아이는 학교에 가고, 아이들은 예방접종을 받고, 자녀 둘과 함께 살고, 휴가 때는 난민이 아닌 평범한 사람으로 해외여행을 꿈꾼다. 세상은 해를 거듭하며 조금씩 조금씩 나아진다. 모든 면에서 해마다 나아지는 게 아니라, 대체로 그렇다. " (27p)
로슬링연구진들은 세상의 나아짐을 평가하는 도구로 소득 수준, 취학률, 예방접종률, 휴가를 사용하는 정도의 measure 사용하기로 결정하고 그것을 기반으로 결론을 내렸다. 하지만, 만약 측정 도구로 period poverty률이 추가적으로 포함시켰다면, 전세계에서 고작 한 나라인 스코트랜드만이 이 문제를 해결했다는 정보(data)가 업데이트 되었을 경우 과연 롤링연구진은 이전과 같은 결론을 내릴 수 있을까? 이처럼 measure를 바꾸거나 추가했을 경우에 기존과는 전혀 다른 결론이 내려질 수 도 있는 것이다.
중복된 이야기가 될 수도 있지만, 데이터가 사실이며, 수집된 데이터는 세계를 읽는 지표처럼 사용되어야 한다는 로슬링연구진의 생각은 동의하기 어렵다. 데이터가 곧 사실(fact)이라는 말의 뜻은 무엇인가? 데이터란 자연현상 및 인간과 관련된 여러가지 제반현상 등을 측정도구를 사용해서 측정한 결과치이다. 그렇게 수집한 데이터 자체가 절대적으로 객관적인(불변의) 사실이 아니다. 현상이 데이타화 될려면 measurable(측정가능) 해야하고 측정도구가 필요하다. 자연현상과 관련된 데이타(예, 체온, 바람 속도)는 비교적 객관적일 가능성이 높지만, 그러한 데이터에도 여전히 측정도구의 오류나 측정자의 실수등과 관련된 measurement error가 발생 가능성은 여전히 남아있다. 반면, 인간의 감정과 관련된 데이터 또는 사회적 이슈과 관련된 문제들 (예, 범죄, 정치등)의 정보는 데이터수집/이용의 목적에 따라서 데이터의 성격이 매우 달라질 가능성이 높다. 특히 인간행동과 관련된, 감정, 정치과 관련된 자료는 비교적 주관적일 가능성이 매우 높다.
로슬링 연구진이 세상을 이해하고 설명하는 방법에 대한 시도가 틀렸다고 이야기 하는 것이 아니다. 로슬링은 본인이 선택한 데이터만이 세상을 나타내는 지표라고 이야기 하지만, 세상에는 다른 종류의 데이터도 수없이 존재한다. 연구자의 세계관과 가치관에 따라 각기 다른 데이터가 만들어지고, 선택되어지고, 활용되어지는 것이다. 따라서 로슬링이 주장하는 데이터가 세계관을 업데이트 시키는 것이 아니라, 나는 반대로 한 연구자의 세계관이 데이터를 새롭게 한다고 생각한다.