증거의 오류 - 데이터, 증거, 이론의 구조를 파헤친 사회학 거장의 탐구 보고서
하워드 S. 베커 지음, 서정아 옮김 / 책세상 / 2020년 2월
평점 :
장바구니담기


4차산업혁명의 중심에는 빅데이터가 있습니다. 그러다보니 '데이터분석'에 대한 관심이 무척 높아졌습니다. 그러다보니 데이터분석의 기초가 되는 코팅언어 파이썬을 배우는 사람들이 많이 늘었습니다. 문제는 이들이 다뤄야 할 것이 바로 데이터이고 데이터를 어떻게 분류하고 그곳에서 어떤 결론을 도출해야 하는것에 대해 많은 논의들이 일어납니다. <증거의 오류>는 바로 이 '데이터'에 바로 문제의식을 들어냅니다. 물론 데이터를 이용하여 증거를 찾는 작업은 4차산업혁명과 함께 시작된것이 아니죠. 최소 수백년의 역사를 가질것이고, 인문학으로 분류되던 학문에, 20세기이후부터 인문학에 과학이라는 용어가 붙으며, 탄생한, 사회과학에서 데이터를 수집하고 그곳에서 증거를 찾으면서 다양한 문제의식을 제기되었습니다. 저자는 데이터를 누가 다루느냐에 따라 어떤 실수가 발생할수있지를 서술합니다. 저자 자신의 실수담도 서슴없이 고백합니다. 앞서 말했듯 21세기는 데이터의 시대입니다. 데이터는 4차산업혁명시기에 '반도체'의 역할을 하게 됩니다. 데이터를 다루어 할 사람들이 있습니다. 데이터를 잘못다루면 막대한 손해를 볼수도 있음을 이책을 통해 알아야 합니다. 실수를 하더라도 그것을 개선하려는 노력이 필요해보입니다.

저자 하워드 s 베커는 1928년생으로 시카고대박사시고 노스웨스턴대와 워싱턴대에서 사회학과교수를 역임하다 은퇴하셨답니다. 올해 91세신데, <증거의 오류>를 쓴해가 2017년으로 2년전인데, 89세에 엄청난 노익장이신듯합니다. 신선한건 워싱턴대에 계실때 음악학부교수로 계셨네요. 음악에도 매우 조예가 깊은 세계적인 사회학 권위자시고 주로 이탈사회학, 예술사회학, 음악사회학으로 명성을 얻었습니다. , 63년에 출판한 <아웃사이더>에서 낙인이론(라벨링)의 기초를 제공했다고 합니다. 현재는 샌프란시스코에 사시면서 다양한 방면에 글을 쓰고 계신답니다. 올해도 <사회과학자를 위한 글쓰기> 개정판을 내셨네요. 정말 본받을 만한 인생을 살고 계십니다.

사회학에서 연구방법론은 정성적연구와 정량적 연구로 대별됩니다. 개인적으로는 정성적방법을 쓸때와 정량적 방법을 쓸때가 다르다는 생각을 했는데, 학계에서는 아닌모양입니다. 두 방법론사이에 갈등구조가 생각보다 깊은 듯합니다. 정량적연구파는 숫자로 표시할 수없는 지식은 부족한것이라하고, 정성적연구파는 데이터는 언어로 표현되어야 믿음이 간다라고 생각한다는거죠. 저자는 이 연구방법상에 분열을 막겠다고 한것이 이 책을 쓴 이유중에 일부라고 밝힙니다. 정성적연구는 대량의 데이터를 객관적으로 다룰때 아무래도 유용하고, 정성적연구는 심도있는 연구에 많이 쓰이는데, 대표적인 경우가 마케팅에서 쓰는 FGI죠. 포커스그룹인터뷰로 소수의 인원들을 모아서 제품평을 ㅇ받을 때 많이 사용합니다. 비용문제로 FGI를 자주진행하는건 무리수죠..ㅎㅎ 저자는 두 진영이 논쟁으로 보여지지만 두 방법이 혼용해서 쓰여지는 것은 이상하지 않다고 합니다.

데이터가 증거가 되어 이론이 과정에서, 데이터(말,숫자,시각자료 등)를 누가 수집하느냐에따라 영향을 받는다고 합니다. 그래서 저자는 데이터 수집자의 유형분석을 시행합니다. 먼저 인구조사부터 다룹니다. 인구조사는 인구조사국에서 다루는데, 이것만큼 오래되고 정확한 조사는 없을겁니다. 물론 완벽은 불가능하고 할수도 없지만 방해요인이 적고, 법으로 강제할 수있는 부분도 있고, 국가적으로도 유권자를 파악해야 하기에 중요한 조사입니다. 하지만 완벽한 산출은 애저녁에 불가능하죠. 조사가 순간적으로 이뤄지는것이 아니라 시간이 소요되고 그사이에 사람들의 생사는 수시로 변화하기 때문입니다. 하지만 당연히 기관에서는 완벽하려고 노력할 뿐이겠죠. 노력은 하지만 부정확할 수밖에는 요인들이 존재합니다. 우선 주거부정인 사람들이 대표적입니다. 노숙자를 파악해서 채울수도 있겠지만 오차가 있을수밖에없습니다. 그리고 인종별 구별도 애매하죠. 국적별로도 애매한 부분이 많은 것은 한국과 많이 다른점일겁니다. 조사에서는 애매한 부분을 기술적 비판으로 따로 연구대상으로 간주하는이자 비판적 발전으로 좋다고 합니다.

연속적인 데이터를 생산하는 곳으로 정부기관이 있습니다. 그 구성원들은 자신들의 일의 정당성을 위해 매일 자신들이 행하는 일을 기록합니다. 하지만 그것을 기록하는 담당자의 상황에 따라 다양한 기술이 되는것이 사실일겁니다.. 그래서 정부기관의 데이터를 사용할때도 이를 고려하라고 합니다. 그리고 저자는 연구기관에서 수석연구자가 직접 데이터를 수집하느냐아니면 보조연구원이 데이터를 수집하느냐에 따라 연구결과에 영향을 받는다는다고 합니다. 이를 극복하고자 공동합의를 통해 집단행동에 대한 구체적이고 원칙적인 검증데이터를 제공하는것이 방법입니다.

<증거의 오류>에서는 데이터를 활용하여 아이디어의 증거로 탄생하는 과정을 전제합니다. 우리는 지금도 이러한 과정으로 논리를 만들려고 노력을 합니다. 내가 하는 주장을 남에게 받아들이게 하는것이죠. 이를 위해서는 아이디어가 있어야 하고 그것을 뒷받침하는 데이터가 증거로 재탄생합니다. 하지만 저자는 이때 실수가 끼어듬을 다양한 사례(본인의 사례)로 조심할지점을 알려줍니다. 2부에서는 누가 데이터를 수집하느냐에 따라 얼마나 오류가 심한지도 경고합니다. 하지만 이것은 미국의 이야기이고 저는 사회학적 연구방법의 역사에 놀라움을 가집니다. 한국은 일제시대에 사회학이 도입이 되었고, 46년 서울대에 사회학과가 설립되지만 이런 깊이 있는 연구를 본격적으로 시작된건 60년대이후 일로 봐야할겁니다 그 이후 60년이 흘렀지만 아직도 데이터에는 약한 면을 드러냅니다. 이는 사회조사의 기본인 여론조사에서도 마찬가지입니다. 네이버기사를 보면 정치관련 여론조사에 불신이 어느때보다도 불신이 높습니다. 학문은 기본을 충실히하는데서 튼튼한 바탕이 만들어질겁니다. 데이터를 다루는 사람들이 가져야할 경각심을 느낄수있습니다.  


댓글(0) 먼댓글(0) 좋아요(3)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo