대량살상수학무기 - 어떻게 빅데이터는 불평등을 확산하고 민주주의를 위협하는가
캐시 오닐 지음, 김정혜 옮김 / 흐름출판 / 2017년 9월
평점 :
장바구니담기


수학은 인류 문명을 오늘날처럼 찬연하게 가꾸는 데 가장 큰 공을 세운 학문 분야이며, 인간에게 있어 영원한 벗이자 진리를 향한 지침과도 같습니다. 이런 수학이, 그 칼날을 반대로 향하여 "많은 사람을 죽이고, 다치고, 불행하게 만드는 무기"로 쓰인다면 고개가 갸웃해질 만하죠.

weapon(s) of mass destruction이란 말은 예전부터 널리 사용되었으나, 15, 6년 전 조지 W 부시 당시 미국 대통령이 이라크 공격의 명분을 마련하기 위해 자주 거론한 이래 부쩍 널리 회자된 단어입니다. 결국 바그다드를 점령하고 보니 WMD에 넣을 만한 아무런 심각한 흔적이 발견되지 않았고, 이에 그는 "사담 후세인이 바로 대량 살상 무기"라고 대꾸하여 빈축을 사기도 했죠.

이 책의 저자는 위의 용어 구성부분 중 mass를 math로 바꾸어, 수학이 무고한 대중을 궁지에 몰거나, 삶을 피폐하게 만들거나, 인종 차별과 부의 양극화를 고착시키는 데에 악용되는 많은 사례를 들며, 통계라는 허울을 쓰고 이뤄지는 많은 조사, 연구 결과, 시스템, 워킹 툴이 실상은 그닥 확고한 신빙성이나 타당성 검증도 없이 마구잡이로 쓰여지는 개탄스러운 현실을 고발합니다. 고위 관료나 정치인의 농단, 재량권 남용이라면 즉시 지탄의 대상이 되는데, 빅데이터와 실증 연구의 휘광을 둘러친, 외관만 정교해 보이는 많은 통계 연관 데이터베이스들은 그런 비판 대상에서 비껴갑니다. "수학과 통계학을 기반으로 도출된 결과인데 오죽하겠어?" 대중과 전문가 모두 눈먼 신뢰를 보내는 이들 장치가, 실은 고의적으로, 혹은 우연히 개입한 편견과 불의만 확대 재생산하고 있다는 뜻입니다.

미국 중등 교과과정의 학력저하는 심각한 문제죠. 특정 거주지역의 교사들은 학생들의 교과 이해도를 높이는 일에 매우 성과가 낮습니다(여기까지는 객관적 팩트). 상당수 교사가 제 할 일을 태만히하니 대거 해고를 단행해야 한다! 정치인, 학부형, 교육 당국 모두 이의가 없으니 그대로 실행될 밖에요. 헌데, 여태 학생들과 밀착하여 범죄로부터 보호하고, 어려운 가정을 방문하여 최소 생존 여건을 보살피는 등 지역 사회에서 호평 받았던 인력조차 해고되었기에(이런 이들이 많지는 않았겠죠), 일부에서는 이런 눈먼 정책의 융통성 없는 집행에 큰 반대의사를 표명했습니다. 이런 프로그램 역시, 수학과 통계학의 다양한 기법을 편입하여(또한, 막대한 비용과 우수 인력의 노고가 투입되어) 고안된, 비싼 도구입니다. 그러니 그에 반대하는 목소리를 놓고 오히려 "정치적 의도"를 담았다며 불순하게 보는 여론도 생겼죠. (학교 교사 해고 이슈에 대해서는 p26, 한참 뒤 p228 등에서 두어 번 언급합니다)

수학이나 통계학 기법이 아무리 정교히 고안되어 구현되었다 쳐도, 이 기법의 전체 프레임이나 그에 투입된 raw data가 "공정성, 형평성"을 염두에 두지 않았다면, 오히려 편견이나 오류가 엉뚱하게도 "과학이 가져가야 할 영예"를 가로채는 셈입니다. 이 문제는 "정성"과 "정량"사이에서 얼마나 균형 감각 있게 조화로운 선택을 할지의 지혜와 연관되었기에, 새삼스러운 게 아니라 인류 역사의 오랜 딜레마입니다. 문제는, 그저 "수학, 통계학"이란 포장만 둘러치면 그 타당성에 대해 아무도(이 중에는 그로 인해 직접 피해를 본 이들도 포함합니다) 이의를 제기하려 들지 않는다는 거죠.

저자가 책 여러 군데에서 개탄과 유감, 분개감을 표현하는 건, 혹여 프로그램 자체에는 그 구조의 엇나감을 들여다 볼 엄두를 안 낸다 해도, 이 프로그램이 실제 낳는 결과가 과연 타당한지, 엉뚱한 부작용이 발생했다면 어느 부분과 연관이 있었는지, 아무도 피드백 검증조차 시도를 안 한다는 겁니다. 피드백 검증에서 자유로운 대상은 아무것도 없고, 수학 아니라 어떤 학문이라도 자체 기준 아닌 다른 시선에서 타당성 점검 절차에 노출되어야만 하죠. 이걸 운용하는 중인데 결과가 좋은지, 아니면 전보다 더 나빠졌는지도 모르고 무작정 신뢰하며 눈을 감는 건 무지몽매한 반계몽적, 미신적 행태에 가깝습니다.

저자가 규정한 WMD의 공통점, 혹은 필요충분조건은, 불투명성, 확장성, 피해, 이 세 가지입니다. 앞서 말했듯 도대체 왜 특정 모델이 옳은지 아무도 의심하려 들지 않으며, 타당성에 대한 의혹 제기는 묵살되기 일쑤입니다. 혹 피드백이 있다 해도, "자기 강화"만 유발할 뿐인 악성의 메커니즘입니다.

"확장성" 요소는 특히 우리 한국 독자들이 읽으며 뜨끔해하거나, 폭풍 공감을 유발할 만한 대목입니다. 우리도 이른바 "입시 위주의 서열화 교육"에 대한 불만이 하늘을 찌를 듯한데, 저자는 "획일적 기준으로 대학들에 한줄세우기를 강요하여, 1) 정작 필요한 분야에는 투자가 이뤄지지 않고 겉치장에만 돈이 낭비되며, 2) 등록금은 등록금대로 천정부지 상승하고, 3) 데이터 날조, 왜곡 등 온갖 편법이 난무하여 교육 풍토의 타락을 유발한 주범으로, <US 뉴스 앤 월드 리포트>誌의 "대학 랭킹 평가"를 들고 있습니다. 저자가 통렬히 비판하는 게, 정작 이 어리석은 관행과 상업적 폐단을 창조해 낸 잡지 본체는 몇 년 전 수익성 악화로 문을 닫았으나, 엉뚱하게도 "대학 랭킹 매기기"는 별개 사업체로 독립하기까지 하며 덩치를 키우는 현실입니다.

저자는 보장된 종신교수직을 버리고 현실의 매력에 참여하기 위해 헤지펀드의 퀀트로 일한 적 있는 분인데(그래서, 책의 신뢰도나 주장의 권위가 더욱 높아지는 면도 있더군요), 이른바 리스크메트릭스, 혹은 그 이전 이론적 바탕을 이룬 몬테카를로 기법 등에 대해, 기계적이고 비창의적이며 비논리적인, 어제까지 반복되던 관행이 오늘, 내일도 변함없으리라는 잘못된 기대에 기대었다며 비판합니다.

빅데이터는 이른바 약탈적 광고주, 즉 취약계층을 집중적으로 노리며 그들이 잘못된 구매나 지출을 행하게 유도합니다. 또, 구직에 필사적인 젊은이들을 현혹하여 왜곡된 "취업률"을 내세운 후, 비싼 등록금을 챙기며 4년 후 학위를 발급한 후, 정작 취업에는 별 도움도 안 되는 헛된 경험에 인생을 낭비하게 조장하는 "for-profit college", 즉 영리추구 대학(학위 공장)들 역시, 수학과 통계학에 의해 고안된 사악한 알고리즘으로 돈을 버는 집단이라고 저자는 신랄히 꾸짖습니다.

불투명성은 피드백 절차 부재로 더 심각한 악성 영향을 낳는 WMD의 특성입니다. 저자는 실제 자신의 경험을 들며, 도대체 금융사들이 외부에서 자문(상품)을 구한다면서 대외적으로 생색만 낼 뿐, 전혀 제3자 조언이나 비판에 귀를 안 기울이다 지난번처럼 큰 재앙을 낳았다고 통박합니다. 그나마 이런 사람들은 머리나 좋고 자기 분야에서 과거 한때라도 뚜렷한 성과나 내고서 남의 말을 안 듣는다고나 하지만, 한국 사회의 상당 부분 섹터에서는 무능하고 어리석은 이들일수록 더욱 자신만의 엉터리 같은 세계관에 사로잡혀 나오지를 못합니다.

특히 미국의 경우 치안 문란, 부재가 심각한 사회 문제이죠. 저자는 경찰 당국의 범죄 예측 프로그램이 주로 빈민가, 유색 인종 밀집 구역을대상으로 이뤄진다며, 이런 프로그램을 통해 불심검문에 걸려들거나 경범죄로 입건된 이들이, 오히려 낙인 효과를 통해 "돌이킬 수 없는 악성 상습범"으로 재생산된다며, 분별 없는 통계와 모델이 문제를 악화시키는 장본인임을 지적합니다.

채용에서도 이른바 인적성검사는 여러 회사들이 우수한 인재를 잘못된 도구 하나만 믿고서 대거 외면한다거나, 구직 희망자들의 인생을 황폐화시키는 족쇄 노릇을 한다고 저자는 비판합니다. 저자께서 참 두뇌가 명석하신 분인 게, 이후 이 구직자가 의학 소견을 바탕으로 한 채용 차별을 사유로 해당 기업에 소송을 건 경위를 소개하면서, "이제 책임은 이 테스트를 고안, 유통, 판매한 연구자 측과, 이 테스트를 통해 해당 구직자를 채용 거절한 회사 중 누군가가 져야 하겠다"고 한 마디로 요약한 구절입니다. 어쩜 이렇게, 독자가 궁금해할 만한 포인트만 정확히 짚어, 짧은 말로 요령껏 전달할 수 있을까 싶더군요.

p102, p207 등에서 언급되는 이른바 false positive란, 쉽게 말해 "~라면 파리가 새다"같은 주장을 뜻합니다. 파리가 새일 수는 없는데, 잘못된 가정 하에서는 어떤 황당한 주장도 다 참(true)으로 도출될 수 있다는 논리학 이슈를 가리킵니다. p225에서는 같은 맥락의 "false negative"가 언급됩니다.

앞으로 인공지능 도입이 이뤄질 많은 산업 분야에서도, 그저 "빅데이터와 고성능 신경망 AI가 도출한 결과이니 무작정 믿고 보자"는 위험한 맹신 풍조가, 사회의 발전을 가로막고 중세의 암흑으로 퇴보시킬 가능성이 큰 요인입니다. 책에도 나오듯 GIGO, 쓰레기가 투입되면 쓰레기가 나올 수밖에 없다는 뜻으로, 도대체 애초에 인풋된 데이터셋, 프록시 데이터 자체가, 오염되지 않고 특정 환경과 부합하지도 못하는 부적절한 material이 아니라고 누가 장담할 수 있겠냐는 거죠. 또, 원인에서 결과가 도출되기까지의 명확한 알고리즘이 투명히 밝혀지지 않는 이상, 과거 몇 번의 유효한 성과가 나왔다고 앞으로도 마냥 믿을 수는 없는 겁니다. 과거 제사장이나 무당의 말을 덮어놓고 믿는 것이나 무엇이 다르겠습니까. "과학, 수학, 전산학" 같은 간판, 타이틀이 문제가 아니라, 이를 내건 개인이나 전문가, 집단이 과연 얼마나 합리적인 사고 과정과 검증 절차에 따라 판단하고 행동하느냐가 중요한 것입니다.

기계나 학문의 외관만을 무분별하게 신뢰하는 행태는, 그 안에 감춰진 또다른 불순한 의도나 정치적 흉계를 강화, 추인하는 결과만 낳을 뿐이죠. 공동체의 정의와 질서를 회복하고 가꾸는 소명은, 오직 인간만이 행할 수 있고 인간에게만 주어진 것입니다. 저자의 이 책은 "사람이 먼저"임을 모든 페이지에서 강조하는 인간미가 느껴져서 더욱 좋았습니다. 적지 않은 분량이지만 저자의 수다, 열변 등이 지면 너머로 와 닿는 이야기 톤이라서 금세 읽히는 것도 장점입니다.


댓글(0) 먼댓글(0) 좋아요(8)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo