-
-
대량살상수학무기 - 어떻게 빅데이터는 불평등을 확산하고 민주주의를 위협하는가
캐시 오닐 지음, 김정혜 옮김 / 흐름출판 / 2017년 9월
평점 :
빅데이터를 찬양하는 시대이다. 앞으로 우리 시대를 선도할 기술 중에 빅데이터를 꼽지 않을 사람은 거의 없을 것이다. 빅데이터를 위한 충분한 양의 정보와 소트프웨어와 하드웨어 기술이 뒷받침되어 모든 조건이 맞아떨어지게 되었다. 이제 이 빅데이터를 적재적소로 활용하기 위하여 모두가 머리를 싸매고 있다. 그러나, 모두가 YES라고 할 때 NO라고 하는 사람이 있으니 바로 <대량살상 수학무기>의 저자 캐시 오닐이다.
저자는 수학자이며 퀀트, 데이터 과학자이다. 그녀는 서문에서 밝히듯, 자신이 내부 고발자이며 전문가로서의 제안이라고 이야기한다. 그리고 다음과 같이 구체적으로 무엇이 문제인지에 대해서 분명히 짚고 넘어가며 이 책의 목적을 밝힌다.
"수학, 데이터, IT 기술의 결합으로 만들어진 알고리즘들은 지금 이 순간에도 곳곳에서 '보이지 않는 손'이 되어 무소불위의 권한을 휘두르고 있습니다. 특히 인간의 편견과 무지, 오만을 코드화한 프로그램들은 차별을 정당화하고, 민주주의를 위협합니다. 저는 이런 프로그램들이 '대량살상무기(Weapons of Mass Destruction) 줄여서 WMD란 이름을 붙였습니다. 대량살상수학무기는 이 책의 제목이기도 합니다."
저자는 WMD가 벌어지고 있는 영역이 어디 있는지를 실제 사례를 들어가며 이야기하고 있는데, 그에 앞서 WMD의 특징을 이해하는 것이 필요하다. WMD는 세 가지 특징을 가지고 있는데 바로 불투명성, 확장성, 피해이다. 먼저 WMD 중 상당수가 적절한 피드백을 받지 못하고 있다. 구글의 검색 기능이라든지 아마존의 고객 추천 기능 등은 빅데이터를 활용한 좋은 사례인데, 이들은 적절한 피드백을 통해 프로그램이 지속적으로 개선되고 업데이트되고 있다. 그러나 WMD는 개선이 되지 않기 때문에 문제 해결을 위한 실마리조차 찾기 힘든 경우가 많다.
빅데이터를 통한 분석이 왜 문제가 되는가? 이에 대해 저자는 먼저 데이터 과학자들이 거래 대상이 되는 사람들을 생각하지 않기 때문이라고 지적한다. 대표적으로 빅데이터 분석을 통해 교사를 평가하는 매스매티카의 평가 시스템은 평가 점수가 나쁜 교사들을 해고하는데 사용된다. 아이들과 상호작용을 하며 아이들의 고민을 잘 들어주고 해결해주어 바른 방향으로 나아가는데 도움을 주더라도 이것은 평가에 전혀 반영이 되지 않는다. 오로지 성적 향상만이 주요 변수로 평가에 반영되기 때문이다. 결국 이런 알고리즘을 만든 데이터과학자들로 인해 교사들은 일자리를 잃게 되고 억울한 일을 당하게 된다. 그러나, WMD를 운영하는 이들은 자신들이 실수와 잘못에 무감각하다.
WMD의 또 다른 문제점은 우발적인 실수를 피할 수 없다는 점이다. 모형이라는 것 자체가 복잡한 현상을 단순화 시킨 것이다. 즉, 일부 중요한 정보가 누락된 알고리즘이 만들어질 수밖에 없고 모든 현상을 완벽하게 담아낼 수 없다는 점이다. 그리고 공정한 것처럼 보이나 개발자의 목표와 이념이 반영될 수밖에 없다. 저자는 이를 "모형들은 수학에 깊이 뿌리내린 지극히 개인적인 의견이라고 할 수 있다"라고 언급한다. 따라서, 앞으로 빅데이터와 알고리즘을 대하게 될 때 반드시 누가 만들었는지와 그 목적이 무엇인지에 대해서 분명히 알아야 한다.
책에서 언급하는 여러 WMD 사례 중에서 범죄자를 예측하는 재범위험성모형은 가히 충격적이다. 이 모형으로 판사들이 범죄자의 재범 위험성을 측정할 때 편견이 줄어들 것으로 기대되었다. 그러나, 사실은 인간의 편견을 기술로 감춘 것은 아닐까라고 저자는 반문한다. 왜냐하면 이 평가모형은 범죄자의 가족, 이웃, 친구들을 포함한 범죄자의 출생 환경과 성장 배경을 모두 세세히 다루는데, 이런 세부사항이 형량을 결정하는데 영향을 미쳐서는 안 되기 때문이다. 즉, 범죄율이 높은 동네에 산다는 이유만으로 재범을 저지를 확률이 높다는 오류를 범하는 것이다.
결국, 이 모형에 의해 실제로 과한 형량을 받고 수감된 사람들은 어쩔 수 없이 사회에 대한 반감과 분노를 더 오랫동안 감옥에서 격리된 채 시간을 보내야 한다. 그리고 이런 시간은 어쩔 수 없이 그로 하여금 재범 위험성을 증가시키게 된다. 즉, 재범모형이 제대로 예측을 한 것이 아니라 재범모형 때문에 재범의 확률을 높이게 되는 것이다. 이에 대해 저자는 다음과 같이 정리한다.
"재범위험성모형 자체가 그런 악순환이 발생하는 하나의 원인이며, 그런 악순환이 지속되는 데 일조한다. 이것이 바로 WMD의 대표적인 특징이다."
또한 WMD는 많은 이들의 기회의 문을 닫아버린다. 또한 이의를 제기할 가능성조차 허용하지 않는다. 은행들이 사용하는 신용평가 모형이 대표적이다. 이들은 평가모형 점수가 낮은 이들에 대해 대출의 기회조차 닫아버린다.
범죄퇴치모형은 가난한 지역의 경범죄에만 집중하게 만들어 버린다. 그리고 이로 인해 부자들이 저지르는 금융 범죄 등에 대해서는 거의 손을 대지 못하고 있는 실정이다. 결국, 가난한 사람들에 초점을 맞춘 이 모형은 가난한 사람들만 더 많이 불심검문하며 일부를 체포하여 교도소로 보내는 데만 혈안이 되어 버린다. 단지 가난한 이유만으로 범죄율이 높고 재범의 위험이 높다고 이 모형은 판단해 버리는 것이다. 책에서 저자가 말하는 것처럼 가난한 동네에 거주하다가 범죄를 일으켜 수감 생활 후 출소하여 많은 경찰이 배치되어 있는 가난한 동네에 있다가 다시 경찰과 마찰을 일으킬 확률이 세금 사기로 형을 살고 부촌으로 돌아간 화이트칼라 범죄자가 경찰과 마찰을 일으킬 확률보다 당연히 높다.
저자는 단순히 비판만 하지 않고 재범위험성모형을 설계할 때 독방, 교도소 내 강간 같은 부정적 요소와 햇빛, 운동, 음식, 문맹퇴치 교육 등의 긍정적 요소에 대한 데이터 분석이 필요하다고 제시한다. 이렇게 건설적인 데이터 분석이 가능함에도 불구하고 교도소는 굳이 나서서 이런 방향의 모형을 설계하려고 하지 않는다.
저자는 위에서 말한 재범위험성 모형, 교사평가 모형 등의 WMD 사례 외에도 대학의 순위 매기기 모형, 일정관리 소프트웨어, 신용평가모형, 보험료산정관련 모형 등에 대해서 WMD의 세 가지 특성이 어떻게 나타나는지를 자세히 설명하고 있다.
정리하면 빅데이터는 선택에 따라 긍정적으로도 사용될 수 있고 악순환의 시작이 될 수도 있다. 저자가 말하는 것처럼 이런 수학 모형들이 다른 이들을 조종하기 위해서가 아닌 도와주는 것을 목표로 설계되고 사용되어야 하는 것이다. 그러나 현실은 그렇지가 않고 무수히 많은 수학 모형들이 가진 자는 더 가지게 만들고 가난한 자는 더 가난하게 만들며 약한 자들이 더 피해를 보게 되는 악순환을 발생시킨다. 마지막으로 좀 길지만 저자의 말을 인용한다.
"WMD는 앞에서 하는 약속과 뒤에서 하는 행동이 철저히 다르다. 앞에서는 효율성과 공정성을 약속하지만 뒤에서는 고등교육을 왜곡하거나 부채를 증가하거나 대량 투옥을 촉발한다. 또한 인생의 모든 중요한 분기점에 가난한 사람들을 곤경에 빠뜨리며, 민주주의를 손상시킨다. 따라서 WMD를 하나씩 무장해제시키는 것은 논리적으로 타당한 해결책이다.
그런데 WMD들은 서로 물리고 물리는 관계라서 무장해제가 쉽지 않다. 예컨대, 가난한 사람들은 신용 상태가 나쁘고, 범죄 발생률이 높은 동네에 거주하며, 자신처럼 가난한 사람들에게 둘러싸여 있다. WMD로 무장한 어두운 세상은 이런 데이터를 입수해, 이들에게 비우량 담보대출이나 영리 학교의 약탈적 광고로 융단폭격을 퍼붓는다. 또한 이들을 체포하기 위해 더 많은 경찰을 배치하고, 더 무겁고 더 긴 형량을 선고한다. 여기서 끝이 아니다. 이들의 사법적 데이터는 다른 WMD 들에 반영되고, 그런 WMD는 이들을 고위험군 혹은 쉬운 표적으로 분류해 일자리를 얻을 기회마저 차단한다. 주택이다 자동차를 담보로 대출받을 때 높은 금리를 부과하는 것은 물론이고 상상할 수 있는 모든 종류의 보험에 가입할 때도 불리한 보험요율을 적용시킨다. 이는 다시 이들의 신용평가등급을 떨어뜨려 죽음의 나선형 모형을 완성한다. 요컨대, WMD의 세상에서 가난은 갈수록 위험해지고 더 많은 비용을 감당해야 하는 꼬리표가 된다."