-
-
대량살상수학무기 - 어떻게 빅데이터는 불평등을 확산하고 민주주의를 위협하는가
캐시 오닐 지음, 김정혜 옮김 / 흐름출판 / 2017년 9월
평점 :
최근 급 부상한 키워드 '빅데이터'.컴퓨터와 인터넷의 등장으로 생산되는 데이터의 양은 해마다 기하급수적으로 증가하였지만 20세기까지는 이를 어떻게 사용해야 하는지에 대해 기술적으로나 기획적으로 미숙한 단계였다. 21세기에 들어와서는 본격적으로, 특히나 미국을 중심으로 한 대형기업의 영리활동추구 툴로서 빅데이터가 사용되기 시작한다. 정확히 말하자면 빅데이터 자체를 활용하는게 아니라빅 데이터를 기반으로 하여 각종 수학 알고리즘을 적용하여 경영 구석구석에 활용하는 것이다. 특정 고객이 매출을 낼 고객인가 아닌가를 확률적으로 예측하여 고객맞춤형 광고를 내보내고, 직원이 어느시간에 근무하는것이 제일 비용절감에 효과적인지 계산하여 근무시간표를 컴퓨터로 자동생성한다. 고객센터로 걸려오는 고객의 전화는 순식간에 데이터를 수집하여 별로 돈이 될 것 같지 않으면 후순위로 돌리고 부촌에서 걸려오는 전화부터 먼저 상담원이 응대한다.
저자는 수학을 전공한 엘리트로 테뉴어 트랙을 밟다가 헤지펀드 회사의 스카웃 제의를 받고 커리어를 전환한다. 어릴적부터 심심하면 인수분해를 하는 식으로 '수'자체에 매료된 삶을 살았지만 실물경제에서 '수'가 어떻게 활용되는지 알고 싶었다 한다. 연봉을 3배로 올린 것도 커리어 전환의 한 이유였을테다. 그렇게 그녀는 헤지펀드사의 '퀀트'로서 시장의 비효율성이 존재하는 곳을 보물찾기하듯 찾아, 그 비효율성이 사라질 때까지(=시장이 균형상태가 될 때까지) 이윤을 내는 일을 하게 된다. 하지만 2008년 세계경제위기가 닥치자 그녀는 금융계가 얼마나 폐쇄적으로 그리고 비합리적으로 돌아가고 있는지 깨닫게 되고 그 후 몇 번의 이직과 커리어 전환을 거치며 미국 사회에서 빅데이터가 불평등의 재생산 기제로서 활용되고 있음을 확인하게 된다. 이 책은 하버드 박사 출신인 그녀가 아주아주 친절하게 고등학생이 읽어도 이해할 수 있을 정도로 쉽게, 빅데이터가 우리의 생각과는 달리 '무결점'한 것도 아니고 '공정'한 것도 아니라는 것을 알려주는 책이다.
책에 나오는 상세한 사례들이 이해를 도와주기 때문에 완독을 강력히 권하며 리뷰작성을 위해 간단히 요약을 해 보자면 1. 빅데이터 자체는 의미가 없기 때문에 데이터를 돌려 의미있는 결과를 뽑아내려면 '알고리즘'이 들어가야 한다. 그런데 이 '알고리즘'을 짜는 것은 결국 인간으로 이 과정에 인간의 편견이나 선입견이 들어가게 된다. 2. 돈이 없고 가난한 이들의 운명은 빅데이터에 따라 갈리게 된다. 가령 예를 들어 대학입학이나 구직과정에서 하위계급출신자들의 지원서는 빅데이터 알고리즘에 따라 합격/불합격이 나뉘게 된다. 이것에 '공정'하다는 인식도 있지만 더 중요한 이유는 이게 더 '저렴'하기 때문이다. (이것이 실제로 공정한지는 뒤에서 논의) 반면 상위계급은 빅데이터의 발전과는 무관하게 자신들만의 인맥을 통해 대인면접 기회를 가지게 된다. 아이비리그의 경우 면접을 통해 합격자를 걸러내고 상류계급은 구인시 지인을 통해 소개받은 젊은이를 인터뷰하여 채용한다. 즉 이력서에 철자법 실수가 있다거나 음주운전 같은 경범죄 기록이 있다고 해도 관대하게 용서받고 넘어갈 기회가 있다. 3. 현재 미국에서 활용되는 많은 빅데이터 알고리즘은 불평등을 재생산하고 있다. 예를 들어 가난한 동네에 사는 청년은 자신의 집 우편번호 때문에 채무를 상환할 가능성이 떨어진다고 판별되어 필요한 대출을 받지 못한다. 적시에 받았더라면 큰 문제 없이 넘어갔을 신용문제가 대출거부로 인해 커지고, 실직같은 더 큰 불행으로 이어질 가능성도 크다. 가난한 동네 출신에게 대출을 거부하는건 일견 타당해 보이기도 하지만 저자는 수학학자로서 '대리 데이터'의 사용에 반대를 표한다. 즉, 실제로 그 청년의 지불능력을 따지지 않고 그 청년이 사는 동네의 빈곤율을 따지는 건 빅데이터를 활용하여 손쉽고 간단하고 '저렴'하게 신용도를 평가하는 것인데 이건 청년 개인의 신용도와는 전혀 상관없는 수치를 가져다 붙이는 것이므로 수학적으로 봤을 때 전혀 정확하지 않다는 것이다. 효율성을 위해 불평등을 재생산 하는 것이 민주주의 사회에서 합리적인 문제해결 방식인가?하는 의문.
이외에 이 책을 읽다 보면 미국의 자본주의가 얼마나 잔인하고 무자비하게 빅데이터를 활용하고 있는지 알 수 있으며 우리가 그런 대기업을 상대하며 '어련히 알아서 하겠지'식으로 순순히 우리의 데이터를 넘겨주는 것이 얼마나 멍청하고 아둔한 짓인지 깨닫게 된다. 사실 데이터를 넘겨주는 것이 우리의 의지가 아닌 경우가 압도적으로 많기는 하다. 대기업의 기술력은 우리가 눈치채지도 못하는 사이에 클릭 한 번이나 전화 한 통으로 수십 수백건의 정보를 빼내어 가기 때문이다. 리뷰의 제목을 '21세기 프롤레타리아들의 필독서'라고 적은 이유는 실제로 빅데이터가 어떻게 활용되고 있는지 알아야 우리가 앞으로 살아갈 미래에 어떻게 대비할 수 있는지 작은 단서라도 찾을 수 있다고 생각했기 때문이다. 빅데이터는 이제 인터넷 여론까지 움직이고 있다. 단순히 매크로 돌려서 가짜 댓글을 만들어내는 수준이 아니라 합법적으로 법망을 뚫고 교묘하게 우리의 투표율을 움직이고 지지후보를 푸쉬하는 것이다. 저자는 회계에 '감사'가 있듯이 빅데이터 알고리즘에도 '감사'가 필요하다고 말한다. 사실 회계감사를 돌려봐야 16억 내고 삼성 물려받는 이 세상 돌아가는 꼴을 보면 알고리즘 감사도 크게 의미가 있을지 회의가 되긴 한다만은...
개인적으로 이 책을 보고 느낀 점이라면. 이 책을 읽기 전까지는 중국이 데이터 생산에 있어서 양으로 압도적이기는 하지만 중국정부의 통제가 있는 한 미국을 누르고 초강대국으로 떠오를 수 있을까? 하는 의문이 있었다. 이 책을 읽고 난 다음에는 거꾸로 중국이 국가의 통제가 있기 때문에 오히려 미국을 누를 수 있을지도 모른다는 생각을 하게 되었다. 이 책의 내용을 따르자면 빅데이터는 미국 하층계급의 삶을 짜낼대로 짜내고 있으며 정부에서는 이 모든 것이 '합법'이기 때문에 별다르게 제재를 할 수 있는 근거가 없다. 반면 중국의 경우 체제유지를 위해서라도 인민들에게 밥을 떠먹여줘야 하는 입장이기에 무조건 자본가들이 하층계급을 착취하는 걸 놔두고 볼 수 없다. 또한 중국정부는 스스로 인민의 모든 데이터를 긁어모으는 '주체'이기도 하다. 정치적으로야 인민의 삶을 감시하겠지만 거시적 국가 발전의 측면에서 특히나 경제적인 측면에서 중국이 이 데이터를 활용한다면 미국의 사기업보다야 더 긍정적인 방향으로 활용하지 않겠는가? 결국 모든 것은 시간이 증명할 것이고 이 책의 저자는 우리가 20세기 초반 참혹했던 석탄광산처럼 빅데이터 무기들 역시 한 시대의 것으로 역사속으로 사라지길 기대하지만 글쎄. 석탄광산에서 죽은 시체는 인간의 눈에 보였지만 빅데이터로 파괴당한 이들의 삶은 가시적으로 보이지 않기에 빅데이터 무기가 사라지는 건 쉽지 않을 듯 하다. 미국이 자랑하는 시장원리가 지금의 오류를 바로잡고 제정신 차리는 것이 빠를지 중국이 이 기회를 놓치지 않고 십억인민 모두 중산층 되어 잘사는 세상을 만드는게 빠를지 우리 세대는 그 결과를 목격하게 될 것이다. 그리고 세상이 변하는 걸 보는 건 흥미로운 일이지만 일단 중요한 건 밥 먹고 내 목숨 부지하는 일이니 이 책을 읽자. 읽고 이 세상에 도처한 위험에 이런 것도 있다는 걸 깨닫자.