위험한 숫자들 - 숫자는 어떻게 진실을 왜곡하는가
사너 블라우 지음, 노태복 옮김 / 더퀘스트 / 2022년 3월
평점 :
장바구니담기






오늘 만나 볼 책은 우리 삶에 너무 큰 영향을 미치고 있는 잘못된 숫자의 영향을 지적하고 그러한 엉터리 숫자의 지배를 끝내고자 하는 수학 전문기자 사너 블라우의 " 위험한 숫자들"입니다.


얼마전 끝난 대선기간 동안 우리는 매일 각종 기관에서 발표하는 대선 후보들의 여론조사 결과를 보았습니다. 그리고 그렇게 만들어진 결과를 놓고 각 방송사는 나름의 전문가들을 불러 또 그 결과를 분석했습니다. 그런데 지역, 성별, 나이, 그리고 조사대상의 숫자가 동일 하지 않은 상태에서 실시 되고 발표되는 결과를 보면서 과연 그 숫자를 얼마나 신뢰할 수 있는지, 결과를 분석하는 각각의 전문가들은 그 결과를 만들어내는 배경에 대해 얼마나 알고 그 숫자를 분석하는지 기간 내내 궁금했고, 사실 그 숫자와 분석에 영향을 받기도 했습니다.

나오는 즉시 비판을 받는 말과 달리 별로 제지를 받지 않지만 그 영향력은 빅데이터나 알고리즘의 힘으로 이미 세상을 지배하고 있는 숫자에 대해서 주목하게 된 계기부터, 숫자를 잘못 사용한 사람들의 이야기, 바른 길로 가기 위한 숫자의 소비방법, 그리고 숫자의 바른 사용방법에 대해 담고 있는 이 책을 통해, 현명하게 숫자를 이해하고 바르게 소비하는 방법을 배우고자 하며, 본문의 일부 내용을 살펴보겠습니다.

  


'우리가 숫자에 열광하게 된 최초의 계기'입니다.

크림전쟁 동안 군 병원의 간호사로 근무한 나이팅게일은 관심의 끈을 놓지 않았던 수를 이용해 군대의 의료활동에서 무엇이 잘못되고 있는지를 850쪽에 달하는 보고서에 작성을 하였습니다. 그녀가 내린 가장 중요한 결론은 많은 군인이 환부 감염이나 전염성 질환과 같은 예방 가능한 질병으로 죽는다는 것으로, 이러한 실상이 글이나 통계수치에 묻혀버리지 않도록 한눈에 파악할 수 있는 도표로 표현을 했습니다. 그녀가 만들어 낸 수치는 정부를 설득했고 군인들은 잘 먹고 씻을 기회가 늘었으며 병영도 깨끗해 질 수 있었습니다. 변화를 일으킨 나이팅게일의 도표는 19세기 역사상 최초로 통계의 광범위 한 사용을 이끌었고, 그 세기에 출현한 국민국가는 더 많은 국민들의 정보를 기록하기에 이릅니다.

수에 대한 관심은 '표준화, 수집, 분석'이라는 세가지 요소로 계속적인 발전을 이루고, 결국 수는 '직감, 오류' 이해관계'라는 세가지 장애물을 무너뜨리게 됩니다.


  요즈음 너무 익숙해진 용어 '빅데이터'와 '알고리즘'입니다.

빅데이터는 Volume(양), Velocity(속도), Variety(다양성), Veracity(진실성)이라는 네가지 V로 정의되고, 방대한 데이터를 다루기 위한 방법이 바로 알고리즘입니다.

나이팅게일 시절의 데이터이용(빅데이터의 첫번째 물결)과 현재의 데이터 열풍과의 차이점은 바로 인터넷의 유무에 있습니다. 수의 이용을 위해 지금도 표준화, 수집, 분석의 과정을 거치지만 인터넷 덕분에 수의 이용이 폭발적으로 일어나고 있습니다. 이러한 데이터의 팽창으로 우리가 할 수 있는 일에 대한 기대도 팽창하고 있는데요, 미국의 비영리 상담 서비스인 크라이시스 텍스트라인은 문자메세지 데이터를 분석하여 자살 위험성이 있는 사람들을 찾아내고, 미국의 비영리단체 레인포레스트 커넥션은 중고 휴대폰으로 데이터를 수집하여 불법 벌목과 밀렵을 퇴치합니다. 또 정책입안자들, 회사중력들, 대중적인 지식인들은 모두 빅데이터로 기후 위기를 해결하고 의료서비스를 개혁하며 굶주림을 근절할 수 있다고 주장합니다. 심지어 대학교 관리자인 루이스 프레스코는 우리의 행동에 관한 모든 정보를 이용하면 우리가 실제로 무엇을 중요시 하는지, 따라서 어떤 정치인을 좋아하는지도 인공지능 시스템을 통해 알아낼 수 있으므로 민주선거를 인공지능 시스템으로 대체할 수 있다고 주장하기도 했습니다.

이처럼 위협적인 빅데이터도 그 근본적인 목적은 소규모 데이터와 같습니다. 그 수로 무엇을 얻고 싶은지가 핵심으로 어떤 알고리즘이든 도덕적 선택이 관여한다는 점을 꼭 알고 적용해야 합니다. 이미 여러나라에서 인간은 신용 등 온갖 측면에 대해서 점수가 매겨지고 있습니다. 신용평가사는 우리가 채무를 제대로 이행할 수 있는지를, 보험회사는 우리가 건강하게 지낼지를, 과세 당국은 우리가 탈세를 저지를지를, 경찰은 우리가 법을 어길지 여부를 계산하려고 하기 때문이고, 이런 계산은 우리의 일상에 영향을 끼치기 때문입니다. 결국 좋거나 나쁜것은 알고리즘이 아니라 이것을 사용하는 방식에 있습니다. 우리의 목표는 진실을 밝혀내기일까 아니면 수익 창출일까? 안전과 자유 중 어느쪽을 우선시 할까? 정의 아니면 효율이냐? 이는 도덕적 딜레마지 통계적 딜레마가 아닙니다. 데이터가 아무리 신뢰할 만하고 인공지능이 아무리 발전하더라도 알고리즘은 결코 객관적이지 않기에, 이를 잊어버리면 프로그래머에게 도덕적 결정을 맡기는 우를 범하게 됩니다.

본문의 일부만을 살펴 보았지만, 숫자가 왜 관심을 받게 되었는지를 시작으로 어떻게 발전해가고 기술의 발전으로 인해 어떤 힘을 가지게 되는지에 대해서도 알게 되었습니다. 아울러 숫자가 주는 의미를 던져주는대로 그대로 이해하는 경우에 받게 되는 부당함이라던지 내가 가지게 될 무지함에 대해서도 가지게 되었으며, 또 상상하지도 못한 분야에서 긍정적인 영향력을 미친다는 것도 알게 되었습니다. 정보의 홍수속에서 진실과 거짓을 가려야 한다는 것을 알고 있었지만, 그 정보속의 숫자는 던져주는 대로 받아 들여왔고 그 역시 진실과 거짓을 가려야 함을 다시한번 되새기기도 했습니다.

숫자의 잘잘못은 숫자 자체가 아닌 숫자를 사용하는 사람에게 있습니다. 이 책을 통해 숫자를 제대로 이해하고 소비하는 노력을 기우리리라 다짐해봅니다.


출판사에서 무상으로 받아 서평을 작성하였습니다.



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo