나이팅게일 시절의 데이터이용(빅데이터의 첫번째 물결)과 현재의 데이터 열풍과의 차이점은 바로 인터넷의 유무에 있습니다. 수의 이용을 위해 지금도 표준화, 수집, 분석의 과정을 거치지만 인터넷 덕분에 수의 이용이 폭발적으로 일어나고 있습니다. 이러한 데이터의 팽창으로 우리가 할 수 있는 일에 대한 기대도 팽창하고 있는데요, 미국의 비영리 상담 서비스인 크라이시스 텍스트라인은 문자메세지 데이터를 분석하여 자살 위험성이 있는 사람들을 찾아내고, 미국의 비영리단체 레인포레스트 커넥션은 중고 휴대폰으로 데이터를 수집하여 불법 벌목과 밀렵을 퇴치합니다. 또 정책입안자들, 회사중력들, 대중적인 지식인들은 모두 빅데이터로 기후 위기를 해결하고 의료서비스를 개혁하며 굶주림을 근절할 수 있다고 주장합니다. 심지어 대학교 관리자인 루이스 프레스코는 우리의 행동에 관한 모든 정보를 이용하면 우리가 실제로 무엇을 중요시 하는지, 따라서 어떤 정치인을 좋아하는지도 인공지능 시스템을 통해 알아낼 수 있으므로 민주선거를 인공지능 시스템으로 대체할 수 있다고 주장하기도 했습니다.
이처럼 위협적인 빅데이터도 그 근본적인 목적은 소규모 데이터와 같습니다. 그 수로 무엇을 얻고 싶은지가 핵심으로 어떤 알고리즘이든 도덕적 선택이 관여한다는 점을 꼭 알고 적용해야 합니다. 이미 여러나라에서 인간은 신용 등 온갖 측면에 대해서 점수가 매겨지고 있습니다. 신용평가사는 우리가 채무를 제대로 이행할 수 있는지를, 보험회사는 우리가 건강하게 지낼지를, 과세 당국은 우리가 탈세를 저지를지를, 경찰은 우리가 법을 어길지 여부를 계산하려고 하기 때문이고, 이런 계산은 우리의 일상에 영향을 끼치기 때문입니다. 결국 좋거나 나쁜것은 알고리즘이 아니라 이것을 사용하는 방식에 있습니다. 우리의 목표는 진실을 밝혀내기일까 아니면 수익 창출일까? 안전과 자유 중 어느쪽을 우선시 할까? 정의 아니면 효율이냐? 이는 도덕적 딜레마지 통계적 딜레마가 아닙니다. 데이터가 아무리 신뢰할 만하고 인공지능이 아무리 발전하더라도 알고리즘은 결코 객관적이지 않기에, 이를 잊어버리면 프로그래머에게 도덕적 결정을 맡기는 우를 범하게 됩니다.
본문의 일부만을 살펴 보았지만, 숫자가 왜 관심을 받게 되었는지를 시작으로 어떻게 발전해가고 기술의 발전으로 인해 어떤 힘을 가지게 되는지에 대해서도 알게 되었습니다. 아울러 숫자가 주는 의미를 던져주는대로 그대로 이해하는 경우에 받게 되는 부당함이라던지 내가 가지게 될 무지함에 대해서도 가지게 되었으며, 또 상상하지도 못한 분야에서 긍정적인 영향력을 미친다는 것도 알게 되었습니다. 정보의 홍수속에서 진실과 거짓을 가려야 한다는 것을 알고 있었지만, 그 정보속의 숫자는 던져주는 대로 받아 들여왔고 그 역시 진실과 거짓을 가려야 함을 다시한번 되새기기도 했습니다.
숫자의 잘잘못은 숫자 자체가 아닌 숫자를 사용하는 사람에게 있습니다. 이 책을 통해 숫자를 제대로 이해하고 소비하는 노력을 기우리리라 다짐해봅니다.