데이터의 역사 - 인간의 숨겨진 욕망과 권력 관계를 숨김없이 보여주는 데이터에 관한 진실!
크리스 위긴스.매튜 L. 존스 지음, 노태복 옮김 / 씨마스21 / 2024년 10월
평점 :
장바구니담기


<출판사에서 보내준 책을 읽고 쓴 리뷰입니다>


데이터, 현대사회 이해의 열쇠


데이터 과학자 크리스 위킨스와 매튜 L. 존슨이 쓴 이 책<데이터의 역사>은 통계학의 등장에서 AI의 탄생까지 데이터가 바꿔놓은 권력과 사회구조를 톺아본다. 어떤 목적으로 데이터를 이용했는지, 그리고 통계의 의미가 무엇인지, 이것이 어떻게 권력이 되는지, 이른바 데이터의 역할의 양면성을 들여보고 있다. 


데이터의 위력을 보여주는 유명한 나이팅게일의 일화, 1853~1856의 크름전쟁중 슈코더르 야전병원에서 일하며 전, 후방 환자 중 후방 환자들이 전방보다 더 많이 죽는다는 사실을 발견한다. 데이터를 모아 원인 추적 끝에, 위생문제였음을 알아내고 군대 지휘관들을 설득, 환경개선으로 사망률을 떨어뜨렸다는 것. 1954년의 데릴 허프 책<새빨간 거짓말, 통계>(더불어책, 2004) 은 통계로 사기 치는 것을 발견하는 방법을, 이와 같은 맥락의 수학자 앙투안 울루 가르시아와 작가 티에리 모제네는 <숫자를 사용한 조작의 역사>(북스힐, 2023)에서 숫자, 가짜뉴스 등을 다룬다. 


영국 빅토리아 여왕의 총리였던 디즈레일리는 거짓말에는 세 종류가 있는데, 거짓말, 지독한 거짓말, 그리고 통계가 있다고, 볼테르 역시 조작되거나 잘못 해석되지 않는다는 조건에서만 숫자가 권력을 행사하는 데 도움을 줄 수 있다고 했으니, 때때로 대의를 모두를 위한 선량한 거짓말 또는 사기에 동원되는 숫자, 신문 기사에 나오는 숫자, 편집의 마술을 부리면, 나쁜 것도 형편없는 것도 긍정적으로 우수한 것으로 탈바꿈하니, 과학에서 통계나 숫자를 가지고 사기 치는 것도 흔한 일이다. 한편, 데이터는 불평등의 정당성을 부여하는 데 사용되기도 한다. 인종차별주의가 당연하다는 논리로까지 확대되기도 했다. 이 책은 통계는 어떻게 개인과 사회의 의사결정을 조종하는가를 보여준다.


이 책은 3부 13장에 걸쳐 이런 데이터 역사, 즉 인간의 숨겨진 욕망과 권력 관계를 보여주는 데이터에 관한 진실을 밝힌다. 1부에서는 데이터의 탄생이란 제목으로 권력이 된 데이터의 경고를, 숫자로 정의되는 사회와 사회적 문제에 대한 과학적 해답, 즉 수리통계학의 탄생배경을 살핀다. 2부는 진화하는 데이터로 2차 대전 때 암호해독을 위해 데이터를 군사적으로 적용하는 데서 출발한 디지털 연산의 탄생과 종전 후, 기업과 기술 분야에 데이터를 적용한 사례를, 3부 권력이 된 데이터에서는 기업과 국가, 시민 권력에 중요한 경쟁 사안인 데이터를 둘러싼 윤리전쟁, 주의력 경제탄생, 해결지상주의를 넘어 새로운 통합 가능성을 살펴본다.


인터넷, 빅데이터 시대에 비판적으로 검토해야 할 것들


대규모 검색 데이터가 더 나은 도구, 서비스 공익을 창출하는지?, 아니면 사생활 침해와 공격적 마케팅에 새로운 방식을 가져오는지?, 그리고 데이터 분석 덕분에 온라인 공동체와 정치적 운동을 더 잘 이해하게 되는지?, 아니면 그런 분석이 시위자들을 색출하고 언론을 억압하는 데 사용되는지?, 다량의 데이터가 인간의 의사소통과 문화를 연구하는 방식을 변화시키거나 연구할 사안의 범위를 축소하고 ‘연구’의미 자체를 변화시키는지? (옥스퍼드에서 열린 한 심포지엄에서 다나 보이드, 게이트 크로퍼드는 ‘빅데이터 시대가 시작됐다’라고 주장, 사회의 더 비판적 사고를 촉구한다고, 23쪽)


데이터는 어떻게 이용되는가?


사람들을 데이터의 흐름으로 대체하여, 효과적인 쇼핑객, 유권자, 노동자로 만들어 어떤 목적을 달성하려는 경향이 있다. 성공을 익명의 점수형태로, 데이터의 영향을 받은 사람들이 추상적인 비트로 이런 경향은 강해지고 정당화하기 쉬워진다는 수학자 캐시오닐의 지적처럼, 알고리즘 시스템들은 자동화된 판단으로 전례 없는 속도와 규모로 예전의 체계적인 불평등을 쉽게 재생산했다. 


데이터가 만든 인종차별, 인도의 카스트 계급과 지능검사 등


새로운 과학은 궁극적으로 사회질서를 크게 바꾸지는 못하더라도 사회질서의 개념적 토대를 뒤흔들어놓을 수는 있다. 기존 질서를 붕괴시키는 급진적인 기술적 변화가 오히려 종종 기존의 불평등을 어떻게 강화하는가, 우생학자들이 지지하는 정책의 영향력은 크지 않다고 할지라도 협소한 계급전망을 사회적 전체의 관심을 대변한다고 주장하는 생체의학적 개념들이 변화시켰기 때문에 영국에서는 계급에 관한 우려, 미국에서는 인종이 중요하게 대두됐고, 독일에서는 나치의 인종청소 정책으로 이어졌다. 인간을 인종으로 구분한다는 자체가 별로 신빙성 없는 것이다. 인도의 카스트 계급을 연구했던 학자들은 데이터 과학을 이용해 각 계급과 종족 사이의 분명한 차이를 발견했지만, 수치적 차이에 내재한 한계-특히 지능을 이용하여 선천적 위계질서를 정당화하지 않았다-를 인식하고 더 발전하려면 종족과 카스트의 사회적 문화적 역사를 고려할 필요(인종과 계급 사이의 차이 원인)가 있다고, 이런 민속학적 증거 없이는 데이터 중심 과학은 큰 곤경에 처하게 될 것이라고,


AI 시대, 정보 자본주의 시대의 시민 권력


AI 시대, 대중은 사용자이지만 어떤 의미로든 데이터 훈련에 동원되고, 관여된 공짜 노동의 제공자로 이중적 역할을 한다. 일반적으로 기업에 이익을 가져다주고, 개인정보까지 제공하는 말 그대로 갇힌 사람들이다. 그러기에 이들이 제공하는 서비스의 편리를 즐기면서도 기업과 국가에 시민으로서 권리를 주장하지 못하게 됨으로써, 기업들이 초래할 민주적 과정의 가능성을 훼손할지도 모른다는 우려를 낳게 했다. 이런 정보 자본주의는 우리의 개인적 주권은 물론 평등과 자율 능력까지 위협하기에. 데이터와 민주주의 문제들이 우리 관심사의 핵심이 놓여야 한다. 모든 수준의 거버넌스가 제대로 작동하지 않으면 정의실현이 아닌 불평등의 심화로 이어질 것이라는 전망이다.


이 책에 등장하는 광범위한 참고문헌들 기술결정론을 비롯하여 정치학, 법학, 실험심리학에 이르기까지 통계, 데이터, 정치 권력, 기업 권력, 시민 권력의 작용과 역할의 관계들을 깊이 있게 관찰하고 있다. 책 제목 그래도 데이터의 역사는 통계에서 AI 시대까지 어떤 식으로 사회변화에 관여했는지를 일목요연하게 보여준다. 



댓글(0) 먼댓글(0) 좋아요(2)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo