데이터의 역사 - 인간의 숨겨진 욕망과 권력 관계를 숨김없이 보여주는 데이터에 관한 진실!
크리스 위긴스.매튜 L. 존스 지음, 노태복 옮김 / 씨마스21 / 2024년 10월
평점 :
장바구니담기


*** 출판사에서 도서를 제공받아 읽은 후 주관적으로 작성한 서평입니다.





​우리는 AI라는 것을 모르는 상태일 때도 미래의 로봇에 관하여 유토피아적인 이미지보다는 디스토피아적인 이미지를 상상했었다. 지구에 사는 대부분의 사람들이 기억하는 터미네이터가 그 대표적인 산물이다. 하지만 시간이 흐르며 어느 정도 그 이면에 데이터가 존재하고 있음을 이제 우리는 안다. 그럼 이것의 역사와 그것이 우리에게 미치는 영향 그리고 앞으로 나아가야 할 방향에 관하여 상세하게 서술하고 있는 크리스 위긴스, 매튜 L. 존스의 데이터의 역사 속으로 들어가 보자.



크리스 위긴스, 매튜 L. 존스의 데이터의 역사는 목차가 상당히 흥미롭다. 일반적인 역사서처럼 시발점에서 시작하여 현대로 넘어오는 구조가 아니라 독자의 호기심을 최대한 끌어당겨 집중하게 만든 후 역사를 시작하는 구조로 되어 있다. 아마도 이런 구조는 작가들이 이미 일반인이 수많은 기업들이 인터넷을 이용하여 일반인에게 만들어 놓은 문제점을 정확하게 인식하고 있기에 가능했던 것이 아닐까 추측해 본다. 챕터 2로 넘어가면서 본격적인 데이터의 역사가 서술된다.



사실 처음에 데이터라고 불릴만한 것을 만든 이유는 권력자들의 불투명한 제약을 파헤치기 위하여 만들어졌다. 실제로 이것으로 인하여 은행이 인종 차별적인 업무를 꽤 오랫동안 지속해 온 것이 드러나 시정하게 된 계기가 되었다고 한다. 하지만 시간이 흐르면서 오히려 권력 기관들이 일반인을 발가벗기기 시작했다. 이는 꽤 현대적인 이야기이며 시발점이라고 할 수 있는 것은 17세기 잉글랜드에서 실시되었다. 당시 교구 주민의 사망 원인을 기록한 문서가 수치 정보 수집의 초기 사례이다.



이후 18세기로 넘어오며 통계학은 국가와 국가가 소유한 자원에 관한 지식의 관점으로 바뀌었으며 그 내용도 정량적 탐구 방향이나 예측 같은 우리가 흔히 생각하는 통계적 측면이 강조된 학문은 아니었다. 19세기로 넘어오면서 순수한 통계학이 정립되기 시작하였다. 당시 런던 통계 학회에서는 탈곡은 다른 사람이 한다는 '알리스 엑스테레움'이라는 모토를 내걸며 통계학자들은 단지 사실만 모아서 다른 사람이 해석하는 것으로 발전시켜 나갔다.



오늘날의 통계학에 첫발을 내디딜 수 있도록 만든 사람이 아돌프 케틀레인데 이 사람이 바로 우리에게 익숙한 평균을 구한 사람이다. 죽음과 같은 인간의 의지와 무관한 도덕적인 영역을 주로 파헤쳤는데 열심히 파헤치다 보니 평균이 존재한다는 것을 알게 된 케이스이다. 20세기에 들어 맥주 회사 기네스에서 최대의 효율을 낼 수 있는 곡물을 찾기 위하여 조사하기 시작하면서 각각 세 방향으로 연구를 시작하였다. 통계학에 관심이 있으신 분이 이 책을 읽는다면 기네스 맥주를 많이 마셔주고 싶은 마음이 들 정도로 기여도가 상당했다.


알다시피 이런 정보에 대한 연구가 가장 활발했던 시기는 아이러니하게도 2차 세계대전이었다. 독일의 에니그마를 해독하기 위하여 영국에서 리들리 선장의 사냥 모임이라는 비밀 프로젝트를 하였다. 이때 활동한 사람이 전산학의 아버지라고 불리는 앨린 튜링이다. 이후 여기에 미국이 합세를 하였고 나중에 캐나다, 호주, 뉴질랜드가 가세하여 첩보 동맹인 파이브 아이즈가 구성된 후 아직까지 이어지고 있다. 이때의 경험으로 미국은 우리에게 빅테이터가 유행하기도 전에 이미 정보 수집과 알고리즘 및 분석 기법을 제도화했다.



이런 전후 활동이나 21세기에 보여준 경제적 영향으로 과학 쪽에 있던 통계학을 수학의 한 분야로 자리매김하게 되었다. 우리나라의 경우가 조금 재미있어서 검색을 해 보았다. 우리나라의 경우 통계학을 처음 들여온 사람들이 경제학자들이다. 그래서 어떤 대학은 경제학과와 동일 선상에 두고 문과로 규정해 놓았고, 어떤 대학은 미적분 등의 수학이 필수라는 점을 염두에 두고 이과로 분류해 놓았다. 본인이 통계학과를 가고 싶다면 이러한 부분을 미리 인지하고 있으면 도움이 될 것 같다.


책은 현대 사회로 넘어와 인간의 지능 원리를 찾아 인공지능의 탄생과 그로 인한 빅데이터, 신경망, 딥러닝 등을 깊이 있게 다룬다. 3장으로 넘어오면 1장 처음에서 말했던 윤리적인 부분으로 넘어온다. 용어들을 보면 상당히 소름 끼치는데 대표적인 하나만 소개하자면 '인간 실험 대상자'라는 말이 나온다. 점점 뒤로 넘어가면 각 기업들이 돈을 벌기 위하여 우리의 주의력을 어떻게 훔치는지와 그 미흡한 해결책까지 등장하는데 해결책은 앞으로 그 과정이 녹록지 않음을 알 수 있었다.



크리스 위긴스, 매튜 L. 존스의 데이터의 역사를 읽으면서 과연 지금 내 생각이 과연 내 생각일까 하는 생각이 계속 들었다. 정보 수집의 가장 문제는 수집가의 편향이 무조건 실리는 것이다. 이런 예시는 아마 끝도 없이 나열할 수 있다. 표본의 편향, 생존 편향, 상관관계와 인과 관계 오류, 선택적 통계 사용, 작은 표본 크기 오류, 설문조사의 무응답 오류 등 우리 일상에서도 많이 접하는 일들이다. 만약 이런 편향에 따른 결과를 근거 자료를 저명한 대학교수가 들이밀며 강력하게 주장하면 이것에 반기를 들 수 있는 사람이 얼마나 있을까? 



이런 부분에 휩쓸려 타인이 원하는 결과대로 자신의 생각이 쏠리는 것을 극단적으로 말하면 양몰이 개에게 몰이를 당하는 양과 같다는 생각이 든다. 몸도 내 것이고 스스로 생각하여 논리적으로 판단을 한다고 하지만 결과는 전혀 그렇지 않은 세상에 살고 있는 것이 현실이다. 이 책을 읽으며 가장 많이 생각난 것은 디스토피아 소설의 대명사라고 할 수 있는 1984와 화씨 451이 생각났다. 그리고 한동안 서점가를 휩쓸었던 도둑맞은 집중력도.



조금 재미있었던 부분은 신경망에서 딥러닝으로 넘어가 이제 스스로 무엇인가를 할 수 있는 인공지능을 볼 때 죽기 직전까지 컴퓨터 속에 생명체를 만들려고 노력했던 존 폰 노이만이 생각났다. 그가 만약 유령의 존재로 현대의 AI를 본다면 꽤 만족스러워하지 않을까 하면서. 아직 오늘날 용량을 가진 컴퓨터가 나오기 전에 이것을 시도한 그는 진정한 천재인 것 같아 묘하게 존경심이 들었다. 그것을 위해 다른 사람의 연구까지 빼앗은 그였기에 더 상상이 되었다.



아마 오늘 책 소개에서 한 이야기 중 문제점에 관해서는 이미 많은 분이 인지는 하고 있으리라 생각한다. 다만 아직 정보와 스킬이 부족하여 그 위험도를 느끼는 크기가 다를 뿐. 이번 기회에 데이터의 시작부터 발전 과정 그리고 이것이 무기가 되고 하나의 권력으로 자리 잡으며 우리를 위협하는 존재로 자리매김하기까지 어떤 여정을 거쳤는지 알아보는 것도 좋을 것이다. 이 책은 스마트 기기를 사용하는 현대인이라면 누구나 읽어야 하는 책이라고 생각한다. 




#데이터의역사

#크리스위긴스

#매튜L

#씨마스21

#데이터가바꿔놓은권력과사회구조

#데이터에관한진실


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo