이글은 출판사로부터 책을 제공받아 작성한 글입니다.
<데이터의 역사>는 18세기부터 지금까지의 데이터의 역사를 다루며, 그 진리와 권력간의 줄다리기를 다루는 이야기들이 담겨있다.
이책은 1부에서 국정운영을 위한 데이터를 시작으로, 사회개선을 위한 데이터의 사용을 다루며 수리통계학의 발전을 이야기 한다. 2부에서는 제2차세계대전때 암호해독 과정을 다루며, 어떻게 연합군이 승리하게 되었는지를 다루고, 뒤이어 데이터가 국가 권력에서 기업권력으로 그리고 어떻게 '시민권력'의 한 축이 되어가는지를 탐구한다. 그리고 우리가 프라이버시의 중요성을 짚어보고, AI시대로 접어든 현재를 다뤄본다.
마지막 3부에서는 데이터를 지닌 윤리적인 이슈들을 짚어보고 현재와 미래를 어떻게 연결해 나아갈지라를 서술해 나간다.
책속의 인사이트
사회적 문제에 대한 과학적 해답
사회적 문제에는 과학적 답이 필요했다. 사회적 문제는 그것이 무엇이든 모든 문제 중에서 가장 어려운 부류에 속한다. 다시 말해, 사회적 문제는 물리학적인 것이 아니라 생물학적이고 의학적이고 통계학적이다. 그걸 해결하려면 어떤 물리학 또는 생물학 문제보다 훨씬 더 많은 조사가 필요하다.
결국 사회문제 대한 핵심은 통계학이다.
리사 지털먼(Lisa Gitelman)이 언급했듯이, “미가공 데이터란 말은 형용모순이다.” 데이터를 수집하는 모든 과정에서 무엇을 고를지, 어떻게 분류할지, 누구를 포함하고 누구를 배제할지 등은 인간의 선택을 통해 이루어지기 때문이다. 모든 데이터 수집에는 수집하는 측의 인지적 편향과 더불어 해당 정보를 분류하고 저장하고 처리하기 위해 저마다 매우 다른 인프라가 관여한다. 1600년에도 1780년에도 2022년에도 데이터는 발견되는 게 아니라 만들어지는 것이었다. 이런 데이터가 어떻게 힘을 갖게 되었을까? 데이터를 수집, 저장, 분석하는 구조는 어떻게 만들어졌을까