-
-
데이터의 역사 - 인간의 숨겨진 욕망과 권력 관계를 숨김없이 보여주는 데이터에 관한 진실!
크리스 위긴스.매튜 L. 존스 지음, 노태복 옮김 / 씨마스21 / 2024년 10월
평점 :
데이터, 데이터를 많이 가진 집단이 권력을 가지게 된다에 많은 사람들이 동의할겁니다. 페이스북의 개인정보노출사건은 전세계에 큰 파장을 주었습니다. 저자는 이 사건의 주인공을 불손한CEO라고 표현합니다. 이제는 권력이 되어버린 데이터가 어떤 역사를 가졌는지 궁금해집니다. 그래서 <데이터의 역사>는 18세기말부터 현대 알고리즘시대까지의 데이터의 경쟁과 한계,편견,권력, 갈등 등을 다룹니다. 데이터의 탄생과 진화 그리고 현재의 권력까지 다룹니다. 이제는 우리와 떼어낼수없는 데이터, 어떻게 인류에 도움이 되도록 통제할것인지 논의할 때가 된 듯합니다.
저자는 크리스 위긴스 컴럼비아대 데이터과학연구소 부교수입니다. 컬럼비아대 학사, 프린스턴대 박사를 했습니다. 공저자 매튜 존스은 프린스턴대 역사학 교수입니다. 케임브리지대 과학기술사 석사, 하버드대 박사를 하신 석학이십니다. 2017년부터 두저자가 같이 데이터:과거,현재, 미래라는 강의를 하고 있다고 합니다.
서두에서 페이스북의 개인정보유출에 관해 말했듯 많은 구성원들이 데이터권력들의 윤리성에 관심이 커졌습니다. 이는 1960년대이래 데이터수집과 저장에 대한 프라이버시 침해에 대한 경고를 해왔습니다. 나이팅게일은 크림전쟁당시 로즈다이어그램을 그려서 병사들의 사망원인을 밝혔습니다. 이 통계는 아돌프 케틀레의 영향을 받았다고 합니다. 18세기 유럽의 지배자들은 전쟁,세금, 생명과 죽음에 관심이 많았다고 합니다. 이 모든 게 통계와 숫자가 필요한 분야일겁니다. 이 요소들에 전환점을 준 것은 케틀레의 평균개념입니다. 그래서 만들어진 것이 '개인적 차이의 과학'이라고 합니다. 특히 전쟁을 거치면서 데이터를 수집하고 분석하면서 통계학이 사용됩니다.
전쟁은 많은 것을 파괴하지만 발전하는 것도 있습니다. 통계학이죠. 인공지능에서 유명한 튜링은 세계최고 계산력으로 군사적 응용과제를 연구합니다. 대표적인 것이 독일이 사용하는 암호를 해독하는 일이었습니다. 베이지안방법도 이 암호해독때문에 나왔다고 합니다. 전쟁후 거대한 규모의 컴퓨터가 발명되고 본격적으로 데이터가 비즈니스가 되기 시작합니다. 빅데이터가 쌓이기 시작하면서 가치가 발행하는 겁니다. 그것이 비즈니스로 됩니다. 데이터의 진화에서 인공지능의 발전사와도 겹치는 것은 당연할 겁니다.
저자는 데이터의 권력화에 대해 생각을 많이 합니다. 기업권력, 국가권력, 시민권력 등이 등장합니다. 기업권력은 우리가 너무도 잘알고 있는 빅테크기업들이죠. 페이스북은 벌써 개인데이터유출로 큰 곤욕을 치루었고요. 인공지능의 개발은 새로운 경쟁력을 만들어가고 있죠. OpenCV의 LLM이나 엔트로피의 LLM, 구글의 LLM등이 데이터를 학습시켜 새로운 지능을 만들고 있습니다. 이 부분에 규제를 정부에서는 논의를 하고 있죠. 국가권력은 기업권력의 규제를 하지만 규제를 풀어주는 역할을 하기도 합니다. 시민권력은 사적권력을 말하는데 이는 상장회사에 대한 주주행동주의같은 걸 말합니다. 이는 집단행동으로 많이 표출이 됩니다.
데이터는 이제 윤리와 뗄수없는 관계가 되어 버렸습니다. 데이터를 기반으로 학습한 인공지능이 인간을 버릴지도 모르는 요소도 있고, 개인정보를 노출시켜 개인에게 심대한 영향을 미칠수도 있습니다. 이제 데이터는 우리의 삶에 큰영향을 미치는 요소가 되었습니다. 물론 아직까지는 인간의 생존을 넘는 데이터의 시도는 발견되고 있지 않습니다. 하지만 데이터의 위협이 인간의 목에 찬 느낌은 무엇일까요. 인터넷이 양극화를 불렀다는 전문가도 있지만 생각보다 인터넷은 싸게 접근할 수있게 우리 옆에 존재합니다. 데이터는 앞으로 어떨까요. 인간을 버릴까요. 함께 공존할까요. 인간의 노력에 달려있을 겁니다.
본 도서는 리뷰어스클럽으로부터 무상으로 제공받아 주관적인 리뷰를 했습니다.