데이터의 역사 - 인간의 숨겨진 욕망과 권력 관계를 숨김없이 보여주는 데이터에 관한 진실!
크리스 위긴스.매튜 L. 존스 지음, 노태복 옮김 / 씨마스21 / 2024년 10월
평점 :
장바구니담기



-책과 콩나무의 서평단으로 출판사로부터 책을 제공받아 주관적으로 작성한 글입니다-

 

손자 전쟁철학과 사상이 집약된 손자병법에 용간(用間)편의 핵심은 첩보전에서 승리하는 자가 마지막 승자가 된다라고 할 수 있을 것입니다. 2500년전에도 이렇게 정보의 중요성을 통찰하고 있는 손자의 혜안에 놀라움을 감출 수가 없습니다. 현대적인 관점에서 AI 시대에 손자가 다시 환생한다면 승리를 넘어 위태롭지 않기 위해서는 아마도 정보 즉 데이터가 전쟁전략의 핵심에 있지 않을까요? 오늘은 데이터의 역사라는 다소 평범한 책의 제목이지만 내용은 결코 평범하지 않은 무게감있는 책을 읽어보겠습니다.

 

저자인 2명의 교수들은 각각 데이터과학와 역사학에 기반한 데이터과학이라는 학문적 배경을 가지고 있고, 번역자는 과학과 인문의 경계의 책들을 좋아하는 경향이라 소개를 하고 있습니다. 이런 점에서 본다면 책의 전체적인 분위기(색감)는 순수과학적 차원의 데이터 사이언스라기 보다는 학제(inter-disciplinary)적인 차원의 접근이 이루어진 것으로 이해할 수가 있을 것 같습니다.

 

이 책의 전체적인 흐름과 포인트는 데이터의 생산과 분배가 단순한 기술적 문제가 아니라, 정치, 경제, 사회 차원에서 중요한 상호작용을 한다는 문제의식을 가지고 데이터, 진리, 권력이라는 3가지 관심주제를 설정하며, 역사적 접근방법을 통해, 데이터의 계량/수리적 접근의 태동기부터 다양한 적용, 응용의 진화과정을 거치면서 정치, 경제, 사회적 이슈까지 외연적 확대의 화려한 역사를 보여주고 있습니다. 즉 초기 과학적 차원의 데이터가 어떻게 정치경제사회학의 영역으로 들어오게 되었는지 그 시대적 변천사를 통찰하면서, 야기된 문제점(체계적 불평등, 윤리적 문제 등)을 이슈화하고 미래의 나가야 할 방향을 정립하고 있습니다.

 

따라서 책의 가치는 데이터라는 AI시대의 핵심키워드에 대한 과거-현재-미래로 이어지는 스펙트럼에 대한 맥락과 배경을 이해하는 역사적 관점을 통해, 기술과 수리적 차원의 이야기를 정치경제사회적 차원까지 끌어올려 談論化의 장을 열고 더 나아가 미래의 지향적인 방향성을 제시하고 있다는 점이라 생각됩니다.

 

*또 다른 국가의 일: ”데이터 복지정책(Data welfare policy)“의 대두와 방향성

데이터의 역사적 흐름을 볼 때 데이터와 알고리즘 시스템에 관한 이슈는 프라이버시 영역에서 확대되어 공정과 차별, 평등이라는 정치경제사회적 가치의 영역으로 확대되는 트렌드를 보이고 있습니다. 따라서 데이터와 알고리즘 시스템은 공정하다라는 명제에 대해서는 항상 문제의식을 갖고 데이터의 수집단계부터, 그리고 이를 처리하는 알고리즘 시스템의 설계 단계부터 주의를 기울여야 할것입니다. 그래서 잘못 수집된 데이터와 잘못 설계된 알고리즘 시스템은 불평등을 강화하고 차별을 조장하며 더 나아가 민주주의를 위협하는, 개인의 문제를 넘어서 국정과제로의 사회비용(Social cost)을 초래할 수 있다는 가능성 높은 시나리오가 현실로 다가올것임을 예견하고 미리 대비하는 지혜로운 국정운영 역량이 필요해 보입니다. 불행하게도 데이터 권력에 의한 불평등 이슈는 AI 대전환 시대가 고도화 될수록 더 증폭될 잠재적, 현실적 위험성은 더욱 높아보인다고 생각됩니다. 그래서 특히 이를 통제하고 조정하는 국가의 일이 더욱 강조될 수밖에 없는 것이 아닌가 하는 생각을 해봅니다. 그 해결 방향성을 고민해 본다면 데이터의 정치경제사회적 약자에 대한, 즉 데이터에서 소외되고 불평등, 차별받는 국민을 위한 데이터의 민주적 복지 안전망을 구축하는 것입니다. 그래서 이들 사회계층에 대한 불편과 부담을 공공 데이터로 관리하여 사회적 비용을 줄여나가는 것이 AI시대의 새로운 국정 운영의 과제가 될것으로 보여집니다.

 

*국가, 기업, 시민 그리고 권력

저자들은 책에서 데이터 역사의 핵심은 기술과 수학이지만 궁극적으로 그것은 국가, 기업, 시민 간의 불안정한 게임에 관한 이야기이다라고 언급하고 있습니다(p10~11). 결국 데이터의 활용과 적용, 응용에 따른 다양한 사회적 문제가 발생했고 이를 권력의 장(Field of power)‘이라는 상호작용의 관점에서 해결책을 모색하고 있습니다. 이러한 저자들이 이야기하는 불안정한 게임이라는 것은 성숙도라는 차원에서 이해되는 것도 바람직스러워 보입니다. 여기서의 핵심은 이 3부문의 개별 성숙도와 전체적인 차원의 3부문이 고른 성숙도의 동태적인 균형점을 잡고 있는가?하는 것이라 할 수 있습니다.


한국적 상황에서 보자면. 글로벌 경제 불황으로 장기 저성장의 기조에서 기업들은 민주성(참여, 공개, 책임)보다는 생산성(재량, 전문, 성과)에 더 치중할것으로 보이며, 특히 기업윤리의 전략적 우선순위는 아마도 후순위가 될 수밖에 없지 않을까하는 생각을 지울 수가 없습니다. 한국의 정치는 3류라는 이야기 나올 정도의 후진성을 벗어나지 못하고 있으며 성숙도의 결과가 정말 우려스럽기까지 합니다. 경제의 발목을 잡는 것이 정치의 행태가 아닌가 하는 생각이 듭니다. 성숙한 시민의식의 바탕된 시민사회는 민주주의 근간을 이루는 미래자산이라 생각됩니다. 그러나 우리의 현 주소는 아직 초보적인 이익집단 수준을 벗어나지 못하는 체계화되지 못한 모습이 자화상이 아닐른지 모르겠습니다. 결론적으로 보자면 한국의 3부문에 대한 개별적인 성숙도도 문제일뿐만 아니라 그 전체적인 불균형 상황으로 시너지를 내기 어렵다라는 진단을 한다면 지나친 단순화의 오류가 될까요? 안타깝지만 미래경쟁력의 전략자산으로의 3부문의 성숙도는 다가온 AI시대의 주도권 경쟁에서 승리할 수 있을지 장담하기는 어려워 보입니다. 중요한 국가성장 과제로 남겨져야 할 것 같습니다.


*AI 도입시 데이터의 중요성

물론 이 책에서 말하는 데이터란 모든 분야에서 우리를 둘러싸고 있는 데이터 중심의 알고리즘에 기반한 의사결정 시스템의 축약어이다라고 넓게 정의하고 있지만, 좁은 의미로 유용한 자료등 실용(이익을 창출할 수 있는)적인 데이터라 측면에서의 실제 AI의 도입이라는 관점에서 보면 조직내부에 도입목적에 적합한 데이터의 존재 여부가 핵심이슈라고 할 수 있습니다. 또한 전체적인 프로젝트의 70~80% 정도가 고순도의 데이터 정제화에 투입되는 것으로 알고 있습니다. 이렇듯이 데이터는 AI도입의 핵심성공요인이라 할 수 있습니다.

 

빙산의 일각이라는 말이 있습니다. 수면 위로 조그마하게 드러난 AI대전환 시대에는 수면아래의 거대한 데이터라는 빙산을 제대로 볼 수 있는 깊은 통찰이 필요해 보입니다. 그리고 이 데이터의 권력구조인 국가, 기업, 시민에 대한 지속적인 연구가 진행되어야 하고 더 나아가 각 나라의 고유한 성숙도에 따른 맞춤형 전략을 고민해야 할것입니다.


#데이터의 역사 #씨마스21 #크리스 위긴스 매튜 L. 존스 #세계사 #데이터 #기술

#과학 #인공지능 #AI #기계학습 #ChatGTP #데이터 정치경제사회학 #데이터 민주주의

#데이터 복지정책


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo