데이터의 역사 - 인간의 숨겨진 욕망과 권력 관계를 숨김없이 보여주는 데이터에 관한 진실!
크리스 위긴스.매튜 L. 존스 지음, 노태복 옮김 / 씨마스21 / 2024년 10월
평점 :
장바구니담기


* 본 리뷰는 출판사로부터 책을 제공받아 개인의 주관적인 느낌을 기록하였습니다 *



 바야흐로 데이터의 시대이다. 교육현장에서 데이터에 관한 논의가 활발하다. 최근 AIDT 교과서 도입과 관련하여 학습데이터를 어떻게 수집하고 다룰 것인가에 대해 많은 선생님들이 고민하고 고민한 내용을 다양한 연수를 통해 함께 나누고 있다. 올해 교실혁명 연수에서는 수집한 데이터를 한 눈에 알아보기 쉽게 대시보드를 만드는 방법을 함께 공유하였다. 앞으로 각 학교에서 AIDT 교과서를 선정할 때에도 학습 대시보드를 어떻게 구성하였는지, 교육현장에서 유용하게 쓸 수 있는지 면밀하게 살펴보게 될 것이다.



 책 데이터의 역사에서 ' 인간의 숨겨진 욕망과 권력 관계를 숨김없이 보여주는 데이터에 관한 진실 '이라는 부제가 끌렸다. 인류의 역사 속에서 데이터를 어떻게 다루었고 데이터와 관련된 수많은 논쟁을 살펴볼 수 있을 것으로 기대했다. 이 책을 읽고 난 이후에는 데이터를 다루는 방식에 대해서도 생각해 봐야 하며 앞으로 이와 관련된 논의가 활성화되는 것이 무척 중요한 문제가 될 것이라는 생각이 들었다.



하지만 인간 존재의 특징을 그런 기계들이 아무리 평평하게 만든다 하더라도, 인간의 삶을 기계로 처리하는 통계로 변환한다는 것은, 계층화를 정당화하고 확대하기 위해서든 그것에 대항하기 위해서든 간에 상관없이 계층화를 공공연한 것으로 만들 수 있다.

데이터의 역사 , 크리스 위긴스 · 매튜 L. 존스 , 노태복 옮김 , 씨마스21 , p.102



 미국과 유럽, 그 국가들의 식민지에서 정책을 결정할 때 수집된 데이터를 기반으로 판단할 수 있도록 정부를 위해 연구하는 통계학자들은 국민과 기업의 상황을 파악하는 데이터를 수집하고 분석했다. 오늘날에는 설문조사를 통한 자료 수집이 불편하지 않을 만큼 자연스럽게 받아들여지는데 데이터로 변환하는 과정에서 차별을 당연하게 받아들일 수 있게 될 수 있다는 생각이 인상적이었다. " 역사가 알려준 바에 따르면, 그런 주장에 사용된 데이터, 데이터가 이용된 방식, 데이터로부터 내린 추론에 대해 절대적으로 주의할 필요가 있다(p.103) "을 상기하며 통계 자료를 접할 때 주의해야겠다고 다짐했다.



프라이버시보호 연구위원회는 1977년에 이렇게 경고했다. "진정한 위험은 개인 자유의 점진적인 침해가 많은 소규모의 개별적인 기록 보관 시스템들이 자동화되고, 통합되고, 상호연결되면서 발생하는데, 이 세 가지 현상은 단독으로만 보자면 무해하고 이로우며 전적으로 정당하게 보일지 모른다." 규모가 크지 않았다면 위험하지 않았을 데이터베이스가 워낙 커지는 바람에 프라이버시에 미치는 영향이 완전히 달라진 것이다. 네트워킹의 증가가 이런 위험을 강화했는데, 왜냐하면 기록의 이전이 점점 더 매끄러워졌고, 기록들을 서로 연결하는 속도가 증가했으며, 개별 기록과 기록들의 집합을 분석하는 기법들이 발전했기 때문이었다.

데이터의 역사 , 크리스 위긴스 · 매튜 L. 존스 , 노태복 옮김 , 씨마스21 , p.195



 데이터의 자유로운 수집과 교환을 중요하게 생각하는 사람들은 개인정보를 보호하는 것을 경제적 손해와 연결지어 설명하였다. 개인정보 보호를 위해 큰 경제적 비용이 들어가므로 규제를 최소해야한다는 주장은 받아들여져 오늘날에는 많은 데이터가 일상적으로 수집되고 있다. 이 문제를 해결하기 위해 알고리즘 시스템과 데이터 수집의 특성을 재조정하는 기술적인 해결책은 완벽한 답이 될 수 있을까? 캐서린 디그나치오와 로런 클라인은 다음과 같이 썼다. "데이터 윤리만이 아니라 더욱 폭을 넓혀서 데이터 정의에 중점을 둘수록, 과거의 불평등 사례들이 블랙박스화된 알고리즘 속으로 슬며시 섞여들지 않게 방지하는 데 도움이 될 수 있다.(p.302)"


 새로운 기술의 도입과 적용에 앞서서 윤리가 중요하게 다루어져야 하는 까닭이다. 개인의 프라이버시를 보호해야 한다는 주장은 경제의 논리에 의해 힘을 잃게 된다. 개인의 맞춤형 광고를 게시하기 위해 수집되는 정보가 경제적 이익을 가져다주면서 윤리 문제를 해결하기 위한 기업 내부의 노력이 나타났다. 데이터와 알고리즘에 관한 논의를 해결하기 위해 관한 국가, 기업, 자율규제 조직, 시민의 역할을 제시하고 있다. 앞으로의 사회에 미칠 영향력이 큰 문제이기 때문에 관련된 규범을 바르게 이끌어갈 수 있도록 중요하게 다루어야 한다.


 데이터 윤리와 관련하여 현 세태를 비판적으로 바라보는 것에 공감이 갔다. 친구와 이야기를 나누고 집으로 돌아가는 길 SNS를 보면 노출되는 광고가 나누었던 대화를 연상시키거나 내가 인터넷에 검색한 내용이 그대로 반영되는 등 개인정보 수집이 많다는 것이 느껴진다. 이 책의 표현대로 대량 감시를 바탕으로 한 광고는 우리 사회의 필수 요소(p.364)가 아닐 것이다. 수많은 데이터를 어떻게 다루어야 할 것인지에 대하여 가치판단을 통해 데이터 권력 문제를 해결하고 개인의 프라이버시를 보호할 수 있도록 계속 관심을 가져야겠다.


 원래 이 책을 읽으려고 했던 목적인 AI 윤리에 대해서도 함께 생각해 보게 되었다. AI 교육에서 AI 윤리가 무척 강조되고 있는데 어떤 맥락에서 나오게 된 것인지, 본질적인 해결책을 논의해야 할 방향에 대해 살펴볼 수 있었다. 책의 내용은 쉽게 와닿지는 않았지만 생각날 때마다 틈틈이 다시 살펴 보려고 한다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo