-
-
알고리즘, 생각을 조종하다 - 데이터는 어떻게 우리의 심리를 설계하는가
산드라 마츠 지음, 안진이 옮김 / 생각의힘 / 2025년 7월
평점 :
우리는 플랫폼 기업에서 제공하는 서비스를 향유하기 위해 그들에게 많은 개인 정보를 제공한다. 물론 우린 동의를 했다. 그 서비스에 가입하기 전, 한국 기업인 경우 한글로 외국 기업인 경우 영어로 엄청나게 많고 긴 약관에 동의를 했는데 사실 읽지도 않는다. 빨리 가입해야 하는 경우가 많고 그걸 하나라도 동의하지 않으면 서비스를 쓰지 못하는 경우가 대부분이며 읽어도 이해하지 못하기 때문이다.
그렇게 그들은 우리의 메시지를 보게 되었고, 내가 어떤 뉴스를 읽고, SNS에서 어떤 것을 공유하고 지켜보고 좋아요를 누르고 차단하는지, 내 신용카드 구매내역을 수집하고, 내 스마트폰 GPS 센서로 내 위치를 추적하고 전국의 CCTV로 내 얼굴 표정과 일상적 만남을 기록하게 되었다. 이를 통해 정부나 기업은 마음만 먹으면 사실상 나의 평범하고 무의미한 활동을 통해 나의 행동에 대한 정보를 해석하고 내가 어떤 사람인지 파악해서 나의 친구나, 가족, 심지어는 배우자보다더 나를 더 잘 파악해서 나의 행동을 예상하고 처방하는 것이 가능한 지경에 이르렀다.
심리학자 요요우는 페이스북의 '좋아요'라는 매우 단순한 반응을 가지고 이를 성격 프로필로 변환하는 일련의 머신러닝을 구축했다. '좋아요'는 매우 단순한 반응이지만 무언가에 대한 개개인의 매우 솔직한 반응이다. 좋아요 10개를 관찰한 머신러닝은 개인의 성격을 직장 동료보다 잘 파악했다. 그리고 65개를 관찰하자 친구보다 잘 파악했으며, 120개를 관찰하자 가족보다 잘 파악했고, 300개를 파악하자 급기야 배우자보다 더 잘 파악하고 말았다.
이처럼 오늘날의 우리는 디지털 기기를 매우 많이 사용하며 무수한 디지털 데이터를 남긴다. 평균적인 사람은 1시간에 약 6GB의 데이터를 생성한다. 그리고 이 데이터들에는 개인의 심리적 특성에 담겨있는데 이를 토대로 사람들의 생각이나 감정, 행동에 영향을 심리타깃팅이 데이터 시대에 막강해질 수 있다. 책은 이런 세태에 대한 강한 경계를 담고 있다.
사람의 성격은 매우 복잡하지만 과학은 이를 단순화한다. 5대 성격 특성으로 개방성과 성실성, 지향성, 우호성, 불안정성이 있다. 그리고 이러한 사람의 성격은 SNS에서 그러내는 사람들의 디지털 흔적을 통해 그대로 드러난다.
2013년 미할 코신스키는 페이스북 좋아요로 사람들의 성별과 연령, 약물사용, 정치이념, 성적지향, 지능, 정치 이념, 성적 지향, 삶의 만족도, 성격 등의 다양한 사회연구학적 및 심리적 특징을 예측 가능하다는 사실을 증명했다.
심리학자 요하네스 아이히슈태트의 ㅇ녀구진은 환자 683명의 페이스북 상태 업데이트의 실제 그들의 의료기록을 조사한 결과 사람들의 페이스북의 경험묘사에 사용한 단어만으로도 72%의 확률로 그가 실제로 우울증인지 아닌지를 정확히 예측할 수 있었다. 72%는 일반적인 설문조사의 정확도로 결코 낮은 수치가 아니다.
그리고 SNS는 개인의 소득도 추정가능하게 한다. 사람은 대부분 자신의 소득을 밝히지 않는다. 하지만 페이스북에서는 그들이 평소 사용하는 단어로 그들의 소득은 약 1만달로 오차 범위 이내로 추정이 가능하다. 고소득층은 대개 휴가, 상당한 금액의 활동(해외 휴가나 파티), 긍정 감정, 미래 지향적 단어를 자주 사용한다. 반면 저소득층은 자기에게 초점은 둔 말투(내가 -이 필요하다, 나는 -을 할 수 있다, 나는 -을 샀다)를 쓰고, 속어를 많이 쓰고, 부정적 감정을 공유하며, 욕설과 이모티콘을 더 많이 사용한다.
인터넷과 SNS의 2010년대부터 사용되어 이미 한 사람의 정체성을 구성할 만한 시간이 되었다. 어떤 단서들은 사람이 의식하지 못하게 남겨진다. 사람은 살면서 나도 모르게 여러 말과 글과 행동, 물건을 남긴다. 하지만 물질 세계에서 그것들은 대개 흔적을 남기지 않고 사라지고 주변 사람들은 웬만해선 그걸 잘 알아채질 못한다. 디지털 세계에선 다르다. 그것들은 영구적으로 남는다. 이런 행동잔여물이 잘 남겨져 있는 곳이 구글 검색, 소비기록, 스마트폰 센서다.
저자는 2020년 오스트리아의 리사라는 여성의 구글 검색 기록만으로 그녀의 10대때의 삶을 재구성했다. 그녀가 어릴 적 삶던 마을을 치밀하게 다시 만들고 그녀가 어릴 때 했던 아르바이트, 고민, 가졌던 병 등을 모두 알아내어 세밀하게 재구성한 다큐 [맞춤 제작]를 구성했다. 주인공인 리사는 배우의 연기를 보다 괴로운 과거의 기억이 떠올라 인터뷰를 중단할 정도였다고 한다.
연구결과 개인의 구매 내역 3가지를 알면 그 사람의 신원이 거의 특정이 가능하다고 한다. 구매 내역은 그의 취향과 습관, 생활 방식과 선호도, 동기를 들여다보는 창이 되기 때문이다.
지금까지 나온 것도 상당하지만 앞으로의 변화를 생각하면 이건 시작에 불과할지도 모른다. 미래에는 관찰장치가 더 강력해지고 분석장치인 인공지능도 더 강력해질 것이기 때문이다. 가까운 미래에는 우리 망막에 스마트렌즈가 붙고 혈류에는 초소형 로봇이 뇌에는 칩이 장착될지 모른다. 그러면 나의 생각과 감정, 행동에 대한 예측은 지금보다 훨씬 더 정교해 질 것이다.
이처럼 인간의 성격은 디지털 흔적에 반영되며 그것을 통해 파악이 가능하다. 그리고 이것은 정치에 이용가능하다. 심리학자 조너선 하이트에 따르면 인간에게는 선천적이고 보편적인 5가지 도덕적 가치가 있다. 돌봄, 공정성, 충실성, 권위, 순수성이다. 그리고 개인의 도덕적 기준은 당연히 그의 정치적 이념과 깊게 관련한다. 따라서 각 정치 집단은 각 개인에 도덕적으로 호소한다. 그리고 만약 그의 도덕적 기준을 알 수 있다면 그의 행동에 영향을 미칠 수 있는데 이를 도덕적 재구성이라 한다. 예를 들어 기후 위기를 막자는 주장은 대개 진보주의자에게 지지를 얻고 보수주의자는 반대한다. 보수주의자는 대개 충실성과 권위, 순수성을 중시하는데 그에게 기후위기를 강조하며 지구의 완벽함과 순수성을 보존하고자 하는 의무를 강조한다면 이와 같은 주장은 그에게서 지지를 이끌어낼 수 있다는 식이다.
사람들은 대개 타인을 설득하면서 다른 사람의 입장이 되어보라고 말하는데 사람은 쉽게 그리되지 못한다. 그렇기에 차라리 그의 입장에서 그의 렌즈에 사안을 맞추어 주는 것이 오히려 설득방법으로 나을 수 있다.
전 세계에는 가짜 뉴스와 기울어진 뉴스가 범람하고 있다. 사람들은 대개 가짜 뉴스에 대한 우려를 많이 하고 있는데 저자는 가짜뉴스보다는 기울어진 뉴스가 훨씬 위험하다고 파악한다. 왜냐하면 기울어진 뉴스가 심리적 타깃팅의 역할을 하는 것이기 때문이다. 기울어진 뉴스는 기본적으로는 사실이지만 특정한 세계관에 맞추어 의도적으로 마사지된 것이기 때문이다.
이처럼 심리 타깃팅은 우리 자신을 반향실에 가두어 가장 위험한 순간을 만들 수 있다. 하지만 인간이 세상을 알아가는 방식을 바꾼다면 진정한 게임 체인저가 될 수 도 있다. 가령 대부분의 플랫폼은 개인의 성향을 파악해 그가 원하는 것만을 보여준다. 때로는 이것은 개인의 경험을 작은 우물안에 가두고 지루하게 만들기도 한다. 그렇다면 그런 기업들이 가끔은 탐험모드를 제공해 전혀 다른 분야의 콘텐츠를 제공하거나 시민으로 올바르게 자라나기 위해 알아야만한 세상의 것들을 제공한다면 어떨까. 그런 것들은 매우 유익할 수 있을 것이다.
그리고 심리 타깃팅으로 인해 개인정보에 대한 통제권의 회복은 중요하다. 많은 사람들은 이미 개인정보의 중요성에 대해 생각하지 못하고 있다. 우리는 개인정보에 대해서 불법적인 것이나 부끄러운 것이 없다면 숨기지 않아도 된다고 생각하는 편이다. 하지만 개인 정보 통제권은 나의 정보가 수집, 사용, 공유되는 방식을 스스로 결정하는 자유다. 나의 정보에 대한 보호가 없으면 정부나 기업, 세력이 그것을 이용해 나의 선택, 판단에 심리 타깃팅을 이용해 어느 정도 영향을 미치는게 가능해지기 때문이다. 그리고 그것은 그것을 모으는 데이터 수집 수단이 더욱 정교하고 많아지고, 통합되고, 또한 분석하는 인공지능이 정교해질 수록 더욱 무서워질 것이고 영향력이 파괴적으로 변모할 것이다. 때문에 향후 나의 삶의 주인이 되거 위해서라도 개인 정보 보호는 더욱 중요해진다.
하지만 데이터 환경의 탐색은 언급한 것처럼 너무 어렵다. 데이터의 수집은 암약리에 이뤄지며 개인은 기업이나 정부가 그걸로 무엇을 하고 얼마나 가치가 있는지 파악하기 어렵다. 그것은 수집한 기업만 알고 있다. 기업은 개인 데이터로 그 필요성을 이해하고 더 나은 상품을 만들고 제 3자에게 팔아 수익을 창출하기도 한다.
그래서 기업의 개인 데이터 수집에 세금을 부과할 필요가 있다. 그러면 기업은 개인의 데이터 수집에 신중을 기하게 된다. 그리고 세금을 넘어설만한 정말 가치있고 필요한 정보만을 한정적으로 수집하게 되 저절로 개인정보가 보호되는 효과가 있다. 그리고 걷은 세금은 정부가 개인 정보 보호 재원으로 사용한다면 이중의 효과를 거둘 수 있다.
그리고 개인 정보 보호 법으로 반독점법의 활용도 가능하다. 물론 이건 저자의 주장으로 현재 대부분의 반 독점법이 사실상 패소하고 있어 현실가능성은 없어 보이긴 하다. 하여튼 저자의 논지를 따르면 구글 같은 플랫폼 기업은 거의 모든 데이터를 수집하고 있다. 이는 그들이 많은 부분을 독점하기에 가능한데 반독점법을 통해 그 부분들이 모두 떨어져 나간담녀 수집된 데이터들도 각 개별 기업으로 떨어져나가 데이터들이 모두 흩어져 그 위험성이 분산되는 것이다.
마지막 데이터 보호 방안은 데이터 협동조합이다. 그것은 소수의 기업이 우리의 데이터를 통제하고 이익을 얻는 대신, 우리의 데이터를 누구와 공유할지 우리가 직접 결정하고 이익도 조합원이 누리는 것이다. 그게 가능한 이유는 데이터 협동조합에서는 데이터 소유자가 조합원이고 신탁에 대한 책임도 조합이 지기 때문이다. 즉, 데이터 협동조합은 데이터에 대한 책무와 책임을 개인이 지기 어렵기에 이를 조금 더 크고 이익에 집중하지 않는 협동조합에 맡기는 형태다. 데이터 협동조합은 조합원에게 가장 큰 이익에 되도록 할 법적 의무가 있다.