구글은 검색에 있어서 "직접 조치보다 알고리즘 이용을 원칙으로 하고 있다. "직접 조직한 정보보다 기계 솔루션을 선호"한다면서, "알고리즘은 확장이 가능하기 때문에 기능을 개선하는 경우 한 개가 아닌 수많은 검색 결과 페이지가 개선된다"라고 그 이유를제시한다. 현재 구글은 "웹사이트 약관, 콘텐츠 생산 일시, 위치, 페이지랭크 PageRank 등 200개 이상의 요인을 적용해 이용자가 원하는 것을 순위화해 제공한다"라고 밝히고 있다. 하지만, 이 200여 개가 무엇이며 어떤 가중치가 적용되어 어떤방식으로 작동되고 있는지는 구체적으로 공개돼 있지 않다. 알고리즘에 수많은 요인이 복잡하게 적용되면서 구글 내에서도 시스템 작동을 완전하게 아는 개발자는 드물 정도다. 물론, 자세한 알고리즘의 작동 방식을 구글이 공개한다고 해도 큰효과는 없다. 실시간으로 요인을 수집해 복잡한 수식을 적용해 작동하고 있는 가운데 이용자의 반응에 따라 알고리즘의작동 방식도 순식간에 변하기 때문이다.
표상의 표상으로서 알고리즘화의 또 다른 특성은 이용자들이 알고리즘에 길든다domesticated는 점이다. 이용자들은그들이 선호하는 검색 엔진과 소프트웨어를 주로 이용한다. 새로운 작동 방법을 익히기 어려울 뿐만 아니라, 자신의 이용 신호를 받아 분석하는 알고리즘이 맞춤형 기능을 제공하기 때문이다. 알고리즘이 자신의 감각을 확인해 줄 때 사람들은 이를 단순히 즐긴다. 인간 주체성과 기술의 역할을 연구하는 마크 핸슨Mark Hansen이 제시한 ‘피드-포워드 Feed-
넷플릭스에서 우리는 전체 목록을 확인하는 대신 나에게 어울리는 것만을 추천받고 있다. 알고리즘은 미디어 이용 데이터를 끊임없이 수집한 후 개인의 의사를확인하지 않고 인간에게 가장 효율적이라고 계산된 방식을제시하고 이에 따를 것을 유도한다. 그리고 인간은 그 알고리즘에 길든다. 이러한 길듦의 가장 대표적 사례가 자동차운전을 위한 내비게이션이다. 모르는 길을 가야 할 때 내비게이션의 안내 없이 길을 떠나는 운전자는 많지 않을 것이다. 내비게이션이 최적의 길이라고 안내하지만 사실 우리는그 길이 가장 적합한 길인지를 스스로 판단하지 못한 채 따를 뿐이다. 알고리즘은 ‘편리함‘을 명분으로 우리를 끊임없이 길들인다.
기알고리즘은 소프트웨어화된 미디어 이용 데이터를 끊임없이 수집하며 실시간으로 변화한다. 미디어화에서 미디어는 고정된 형식을 갖지만, 알고리즘화 단계에서 미디어는 이용 데이터에 따라 바뀐다. 변화에 따라 다른 메시지를 전달하지만, 어떻게 생성된 것인지를 알 수는 없다. 내비게이션이 실시간 교통 정보를 수집해 길 안내를 변경할 경우 우리는 변경된 경로만 제시받을 뿐 실시간 교통 정보에 대해서는 알지 못한다. 또한, 알고리즘은 기존 미디어를 끊임없이 분석하여 표상한다. 그 표상은 기존 미디어의 관습을 이어받되 새로운 내용을 만들어 내는 방식으로 이루어진다.
어들은 표상을 표상하는 과정에서 끊임없이 변화하며 새로운내용을 무한히 양산하고, 그 알고리즘에 길들도록 한다. 유튜브 추천 알고리즘이 이끄는 대로 영상을 보다 보면 시간이 쉽게 가는 이유다.
개인의 특성이 범수화된 특성으로 간주되지만, 그 개인은 자신이 어떻게 범주화되는지모른다. 대표적 사례가 은행 대출 금리결정이다. 미국의 한금융 회사는 대출 서류에 자신의 이름을 대문자로 적은 사람과 소문자로 적은 사람의 금리를 다르게 적용했다. 대문자로 이름을 적어 낸 사람들의 대출 금리가 더 높았는데 돈을빌리는 사람들은 그 이유를 알지 못했다. 통계적으로 봤을 때, 대출 서류에 대문자로 서명한 사람들의 연체율이 높았기 때문이다. 자신이 어떤 범주에 포함되는지 모르는 상황에서 특성이 부여된 것이다.
젠더 편향만큼 자동화 알고리즘 결과물의 인종적 편향도 자주 나타난다. 차량 공유 서비스 ‘우버Uber‘의 예약 내역을분석한 연구에 따르면, 예약자가 흑인 이름처럼 보일 때는우버 예약이 취소되는 경우가 백인의 경우보다 두 배 이상 높았으며, 차량을 기다리는 시간도 백인보다 35퍼센트 이상 긴것으로 나타났다. 여성일 때 남성보다 좀 더 오래 차량을 기다려야 하며, 비용도 비싸게 내는 경우가 많았다. 숙박 공유 서비스인 ‘에어비앤비 Airbnb‘의 숙박비를 분석한 연구에서는비슷한 지역, 비슷한 규모의 방이더라도 주인이 흑인이 아닐경우 흑인이 주인인 경우보다 평균적으로 12퍼센트 높게 숙박비가 책정되고 있는 것으로 나타났다
우버와 에어비앤비 모두 최초 설계 당시에는 인종적 요인이 포함되지 않았으나, 이용자들의 데이터가 축적되고 그 축적된 내용이 비용 산출시스템에 반영되면서 결과적으로 인종적 편향을 드러내게 된것이다.
기준은 없다. 다음 장 그림은 2018년 10월 30일 14시경 네이버에서 ‘양진호‘를 검색어로 입력한 뉴스 검색 결과 화면이다. 당일 13시에 뉴스타파는 양진호 회장의 폭행과 관련한 단독기사 세 꼭지를 연달아 발행했다. 하지만, 해당 단독 기사가발행된 지 한 시간여 지난 시점에 검색한 결과, 아래 그림 상단의 빨간 상자 내용처럼 원본 기사 세 꼭지가 해당 기사를 참고해 종합한 다른 기사의 관련 기사로 엮여서 제공되고 있다.
저널리즘 관점에서 기사를 배열했다면 당연히 원본 문서인 뉴스타파 기사들이 상단에 노출되어야 하지만, 자동화된 검색 결과는 다소 이해하기 어렵다. 네이버는 뉴스 검색에클러스터링 기술을 적용하고 있다. 네이버의 클러스터링은기사 본문의 형태소 분석을 통해 기사 간 유사도를 자동으로측정하고 분류하여 유사한 기사끼리 묶어 내는 기술이다. 유사도만으로 각 기사의 중요도를 판단한 결과, 세 꼭지로 나눠쓴 뉴스타파의 원본 기사보다 세 꼭지를 모두 모아 만든 후속 유사기사가 더 중요한기사로 상단에 배치된것이다
기업의 수익이라는 명확한목표가 맞춤형이라는 모호한 측정 개념을 통해 구현되면서발생한 문제라고 할 수 있다. 맞춤형이라고 하지만 사실 그사람에게 정확히 맞추는 것은 굉장히 어렵다. 자동화된 결과물을 이용하는 사람들은 맞춤형이라는 모호한 개념이 그럴듯하기 때문에 받아들인다. 기업은 맞춤형이라는 그럴듯함 속에자신들의 수익 목적을 숨긴다. 맞춤형 자체가 사실 측정이 불가능하거나 모호하기 때문에 자신들의 목적을 숨기기 쉽다.
|