-
-
알고리즘이 지배한다는 착각 - 수학으로 밝혀낸 빅데이터의 진실
데이비드 섬프터 지음, 전대호 옮김 / 해나무 / 2022년 2월
평점 :
데이터 처리와 알고리즘 기술이 융합하며 펼쳐낸 세계는 하나의 거대한 양날의 검과 같다. 모든 도구가 그렇듯이 사용하기에 따라 그것이 선한 결과를 낼 수 도 있고 재앙을 일으킬 수도 있다. 현재 빅데이터를 통해 추출된 유의미한 정보들이 상업적으로 이용되는 경우는 흔히 볼 수 있다. 그리고 공공영역에서도 광범위하게 활용되고 있는 것으로 알고 있다.
정황 증거가 통계학적 증명이라는 후광을 받아 사실인 것처럼 둔갑해도 의심을 사지 않는 시대. 수학이 소문에 합법성을 부여하고, 자의적인 결론을 합리적이거나 합당한 것으로 둔갑시킨다. 부실한 전제와 부정확한 데이터에 기초함에도 알고리즘이 그런 일을 가능하게 하는 것이다.
알고리즘에 대해 쉽게 생각해보자. 어떤 상자가 있다. 데이터를 입력한다. 상자가 그 데이터를 통해 어떤 결과를 도출한다. 그러니까 상자 속에는 데이터를 처리하는 일련의 기능이 있는 것이다. 그 기능, 다시 말해 데이터를 처리하는 과정을 도식화한 것, 혹은 그 개념이 알고리즘이다. 하지만 그 처리 기능이 구체적으로 어떻게 작동하는지 명확하게 알기는 어렵다. 저자는 이것을 “모형 내부에서 어떤 일이 벌어지는지 볼 수 없다”고 표현한다.
알고리즘은 우리를 분류한다. 분류하면 몇 개의 집단으로 나뉜다. 각 집단은 각 집단에 영향을 줄 수 있는 정보나 광고를 접하게 된다. 다시 말해 개인의 세계관에 들어맞는 선전용 정보를 제공받는 것이다. 그런데 이 책에서 지적하는 중요한 내용 가운데 하나는 PCA 기법(주성분 분석 기법)처럼 전통적인 통계학의 회귀 분석 방법이나 인간의 직관적인 판단 등이 최신 과학을 기반으로 한다는 데이터 알고리즘으로 얻은 결론과 큰 차이를 보이지 않는다는 아이러니다.
이 책은 데이터 알고리즘 이슈가 오히려 인간이 이진법으로 세계를, 다시 말해 극단적인 이분법으로 세계를 보고 있다는 특성을 부각시키며, 확률론을 바탕으로 정밀하게 설계된 알고리즘에 휘둘리기에 적합한 종이라는 생각에 고개를 끄덕이게 한다. 알고리즘의 출력법은 이진법이 아니기 때문이다.
이 책은 또한 정치적 이익을 위해 우리의 감정을 조작하는 기술은 결국 경제적 이익과 직결된다는 것을 보여준다. 그래서 더 유혹이 큰 것이다. 알고리즘의 정확도와 오류 가능성을 파고들다보면 알고리즘에 편견이 있다는 것은, 결국 알고리즘의 기능이 누군가의 의도대로 마음껏 활용될 수도 있음을 의미한다.
이것은 또한 현실 사회에서 곧 공정의 문제를 야기한다는 것을 의미한다. 하지만 책에서 언급한 것처럼 논리만 가지고서는 공정을 이뤄낼 수 없다는 것이 수학의 답이다. 즉 편향은 완전히 제거될 수 없으며, 이것을 받아들인 상태에서 더 나은 알고리즘의 활용을 고민해야 한다는 얘기가 된다. 결론적으로 알고리즘이 우리의 삶에 상당한 영향을 끼치는 것은 사실이나 문제의 핵심은 기술이 아니라 그것을 받아들이는 인간의 태도라는 것을 알 수 있다. 개선의 여지가 있다. 아직까지는 말이다.
* 네이버 「디지털감성 e북카페」 카페 이벤트를 통해 출판사로부터 책을 무상으로 제공받아 읽고 쓴 서평입니다.