모두 거짓말을 한다 - 구글 트렌드로 밝혀낸 충격적인 인간의 욕망, 개정판
세스 스티븐스 다비도위츠 지음, 이영래 옮김 / 더퀘스트 / 2022년 11월
평점 :
장바구니담기


도발적인 제목을 가진 책이지만 사실 제목보다는 '구글 트렌드로 밝혀낸 충격적인 인간의 욕망'이라는 부제가 책 내용을 더 잘 말해준다.

구글에서 데이터 과학자로 재직한 경험이 있는 경제학자인 저자가 빅데이터에 대한 재미난 이야기를 들려준다.

저자는 기존의 학술 연구를 위한 기초 데이터 확보용 설문조사나 인터뷰 등의 방법에서 상당수의 사람들이 거짓으로 답변한다는 것을 언급한다.

이를 보완하기 위해 설문의 타당성이나 신뢰성을 확보하기 위한 여러 방법들이 개발되고 있지만 응답자가 거짓으로 답변하는 것을 근본적으로 막을 수 있는 방법은 없다. (저자의 표현을 빌면 진실을 말할 '유인'이 없다.)

하지만 저자는 사람들이 구글에 검색을 할 때에는 거짓이 아닌 자신의 평소 가치관을 고스란히 드러낼 수밖에 없다는 사실을 알아냈다.

따라서 구글 사용자들의 검색 기록이라는 방대한 양의 빅데이터를 분석하면 사회적으로 유용한 시각들을 얻을 수 있다는 것이 책의 핵심이다.

빅데이터를 활용한 분석 결과로 야구 선수의 미래 예측부터 사람들의 성적 취향에 이르기까지 상당히 많은 사례가 등장한다.

그중에서도 개인적으로 가장 흥미로웠고 충격적인 사실은 언론이 편향성을 갖는 이유를 분석한 글이었다.

흔히들 언론사의 소유주나 편집장 등 정치적 견해를 밀어붙일 수 있는 계층의 입맛에 따라 특정 관점을 제시해 해당 언론에 노출되는 대중들의 정치적 편향성을 일정 부분 이끈다고 생각한다. (나도 그렇게 생각했다.)

하지만 이 책에서 분석한 바에 따르면 언론사의 정치적 성향은 소유주나 편집장에 따라 나뉘는 것이 아니라 해당 지역에 어느 당이 우세한지에 따라 결정된다.

결국 독자가 원하는 말을 해주는 방향으로, 즉 굉장히 자본주의적인 방향으로 움직이는 것에 가깝다는 것이다.

많은 사람들, 특히 마르크스주의자들은 대중에게 영향을 주려는 기업이나 부자들이

미국의 저널리즘을 지배해서 사람들에게 그들의 정치적 견해를 강요한다고 생각했다.

하지만 겐츠코프와 셔피로의 논문은 소유주의 두드러진 동기는 그것이 아니라고 말한다.

소유주는 대중에게 그들이 원하는 것을 줘서 더 큰 부를 쌓고자 한다. - 중략 -

거대한 음모 따위는 없다. 그저 자본주의가 존재할 뿐.

(pg 127-128)

여기서 중요한 것은 빅데이터를 분석하면 일정한 수준의 경향성을 포착하기는 쉽지만, 이것이 곧 명확한 인과관계를 보여주는 것은 아니라는 점이다.

빅데이터 활용의 가장 유명한 예시 중 하나인 허리케인과 딸기맛 팝타르트 사례에서도 보듯이 허리케인이 올 때 사람들이 왜 딸기맛 군것질거리를 더 많이 구매하는지 그 이유를 빅데이터 자체에서 찾을 수는 없다.

데이터는 단지 그런 경향이 있다는 것을 말해줄 뿐이고 기업에서는 이를 활용해 수익을 내면 그만이기 때문이다.

이처럼 당신의 목표가 미래를 예측하는 것이라면 당신의 모델이

어떻게 좋은 효과를 내는지 정확한 이유를 너무 궁금해할 필요는 없다.

정확한 수치만 얻으면 그만이다.

(pg 102)

하지만 저자는 빅데이터가 주는 명확한 장점이 있고, 빅데이터의 활용으로 사회과학 분야에서 획기적인 연구활동이 가능해지리라 보고 있다.

물론 빅데이터가 기존의 연구 방법론들을 모두 대체할 것이라 주장하는 것은 아니다.

다만 데이터 취합에 있어서 속도와 비용의 절감은 물론이고 객관적이고 풍부한 데이터를 통해 보다 명확한 상관관계를 찾아내며 이를 객관적으로 증명할 수 있다는 장점은 사회과학을 보다 '과학적'인 활동으로 만들어 줄 것이라 말한다.

구글 검색 데이터나 인터넷에 있는 다른 진실의 샘은

이전에는 볼 수 없던 인간 마음의 가장 어두운 구석을 보여준다.

우리는 이 어둠을 마주하기 어려울 때도 있다.

하지만 진실은 원동력이 될 수도 있다.

우리는 어둠과 싸우는 데 데이터를 이용할 수 있다.

세상의 문제에 관한 풍부한 데이터를 수집하는 것은

문제를 고치는 방향으로 내딛는 첫걸음이다.

(pg 205)

나는 빅데이터가 폭로하는 사실들을 바탕으로 하는 혁명이 일어나리라고 내다본다.

그렇다고 어떤 문제에든 단순히 데이터만 갖다 대면 된다는 의미는 아니다.

빅데이터는 인간이 세상을 이해하기 위해 수천 년 동안 개발해온 다른 모든 방법의

필요성을 없애지 않는다. 그것들은 서로를 보완한다.

(pg 315)

다만 저자가 구글 출신이기에, 그리고 자신이 데이터 과학자이기 때문에 빅데이터 활용을 장밋빛으로만 보고 있는 것은 사실이다.

물론 저자도 빅데이터의 활용에서 경계해야 할 개인정보의 무분별한 활용과 데이터 소유 주체의 권력 남용 문제를 언급하고 있기는 하다.

하지만 일반 대중들이 갖는 빅데이터의 무서운 점(내 인터넷 사용 활동의 모든 부분이 어딘가에 기록되고 있고 이를 기업의 수익 활동의 일환으로 얼마든지 사용할 수 있다는 점)을 상쇄할 정도로 언급하지는 않았다.

다시 말해 인터넷상의 데이터는 기업들에게 어떤 고객을 피하고

어떤 고객을 착취할지 알려준다.

또한 고객들에게 반드시 피해야 할 기업이 어디이고,

어떤 기업이 그들을 착취하려 하는지 알려준다.

빅데이터는 지금까지 소비자와 기업 간의 싸움에서 양쪽 모두를 도와왔다.

우리는 그것이 공평한 싸움이 되도록 해야 한다.

(pg 328)

저자가 위와 같이 주장하고 있기는 하지만 돈의 이동 방향을 보면 빅데이터가 누구의 편이기가 쉬울지 예측하는 것은 그리 어렵지 않다.

그리고 실제로 빅데이터 활용이 개별 소비자들에게 어떤 이익을 가져다주는지(물론 인터넷에서 쇼핑할 때 원하는 상품이 더 빠르게 등장할 확률이 높아지기는 했지만)는 그리 체감할 정도가 아니지만 빅데이터를 활용한 기업들이 벌어들이는 돈은 우리의 상식 수준을 아득히 넘어선다는 점만 보아도 그렇다.

비록 구글 출신이어서 구글에 편향된 시각으로 집필될 수밖에 없다는 태생적인(?) 한계가 있긴 하지만 책 자체는 매우 재미있다. (그리고 구글이 우리를 감시하고 있다는 사실은 이미 공공연한 사실이기에 이제는 그냥 그러려니 해야 한다.)

등장하는 사례들도 하나같이 흥미롭고 저자의 문체도 상당히 재치있다.

데이터 과학자다운 결말도 재미있었다.

따라서 나는 이 책을 적절한 방법으로 끝맺을 것이다.

데이터에 따라서, 사람들이 하는 말이 아니라 사람들이 실제로 하는 행동에 따라서 말이다. 나는 친구들과 맥주를 한잔하고 이 망할 결론을 그만 쓸 것이다.

빅데이터가 말하길 여기까지 읽고 있는 사람은 극히 소수니까.

(pg 349)

빅데이터에 따르면 경제학자들의 저서를 처음부터 끝까지 읽는 사람들의 비율은 7%가 넘지 않는다고 한다.

저자에 따르면 나는 굉장한 소수인 셈이다.

빅데이터의 맛을 알게 된 기업들은 데이터가 곧 돈이라는 사실을 알게 되었다.

자본주의 사회인 이상 돈이 있는 곳에 인재가 몰리게 마련이다.

미래를 대비함에 있어서도 앞으로 꽤 유망한 분야가 될 것이라는 점에도 틀림이 없을 것 같다.

살짝 두꺼워 보이지만 내용이 그리 어렵지는 않기 때문에 부담스럽지 않게 읽을 수 있는 책이므로 빅데이터에 관심이 있다면 일독을 권하고 싶은 책이었다.



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo