알라딘서재

류재홍님의 서재
  • 모두 거짓말을 한다
  • 세스 스티븐스 다비도위츠
  • 16,920원 (10%940)
  • 2022-11-15
  • : 3,171

흔히 사람들은 사회적 가면(페르소나)를 쓰게 되고, 최대한 타인에게 자신은 점잖고 상식있는 사람으로 비춰지길 원한다.

그러기 때문에 대부분 어느 정도 자신이 노출된 공간에서 인간은 솔직한 척하면서 개인이 가진 가치관이나 생각을 포장하기에 바쁘다. 그것이 무의식적인 행동이라 하더라도 말이다.


따라서, 기존의 데이터 수집 방법들. 전화, 설문지, 면접, 현장 연구 등에 있어서는 분명 그에 따른 장단점도 존재하지만 인간 이면에 숨어있는 무의식적 욕망까지는 도출하지 못했다. 


하지만 인터넷 세상. 특히 구글의 등장과 함께 인간은 완전히 개인적인 공간에서 자신만의 활동을 할 수 있게 됐다. 물론 인터넷으로 대표되는 소셜 미디어나 커뮤니티가 완전한 개인을 표출하지는 않는다.


여기서 중요하게 언급하는 점은, 개인이 구글과 같은 검색 사이트를 이용하여 어떤 '단어나 문장'을 쳐서 검색을 해 봤는가에 따른 데이터를 추출하여, 빅데이터를 만든다는 것이 핵심이다.

이 책에서도 중요하게 언급하지만, 소셜 미디어는 기본적으로 타인에게 자신이 얼마나 멋진 사람으로 비출 수 있는가에 초점을 맞추기 때문에 온갖 포장으로 가득한 세상이다. 이런 SNS는 도리어 인간의 거짓을 더욱 드러내고 이면의 우울감과 불행을 촉발하기도 한다.


커뮤니티 역시 어느 정도는 그 커뮤니티 성향에 맞춰 자신을 표현하고, 소외당하지 않기 위해 노력하는 측면이 있다. 그러나 이 책에서는 조금은 다른 흥미로운 지점을 언급하기도 한다. 즉 정반대 성향의 인물이 그 커뮤니티에는 얼씬도 하지 않을 것 같으면서도 구글 검색 기반을 통해 데이터를 추출한 결과 의외로 극과 극에 해당하는 인물들은 자신들과 상극인 사이트나 커뮤니티에 자주 접속하는 것으로 나타난다는 것이다. 그가 거기에서 본격적인 활동을 하든 말든 간에 말이다. 


이처럼, 이 책은 인간이 완벽하게 감춰진 개인의 욕망을 발산할 수 있는 거의 확실한 통로인 '검색'이란 창. 특히 가장 이용자가 많아 빅데이터를 수집하기 쉬운 '구글 검색'을 이용하여 나타난 인간 이면의 심리를 재밌게 파악하고 있다.


덕분에 우리가 일반적으로 가지는 통념을 많이 깨부수는 책이다.

물론,  읽으면서 우리가 인터넷에 쓴 '검색' 단어가 과연 개인의 숨겨진 본능을 보여주는 확실한 지표일까? 라는 의구심을 만들기도 한다.

왜냐하면, 가끔 우리는 정말 내 가치관과 상관없이 그냥 단순한 호기심 때문에 다소 생뚱맞을 수 있는 검색을 하기도 하기 때문이다.

저자가 빅데이터 전문가이기 때문에 아마 소수의 검색을 통한 통계는 제외하긴 했겠지만, 적지 않은 인간들이 동일한 생각을 단순히 호기심 때문에 일회성으로 검색하기도 한다는 점은 분명 존재하기에, 가끔 이 책에 이러한 성향이 반영되지 않은 것은 아닐까 하는 의문이 들기도 한다.


하지만, 이러한 단순한 의문을 제외하더라도 이 책은 인간이 얼마나 자신을 감추고 거짓말에 능숙한 지를 놀라울 정도로 잘 보여준다.


특히 포르노 사이트 검색 키워드에 따른 결과는 한 때 미국 성문화를 완전히 발칵 뒤짚어 놓았던 《킨제이 보고서》이상의 충격을 전해준다.

나아가 정치적, 인종적, 사회적 견해에 대한 우리의 거짓말도 상당히 적나라하게 그 자료를 제시한다.

덕분에 이 책은 의도가 어찌하든 간에, 내용이 상당히 자극적이며 꽤나 집중해서 파고들기 좋은 서적이다. 


기존에 데이터가 제시할 수 없었던 부분을 구글 검색 기반을 통한 빅데이터로 제시할 수 있다며,  이 책은 앞으로 빅데이터가 얼마나 수많은 연구를 개척할 수 있는 도구로 사용될 수 있을지 그 무궁무진한 가능성을 제시한다. 아니 오히려 저자는 아주 엉뚱한 영역이라 볼 수 있는 부분까지 데이터화 가능한 빅데이터의 기능을 보여주면서 도구적 혁신 측면에서 타 연구자들에게 강하게 제안하는 듯한 느낌마저 든다.


특히 인상적이었던 점은. 빅데이터를 어떻게 활용해야 할 것인가를 설명하는 부분이다. 이 책에서도 언급되는 네이트 실버의《신호와 소음》에서 나타나듯, 수많은 데이터는 핵심적인 내용을 담은 신호일 수 있으나, 거기에는 도리어 더 많은 거짓 데이터들, 즉 엄청난 소음들이 같이 산재해 있다. 

따라서 빅데이터란 결국 수많은 정크 자료들 속에서 유의미한 보석을 찾고 연결짓는 과정이 핵심이다. 아무리 많은 자료를 모아도 유의미한 상관관계를 넘어 분명한 인과관계를 가진 가치있는 지점을 찾지 못한다면 빅데이터는 그 자체로 효율적인 도구가 될 수 없다.


그리고 이 책의 저자는 빅데이터를 통해 가치를 찾을 수 있는 분야에 대해 생각보다 세세하고, 그리고 일반적으론 생각지 못한 부분에서 사고할 수 있는 능력을 잘 짚어냈다.


이렇게만 보면, 이 책은 마치 빅데이터 만능론을 내세우는 수많이 양산된 단순 찬양론 일색의 저작처럼 보일지도 모른다.

저자는 이 점도 잘 유념하고 있다. 덕분에 책 후반부는 전반부에 보여줬던 빅데이터에 무궁무진한 가능성과 달리, 빅데이터가 보여줄 수 있는 분명한 허점들을 보여준다. 가장 객관적인 예시로, '주식'이나 '코인' 시장이 왜 수많은 빅데이터 실험이 있었음에도 결국 실패로 끝났는가를 설명하는 부분이 아마 수많은 독자에게 인상적으로 다가올 것이다.


나아가 빅데이터를 가지고 절대로 해선 안될 것들. 즉, 윤리적 가치나 감시사회에 대한 문제에 대해서도 분명하게 언급하고 넘어가고 있다. 


이처럼 저자는 빅데이터가 보여주는 인간 이면의 충격적인 결과, 빅데이터 연구가 할 수 있는 무궁무진한 가능성, 빅데이터가 가치가 있기 위해 집중하고 연결해야할 지점들을 설명하면서, 빅데이터가 할 수 없는 것들, 그리고 절대로 해선 안될 것들까지 종합적으로 잘 버무려 놓았다.


빅데이터에 관한 다수의 설명서들이 때로는 상당히 머리아프고 접근하기 힘든 서술방식을 채택한다. 또 어떤 책들은 지나치게 낙관적이고, 역으로 지나치게 비판적이기도 하다.

하지만 이 책은 어느 정도 중립 노선을 선택하면서도 빅데이터의 가치를 제대로 표방했다.


무엇보다.. 내용이 참 자극적이고 흥미로운 것들로 가득 차 있어서 일반 독자도 매우 재밌고 집중해서 읽을 수 있다. 이 부분은 저자의 서술 능력 측면에서 칭찬할 만 하다. 


  • 댓글쓰기
  • 좋아요
  • 공유하기
  • 찜하기
로그인 l PC버전 l 전체 메뉴 l 나의 서재