모두 거짓말을 한다 - 구글 트렌드로 밝혀낸 충격적인 인간의 욕망, 개정판
세스 스티븐스 다비도위츠 지음, 이영래 옮김 / 더퀘스트 / 2022년 11월
평점 :
장바구니담기


아마 빅데이터나 인공지능 교육을 한번이라도 받으셨으면 구글트랜드이야기는 듣게 됩니다. 트럼프와 힐러리와의 대통령선거에서 구글트랜드의 예측결과가 트럼프당선을 제대로 예측했다고 유명해졌죠. 그래서 저도 몇번 구글트랜드에 접속해서 키워드 사용량을 검색해보기도 했지만 그렇구나 이런 통계량이 나오는구나만 생각했지 실제 어떻게 활용할지는 의문이었는데 <모두 거짓말을 한다>를 통해 구글검색을 통해 나타나는 구글트랜드를 어떻게 이용할지 본질적 의미와 활용법을 생각하게 해줍니다.

저자 세스 스티븐스 다비도위츠는 82년생으로 미국 데이터 과학자이자 경제학자, 저술가입니다. 그는 유대인가정에서 성장했고 스텐포드대 철학학사, 하버드대 경제학박사를 받았습니다. 구글검색에 대한 연구발표로 구글에 입사해서 데이터과학자로 근무했습니다. 이 책의 후속작으로 <데이터는 어떻게 인생의 무기가 되는가>를 출간했습니다.

저자는 본인을 인터넷 데이터 전문가라고 합니다. '매일같이 사람들이 웹을 돌아다니면서 남기는 디지털 발자국을 뒤좇는다'라고 합니다. 이러게 데이터 전문가가 된데에는 구글트랜드가 큰 영향을 주었습니다. 구글은 검색엔진이죠. 사람들이 무엇을 검색하는지 노출되지 않았습니다. 그것을 알게 해준것이 구글트랜드입니다. 사람들이 구글을 통해 검색하는 내용이 바로 데이터인겁니다. 여기서 중요한 것은 사람들이 설문조사나 대화중에 거짓말을 한다는 겁니다. 정치적인면이나 성적인 측면 윤리적인 입장 등에서 더욱 심각하게 본심을 숨기고 과장이나 축소를 쉽게 합니다. 하지만 인터넷 검색에서는 아닙니다. 자신의 궁금증, 자신이 관심분야를 가감없이 들어냅니다. 저자는 2012년 오바마 경선결과에서 인종차별적 검색이 선거에 영향을 준것을 확인했습니다.이로인해 구글에 입사하고 전재무부장관 래리서머스도 만납니다. 이러한 유익한 결론을 얻기위해서는 '적절한 질문'이 중요하다고 합니다. 사람들의 목소리를 듣는 데이터에서 논리적으로 거짓이 들어갈 확율이 확실이 적은 것이 구글검색이 탁월합니다. 이런 이유로 '디지털 자백약'이라도 부릅니다. 구글링을 하면서 거짓말로 검색할 이유는 없죠.

구글검색으로 한때 독감의 유행을 가장 먼저 인지한다고 발표한적이 있죠. 하지만 이는 과거 데이터와의 오류가 있을 수 있다고 합니다. 오류를 방지하는 방법으로 유명하지 않는 분야로 들어가라고 합니다. 그리고 모델에 신경쓰지 말라는 조언도 명심할 필요가 있습니다. 예측만 정확하면 된다고 합니다. 요즘 빅데이터나 인공지능을 공부하는 사람들이 많습니다. 대부분 기술로만 접근을 하는데 데이터의 의미를 분석을 제대로 못한다면 데이터분석의 의미는 반감될 수밖에 없습니다. 이 책은 텍스트, 사진데이터 등의 역사와 의미 집어주는 장점이 있습니다. 데이터 과학자들은 항상 과거의 방법보다 새로운 방법에 신경을 써야 사람들의 거짓말을 극복할 수있을 겁니다.

빅데이터는 4가지 힘을 가지고 있다고 합니다. 새로운 데이터의 힘, 솔직한 데이터의 힘, 클로즈업해서 보는 데이터의 힘, 다양한 실험이 가능한 데이터의 힘입니다. 하지만 이런 힘을 가지고 있지만 주식예측은 불가능하다고 합니다. 이 전제로 저자는 경제계의 구루 래리 서머스 전 재무부장관과의 만남을 소개합니다. 정말 대단한 천재시죠. 이 분도 빅데이터로 주식을 예측할 수있을 지 궁금해 하셨다고 합니다. 이 분이 퀀트는 신뢰하실지 궁금하군요. 주식이 예측힘든이유는 차원의 저주때문이라고 합니다. 즉 변수가 기하급수로 늘어서 정확도를 떨어뜨린다는 겁니다. 그렇다면 변수를 줄여서 개발도상국의 성장을 예측하는 방법을 서머스가 제시했는데 이것도 힘들다고 합니다. 이유는 검색량이 적어서라고 하죠 그리고 또 주의해야 할 점이 숫자에 대한 강박입니다. 이러한 집착이 생기면 오류가 발생됩니다. 이외에도 구글트랜드를 사용하는 것이 부적절한 예를 들어줍니다.

데이터를 이용한 연구가 아직까지는 인문과학이나 사회과학에서는 주류가 아니라고 합니다. 지금은 주로 진보적인 사고를 지닌 사람들의 전유물이지만 '이제 변화가 일어날 것이다'라고 저자는 확신합니다. 데이터를 다루는 것, 약간의 통계기술과 강한 호기심, 넘치는 창의력만 있다면 데이터로 성과를 낼수있는 준비가 된 거라고 합니다. 그리고 저자는 앞으로의 많은 학문의 성과가 데이터를 기반할 것이라고 확신합니다. 즉 모든 학자는 데이터과학자일거라는 겁니다. 이 이야기의 근원에는 빅데이터를 따르라는 겁니다. 그리고 그에 따라 행동하라고도 합니다. 그것이 성공이나 성과, 이익, 행복 등과 연결될 거라는 겁니다.

본 도서는 출판사로부터 무상으로 지급받아 주관적인 서평을 합니다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo