여기에 당신의 욕망이 보인다 - 빅 데이터에서 찾아낸 70억 욕망의 지도
송길영 지음 / 쌤앤파커스 / 2012년 11월
평점 :
절판


빅데이터 분석에 대해 생각할 바를 많이 제공하는 좋은 책이다. 다만 이 책은 빅데이터 자체의 한계(혹은 빅데이터 분석의 한계?)에 대해서는 언급하고 있지 않아 아쉽다.

 

빅데이터가 가지고 있는 한계는 소비능력과 데이터 생산량 사이의 불균형이다. 예를 들어 소비자로서는 한 대의 자동차를 사지만 데이터는 수십, 수백 명 만큼의 분량을 만들어 낼 수 있다. 소비자 중 일부가 온라인에 자신이 소비할 수 있는 분량 이상의 글을 쓰면 분석할 빅데이터 자체가 왜곡되어 분석 결과도 실제 여론과는 차이가 생긴다. 이것은 빅데이터의 한계이자 빅데이터 분석의 난점일텐데 이 책에는 이렇다 할 설명이 없다.

 

빅데이터의 또 다른 한계는 온라인의 글을 쓰는 사람의 심리에서 데이터 왜곡이 발생한다는 점이다. 온라인에 글을 쓰는 사람은 누군가엔가 자신을 표현하려는 욕망을 가지고 있어서 알게 모르게 과대포장하는 경향이 있는데, 빅데이터 분석은 이 점을 지나치기 쉽다. 즉, 온라인의 글은 그래서 잘 알지 못하는 것을 잘 아는 것처럼, 잘 아는 것은 실제보다 과장해서 쓰는 경우가 많고 아예 모르는 것에 대해서는 관심이 있더라도 잘 쓰지 않는다.

 

이 책의 저자는, 예전의 캠핑은 멋있고 섹시한 것이었으나 요즘의 캠핑은 즐거운 것이라고 한다(225쪽 이하). 캠핑에 대한 대중의 인식 내지 트렌드가 변했다는 것이다. 정말 그럴까? 캠핑을 즐기지 않는 90% 사람은 여전히 캠핑을 즐겁다기 보다 멋지다고 생각한다. 하지만 이들은 온라인에 캠핑에 대한 글을 쓰지 않기에 빅데이터 분석에 반영되지 않는다. 빅데이터가 분석하는 글은 캠핑을 즐기는 10% 사람이 쓴 것이다. 그런데 그들은 캠핑이 아이들 때문에 괴로웠더라도, 아이가 떼를 써서 다시는 캠핑을 가기 싫었다고 쓸 수 없으니, 트위터와 블로그에는 즐거운 캠핑이었다고 쓰기 마련이다. 빅데이터 분석으로 이런 왜곡을 어떻게 보정할 것인지, 보정할 수는 있는지 의문이다.

 

이 두 가지에 대한 언급과 해결방법에 대한 설명이 없다는 점에서 이 책은 빅데이터 분석에 대한 완전히 객관적인 책은 아니며, 빅데이터 분석 산업을 활성화하기 위한 책, 다시 말해 저자가 소속되어 있는 다음소프트 등의 빅데이터 분석회사의 마케팅을 위한 책으로 봐야겠다.


댓글(0) 먼댓글(0) 좋아요(2)
좋아요
북마크하기찜하기 thankstoThanksTo