빅데이터 인문학 : 진격의 서막 - 800만 권의 책에서 배울 수 있는 것들
에레즈 에이든 외 지음, 김재중 옮김 / 사계절 / 2015년 1월
평점 :
장바구니담기


구글의 위력, 이 책에서도 또 한 번 드러난다. 디지털로 책을 전환하는 일에 매달린 덕분에 상당한 분량의 고전과 유명 서적이 디지털 기호로 전환을 마쳤다. 이 책의 등장도 그러한 노력과 목적지향적 수행덕분이라고 할 수 있다. 얼마 전에 자동 스캐너를 개발해 책을 스캔하고 지나간 기기가 왕복운동을 하며 책장을 넘기는 장면을 봤다. 꽤 오래 전이라 할 수 있지만, 그런 수많은 과정이 누적되어 구글 엔그램 뷰어가 작동하게 된 것을 보면, 데이터는 역시 누적되어야 의미를 갖게 된다는 것도 알 수 있었다. 무려 800만권이라니 정말 디지털 바벨의 도서관이라 할 만 하다. 책의 내용은 신선하고, 그동안 해보지 않은, 또 못한 정량적 분석이 중반부터 화려하게 펼쳐진다. 명성에 관한 주제로 작가 사(死)전과 사후의 인기도를 시간 순으로 나열하고, 인포그래픽까지 활용하며 데이터의 시각화에도 많은 노력을 기울였다. 베이비시터의 등장 시기와 이러한 풍조를 대중이 거리낌없이 받아들이기까지 걸린 시간과 그 후의 대중화 모습도 데이터와 그림으로 재밌게 알아볼 수 있어서 정말 흥미롭다. 세상에 다시 없을 명작을 남긴 세계의 작가가 다수 등장하고, 나치 선동과 전쟁 발발 등의 시기에 맞물려 인문학적 경향이 어떤 모습을 그렸는지 데이터가 의미를 전달한다. 전혀 감각적으로 상상하지도 못했던 시도라 빅데이터의 위용에 눈이 번쩍 띄일 정도로 신기했고, 인문학과 빅데이터의 조우가 이토록 신선한 건 솔직히 처음이었다. 현상을 알아보고 미래를 예측하는 빅데이터를 문학에 대입하니 특정 용어가 일반 용어가 되는데 필요한 시간과 요건, 잘못쓰인 불규칙동사의 고정화 등은 빅데이터가 아니고서는 추측과 측정자체가 힘든 여러 사례를 저자가 선보인다. 책에 등장하는 단어와 800만권의 서적에서 시계열적으로 기재된 단어를 비교해 어떤 단어가 시대적 상황에 따라 빈도가 늘어나고 줄어드는지 그래프로 따라가는 건 너무나도 재밌어서 책의 종반부로 갈수록 아쉬운 느낌도 들었다. 1968년도를 기점으로 인문학에 등장하는 커피와 차의 순위가 바뀌기 시작한다. 1968년 전에는 차가 커피에 줄곧 앞섰다. 그러다 68년 이후 차와 커피의 간극은 크게 벌어지며 커피가 압도적 우위를 점한다. 현대인이 거의 음용한다해도 과언이 아닌 커피의 대중화가 생각보다 오랜 역사를 지닌 건 아니다. 일찍이 존재가 시작되었지만, 완전히 위치를 잡은 건 1968년 이후다. 빅데이터는 이처럼 역사와 생활까지 아우른다. 800만권의 데이터, 인류의 역사가 그곳에 있다.

 


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo