-
-
빅데이터 인문학 : 진격의 서막 - 800만 권의 책에서 배울 수 있는 것들
에레즈 에이든 외 지음, 김재중 옮김 / 사계절 / 2015년 1월
평점 :
한 사람이 만들어내는 데이터의 1년치는 약 1테라바이트에 가깝다고 한다. 우리는 어느새 잊고 있는 일들이 디지털세계에서는 기록으로 남고 있고, 인터넷
상에서 보내는 사람들의 시간이 늘어날수록, 그렇게 만들어지는 ‘디지털
부스러기’는 점점 더 증가하고 있다. 그렇게 생성되는 대규모의
데이터를 통해 1대1 맞춤형 정보를 제공하고자 하는 것이
‘빅 데이터’라고 한다. “세계의
정보를 정리하는 것”이 구글의 사명이라고 하는 구글의 공동 창업자 래리 페이지는 빅데이터에 롱데이터를
더하고자 했다. 즉 현대 인류뿐 아니라 지금까지 이루어온 인간의 문명까지 기록하고자 했던 것이다. 그래서, 인간이 남긴 모든 기록물을 디지털화하고자 했고, 그렇게 구글이 구축한 디지털 바벨의 도서관에 ‘구글 엔그램 뷰어’라는 혁신적인 관찰도구가 더해지게 되었다. <빅데이터 인문학: 진격의 서막>은 그 과정과 활용법에 대한 이야기를 담고 있다.
이야기는 미국 즉 [The United states]를 복수형이 아닌 단수형으로 받기 시작한 이야기로 시작된다. 미국을 독립적인 주가 합쳐져서 만들어진 것으로 보아 복수형으로 인식하다, 미국이라는
국가의 정체성이 확립되면서 단수형으로 인식하게 되었다. 그리고 그 것이 언제였을까? 라는 의문이 생긴다면, 역사서와 신문 발췌문을 참고하여 어느 시기에
그렇게 되었는지에 대해서 탐구해보게 된다. 바로 이것이 지금까지의 접근법이었다. 하지만 에레즈 에이든과 장바티스트 미셸은 특정 단어와 특정 아이디어가 얼마나 자주 언급되었는지를 쉽게 살펴볼
수 있는, ‘구글 엔그램 뷰어’를 통해 그 방식을 완전히
바꾸어 놓았다. 심지어 언어의 불규칙동사가 언제쯤 사라질지 예측가능하다는 것을 보며 상당히 놀랍기도
했다. 특히 매 장이 끝날때마다 간단한 그림과 실제로 분석된 데이터 자료를 보여주는데, 내용을 이해하는데 많은 도움이 된다. 이렇게 새로운 기술이 사람에
대한 모든 것을 탐구하는 인문학에 더해지면서, 예전에는 쉽게 할 수 없는 다양한 통계와 분석을 쉽게
할 수 있게 된 것이다. 전문화를 이유로 학문의 세분화되기 시작했는데,
이제는 다시 융합되어 가는 과정이 잘 나타난 것이 아닌가 싶기도 했다.
https://books.google.com/ngrams에
접속하면 ‘구글 엔그램 뷰어’를 만날 수 있는데, 아쉽게도 아직까지는 한국어 자료는 존재하지 않는다. 그래서 ‘특별좌담_인문학을 위한 빅데이터 사용 설명서>가 부록으로 더해졌다. 학계와 디지털업계의 인물들이 우리나라의
상황을 짚어보고, 우리가 나아가야 할 길을 모색해보는 과정이 담겨 있기도 하다.