빅데이터 인문학 : 진격의 서막 - 800만 권의 책에서 배울 수 있는 것들
에레즈 에이든 외 지음, 김재중 옮김 / 사계절 / 2015년 1월
평점 :
장바구니담기




2014년은 나름대로 치열하게 보냈던 기억이 있다. 서른이 넘어 다시 공부를 했던 지난해, 수업과목 중 토론형식을 빌어 나눴던 대화중에

빅 데이터에 대한 내용을 공부했던 적이 있는데 그때는 관련 내용을 전혀 모르고 수업에 임했던지라 어렵게만 느껴졌고,

고등학교 시절 문과에 대학시절 상경계열을 전공했던지라 이공계열에게만 맞을 것 같던 수업이어서 그 당시는 공부할 마음이 사실 잘 들지 않았다.

어서 이 시간이 빨리 지나가기를 바랄 뿐.. 그러다 얼마 전 빅 데이터에 대한 수많은 책 중에서 인문학과 접목시켜 풀어가는 책이 출간됐다는 것을 보고

읽기 시작한 것이 <빅데이터 인문학 : 진격의 서막> 이다.

인문학과 빅 데이터라, 전혀 상관없을 것만 같은 둘의 만남이라니 어떤 내용일지 궁금했다.



 

​이 책의 내용을 한 줄로 요약하면 구글 엔그램 뷰어를 통해 얻은 빅 데이터로 알 수 있는 인문학 세상이라고 생각하면 될 듯하다.

일단 내용을 이해하기 위해서는 구글 엔그램 뷰어가 무엇인지 알아야 했는데 ‘구글 엔그램 뷰어’는 검색창에 원하는 단어를 입력하고 버튼 하나를 클릭하면,

순식간에 800만 권의 책을 검색해 해당 단어가 지난 500년간 사용된 빈도의 추이를 그래프로 보여주는 시스템이다.

저자인 에레즈 에이든과 장바티스트 미셸은 이런 새로운 관찰도구라 할 수 있는 구글 엔그램 뷰어를 통해 우리가 입력하는 특정한 단어들이 특정 시기에

얼마나 언급되는지 도표로 보여주어 그것을 통해 인류의 과거를 말할 수 있고 세상을 보는 방식이 변화되었음을 말하고 있었다.




대학시절 과제를 하다보면 자연스레 포털사이트의 검색창을 통해 검색을 하게 되는데 그때마다 단어를 입력하면서 빨리 내가 원하는 자료(데이터)를

찾아내 주기만을 바랐지 그 단어가 특정시기에 얼마나 많이 쓰였는지를 생각해 본적은 없는 것 같다.

그래서 책에서 자주 등장하는 구글 엔그램 뷰어라는 것도 이번에 처음 알았고 이런 독특한 발상을 했다는 자체가 나는 아주 놀라웠다.

사용한 단어의 빈도수를 비교해 보면 그 당시 시대가 처해있는 주요 토픽을 알 수 있고 그것은 당시의 시대상을 말해주기도 하니까.



예를 들어 이 시스템을 통해 검색해본 결과 1936년에서 1943년 사이에 마르크 샤갈이라는 이름은 독일어 책 기록에서 딱 한 번 등장하게 되는데

이 엔그램들을 통해 샤갈 및 그의 동시대인에게 나치가 가한 억압이 만들어낸 효과를 볼 수 있었고, 이는 곧 나치는 샤갈을 죽이지는 못했지만

그를 그 시대에서 거의 지워버렸다.



이렇게 우리는 엔그램 뷰어 시스템을 이용하여 방대한 양의 데이터를 이용한 인간의 역사와 문화를 분석할 수 있게 되었다.

이런 시스템의 적용을 받기 위해서는 일단 책을 스캔하고 디지털화하는 작업이 필요하기에 조금 번거롭기는 하지만 이런 작업을 통해서

빅 데이터가 일으킬 인문학 혁명을 생각하면 앞으로가 더 기대된다.

조금은 어려울 수도 있는 내용을 다루고 있지만 다양한 사례와 그래프 등의 시각적인 자료를 충분히 사용하여 이해도를 돕고 있어 무리없이

읽을 수 있었고 책을 통해 관심을 갖게 된 구글 엔그램 뷰어 시스템을 실제로 사용해 봤는데 현재는 한국어에 대한 지원을 하고 있지 않아 조금 아쉬웠다.

이제 이런 좋은 아이디어가 있으니 우리도 관련 기술을 개발하여 빅 데이터를 활용한 한국 상황에 맞는 인문학적 분석도 가능해 졌으면 하는 바람을 가져본다.



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo