-
-
빅데이터 인문학 : 진격의 서막 - 800만 권의 책에서 배울 수 있는 것들
에레즈 에이든 외 지음, 김재중 옮김 / 사계절 / 2015년 1월
평점 :
굉장히 생소한 책이었다...빅데이터..무얼 뜻하는 것일까? 책을 몇십페이지 넘기고 나서야 조금씩 감이 잡히기 시작했다... 그많은 광대한 서적을 디지털화 시켜서 하나의 그래픽으로 나타낸다는것이 괭장히 신기하고 참신하기도 하고..하지만 얼핏보면 일반인들에겐 아직도 굉장히 생소하고 낯선 분야일거 같다는 생각이다.
이른바 구글엔그램 (ngrams)이라는 검색엔진에 단어를 검색하면 그 단어의 연도별 사용횟수를 읽을수 있다. 이는 전에는 볼수 없었던 조사방법으로 시대별 주요 역사적 사건이나 인물등을 조사해서 연대별 중요흐름을 분석할 수있고 이는 다양한 분야에 사용될수도 있다.
예를 들어보면 미국이 언제 진정한 하나의 나라로 되었을까? 라는 주제를 가지고 연구과제가 주워졌다면 막연함과 황당함이 몰려오면서 도서관에 틀어박혀 수많은 서적을 뒤적여야 할것이다. 하지만 빅데이터 를 이용하면 언제부터 미합중국이 하나의 나라로 미국민들이 인식하고 미국을 '단일미국'이라 불리워 졌는지 흐름을 파악할 수있다.
구굴의 ngrams 검색기를 이용하면 The United States are라는 표현은 복수를 의미한다 이는 단일국가로서의 미국을 의미하는것이 아니라 다국속에 미합중국을 의미하며 당시 미국인들은 각 주는 한 나라요 미국은 여러주가 하나로 합쳐진 연합체에 불과하다고 인식한것이다 . 이러한 흐름의 변화는 구글 검색기를 통해 언제부터 'The United States is'라는 표현을 사용하기 시작했는지를 비교분석하면 미국민들이 서서히 단일국가로 인식하기 시작한 시점을 파악할 수있다.
그래프를 상에 나타난 두개의 선을 비교분석 해서 역사적 사실에 대한 흐름을 분석하고 우리가 얻고자 하는 지식을 얻어낼 수있으며 이러한 내용은 역사적 사실에 비춰볼때 정보내용은 과학자들의 논문처럼 정확하진 않지만 흐름을 분석하는데 크나큰 효과를 얻을 수있다. 그리고 이러한 정보를 바탕으로 더 정확하게 분석해나간다면 시간과 노력을 획기적으로 줄일 수있겠다는 생각이 든다.
아직은 생소한 빅데이터에 관한 내용은 앞으로 우리 일상 생활에 더욱 유용하게 씌일 것이다.따라서 빅데이터를 활용해서 여러가지 사업분야와 학문적인 분야에도 유용한 도구로 씌여질 것으로 생각된다.