빅데이터 인문학 : 진격의 서막 - 800만 권의 책에서 배울 수 있는 것들
에레즈 에이든 외 지음, 김재중 옮김 / 사계절 / 2015년 1월
평점 :
장바구니담기


빅데이터( big data)란 기존 데이터베이스 관리도구로 데이터를 수집, 저장, 관리, 분석할 수 있는 역량을 넘어서는 대량의 정형 또는 비정형 데이터 집합 이러한 데이터로부터 가치를 추출하고 결과를 분석하는 기술을 의미한다. 다양한 종류의 대규모 데이터에 대한 생성, 수집, 분석, 표현을 그 특징으로 하는 빅 데이터 기술의 발전은 다변화된 현대 사회를 더욱 정확하게 예측하여 효율적으로 작동케 하고 개인화된 현대 사회 구성원 마다 맞춤형 정보를 제공, 관리, 분석 가능케 하며 과거에는 불가능했던 기술을 실현시키기도 한다.

이같이 빅 데이터는 정치, 사회, 경제, 문화, 과학 기술 등 전 영역에 걸쳐서 사회와 인류에게 가치있는 정보를 제공할 수 있는 가능성을 제시하며 그 중요성이 부각되고 있다.


이 책은 엄청난 양의 디지털 기록, 즉 빅데이터와 인문학이 새롭게 당면함으로써 기존의 인문학을 좀 더 발전시킬 수있다는 가정하에 만든  기록의 현장이라고 할 수 있다. 책의 저자들은 <빅데이터 인문학>은 그 엔그램 뷰어를 만든 두 과학자이다.

책에서 쓰인 단어의 추이를 살펴보면 낱말의 탄생과 소멸을 진화론처럼 설명할 수 있다고 보았다.엔그램 뷰어는 2004년부터 시작된 ‘구글 북스’ 프로젝트다. 세계의 모든 책을 스캔해서 디지털화하는 엄청난 규모의 프로젝트인데1800년부터 2012년까지 출간된 영어책 800만 권에서 특정 단어의 사용 빈도를 조회하는 도구이다.  단어의 추이를 알려주는 것은 구글의 엔그램이 해주는 것이고, 연구원은 합리적인 실험 방법을 통해 나온 결과를 말이 되게 설명했다. 구글 엔그램은앞으로 DB화가 진행될 수록 구글 엔그램 뷰어 프로젝트는 순식간에 빅데이터의 역사에서 가장 중요한 법률적 발화점이 됐다. 구글 북스 겪은 어려움은 빅데이터 연구가 앞으로 마주할 법률적 도전의 전조를 보여줬다.


특히, 우리나라의  독자들을 위해 준비된 특별 좌담 부분은 무척  흡족했던 부분이다. 이 부분에서 우리 나라의 현 상황을 느낄 수 있었다. 디지털화가 부족한 현실과 새로운 연구가 보수적인 학계에서 자리를 얻을 수 있을지에 대한 논의 대해서는 공감을 하게 만든 대목이기도 하다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo