빅데이터 인문학 : 진격의 서막 - 800만 권의 책에서 배울 수 있는 것들
에레즈 에이든 외 지음, 김재중 옮김 / 사계절 / 2015년 1월
평점 :
장바구니담기


## 1
이게 왜 '인문학'이랑 관련이 있는지 모르겠다. 요즘은 공학이 아니면 '인문학'이라 말하나 보다. '빅데이터'를 믿고 사면 된다. '인문학'보다 '사회학'에 대한 관점을 가지고 보는게 좋다.

## 2
"800 만 권의 책에서 배울 수 있는 것들", 부제가 곧 제목이다. 800만권의 책에서 어떤 것을 배울 수 있을까? 많은걸 배울 수 있겠지? 그럼 어떻게 800만권에서 배울 수 있는거지? 책 1권을 1시간에 읽는다고 쳐도(가정이 틀렸어... 프루스트 책을 1시간에.. ?) 800만권이면 800만 시간인데...? 뭔가 방법이 있겠지? 없다면 사기에 가깝다 봐야한다. 자 그 방법이 뭘까?!

## 3
구글의 놀라운 잉여력과 저자의 아이디어가 만나서 [엔그램](https://books.google.com/ngrams)이라는 거대한 검색기를 만들어냈다. 쉽게 말해서 엄청난 양의 책을 스캔해서 단어의 빈도를 그래프로 그려주는 것이다(책에서 거론된 빈도를 그래프로 그려주는것과 많이 인용된 논문을 검색하는 것...결코 다르게 보이지 않는다). 그래서 단어의 빈도를 통해서 영문학, 사회학 등과 같은 세대와 시대를 관통하는 다양한 이야기를 펼쳐간다.

## 4
빅데이터를 처리하는 관점에서 이 책을 통해 배울 수 있는 것은 다음과 같다.
* 툴을 만들어 내는건 공학적이고, 방법론적인 문제이다. 그러나 분석은 인간에 대한 접근방식과 관점에 관한 문제이다.
* 빅데이터를 만들어내는 것도 중요하지만, 불필요한/오염된 자료를 걸러내는 작업도 병행되어야 한다. 데이터의 '대표성'과 직결된다.
* 빅데이터와 인문학을 결합해서 '학술'적인 일을 진행할 수 있다. 그럼에도 불구하고 그 모든 행위는 '예측'을 지향하고 있으며 이것은 '마켓팅'에 집중된다. 즉, 현재의 빅데이터로 돈을 벌어들이는 가장 유망한 방법은 '서비스' 제공이다.

우리가 현대적인 삶이 제공하는 모든 것을 경험하고, 삶의 점점 더 많은 부분을 인터넷 상에서 영위하게 되면서 우리의 디지털 부스러기는 점점 더 철저하게 자취를 남기기 시작했다. 우리 개개인이 남기는 기록은 그 폭과 깊이가 믿기 어려울 정도다.

[...] 책들은 놀랍도록 다양한 범위의 주제를 다루며 폭넓은 시각을 반영한다. 방대한 장서를 탐구하는 일은 수많은 사람들, 그중의 상당수는 이미 죽은 사람들을 조사하는 작업이라고 볼 수 있다. 역사와 문화 분야에서 특정 시기에, 특정 장소에서 나온 책들은 해당 시기와 장소에 관한 정보에서 가장 중요한 원천이다.

기술의 미래를 추측하는 것보다 가치의 미래를 추측하는 것이 훨씬 어렵기 때문에 이런 질문의 답이 어떻게 될지는 말하기 어렵다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo