빅데이터 인문학 : 진격의 서막 - 800만 권의 책에서 배울 수 있는 것들
에레즈 에이든 외 지음, 김재중 옮김 / 사계절 / 2015년 1월
평점 :
장바구니담기



독서를 한 구력을 믿고 어지간하면 촉만 내세워 책을 읽는 편이다. 어떤 책인지 자세하게 알아볼 생각없이 느낌이 오면 읽는다. <빅데이터 인문학:진격의 서막>은 그다지 촉이 오진 않았지만 계속 눈에 밟혔다. 가장 큰 이유는 책에서 커다란 데이터를 뽑아 세상을 바라본다는 느낌에 워낙 책을 읽는 편인 나에게는 도서관에 갈때마다 끊임없이 유혹했다. 결국에는 에이 모르겠다는 심정으로 읽고나 보자며 선택했다.


아쉽게도 우리가 갖는 첫 느낌은 맞을 때가 많다. 느낌으로 어떤 판단을 내리면 안 된다. 그나마 느낌만으로 선택한 판단이 맞을 때가 있는데 그런 경우 대다수가 그 분야에서 오래도록 경험을 쌓을 경우다. 오랜 경험으로 쌓인 누적된 경험이 남들보다 발달된 감각으로 내린 판단이 좋은 경우가 많다. 그래도 유혹에 흔들리는 사람이다. 그렇게 선택한 책인데 딱히 재미는 없었다. 더구나 책에서 무엇을 이야기하려고 하는지 잘 이해가 되지 않았다.


어떤 사람은 1시간만에 책 한 권을 뚝딱 읽는다. 그래도 그 책 내용을 어지간하게 파악하고 있다. 나도 충분히 그럴 수 있다. 어차피 책 한 권에 담긴 내용은 중심뼈대만 알면된다. 책 내용이 전부 중요한 경우도 없고 사족처럼 이어지는 부분도 있다. 그렇기에 1시간만에 읽을 수 있다. 다만, 책을 읽는 이유가 꼭 그것은 아니다. 책에 나온 다양한 내용 중에는 책에서 주장하는 것과는 다소 상관없는 부분도 있다. 간혹 이런 부분이 더 도움이 될 때가 있다. 그렇게 책을 휘리릭 넘기지 않고 읽는다.


엉뚱한 이야기로 빠졌는데 이 책을 그렇게 읽을 수도 있었다. 다 읽고나니 그래도 상관은 없었을 듯 했다. 진득하게 책을 온전히 정독으로 읽지 않았지만 내가 책을 읽는 스타일이 될 수 있는 한 정독인 이유다. 그저 이 책 중심내용만 안다고 책을 읽었다고 할 수는 없다. 생각지 못한 부분이 생각지 못한 아이디어와 영감을 주는 경우가 있다. 바로 그 지점이 실제 책을 읽으며 기쁜 순간이다. 책 내용은 까짓것 한 장으로 끝낼 수 있다.


영어를 배울 때 불규칙 동사를 배운다. 영어를 배울 때 어려운 점 하나였다. 보통 -ed로 끝내는 경우가 많은데 불규칙 동사는 어떻게 된 일인지 책에서 처음에 알려준다. -ed는 영어에서 상대적으로 늦게 생긴 단어들이다. 불규칙 동사는 오래전부터 사용되던 단어들이었다. 중요한 것은 자주 사용하는 단어라는거다. 그러다보니 자연스럽게 그 단어들은 도태되지 않고 살아남아 어렵게 외워야만 하는 동사 단어가 되었다.

'지프의 법칙'이 있다. 자주 쓰는 단어는 살아남고 그렇지 않은 단어는 점점 사라진다. 우리가 일상생활에서 짜장면이라 부르고 있는데 표준어가 '자장면'이라 불일치가 생겼다. 어느 누구도 실생활에서 자장면이라 신경쓰며 발음하지 않았다. 시간이 지나면 대중 대다수가 쓰는 단어를 무시할 수 없게 되어 이제는 '짜장면'도 표준어가 되었다. 이처럼 다수가 사용하는 단어는 더 많이 사용하면서 대중에게 선택받는다.


이건 멱함수하고도 관계있다. 일정 임계치부터 사람들은 폭발적으로 사용하며 다른 단어마저 대치하며 시간이 지나 살아남은 단어를 우리가 지금도 쓰게 된다. 재미있게도 과거에는 불규칙 동사로 쓰던 단어가 이제는 -ed로 쓴다. 열심히 불규칙 동사를 배운 외국인이 미국에 와서 깜짝 놀란다. 이제 불규칙동사도 그냥 -ed로 붙이는 현상이 신문뉴스에서도 쓰고 있으니 말이다. 이를테면 burnt가 아닌 burned로 쓰고 learnt가 아니라 learned로 쓰고 있다.


현재 구글북스라고 하여 출판된 책을 전부 디지털화는 작업을 구글이 하고 있다. 2020년까지 이미 출판된 책들을 전부 하겠다는 청사진을 갖고 옮기는 중이다. 이 책에 있는 단어들을 갖고 데이터 작업으로 특정 단어의 생성과 소멸뿐만 아니라 유명인에 대한 조사까지 하고 있는 중이다. 이른 시기에 유명해지고 싶으면 연예인이나 스포츠 선수가 유리하고 오래도록 유명해지고 싶으면 작가가 좋다. 연예인은 빠른 시간에 유명해져서 평생가지만 작가는 늦은 40대가 넘어야 하고 사후에 유명해지는 경우도 대다수였다.


이들이 그런 이유는 단 하나의 작품으로 유명해지기보다는 계속해서 데이터가 쌓이는 것처럼 작품을 발표하고 하나둘씩 쌓이면서 대중의 인지도가 올라가고 사후에 재평가까지 받으면 더 큰 인지도를 얻을 수 있다. 이런 작업을 현재 구글은 하고 있다. 이렇다해도 오래도록 사람들에게 남을 순 없다. 시간이 지나며 망각과 함께 인지도는 사라지고 기억속에 희미하게 남게 된다. 이 책에서 말한 데이터는 한계가 있다. 철저하게 책에서만 얻은 데이터다. 


책에서 언급되지 않지만 훨씬 더 인지도와 유명인사들이 있다. 그런 면을 제외해도 책에서 그런 데이터를 뽑는다는 점이 신선했다. 그 부분을 제외하면 자신들이 이 작업을 하는 여정을 책으로 펴냈다는 것 이외에는 별로 큰 감흥은 없었다. 그리고 읽기가 다소 힘들었고. 책 제목을 다소 모호하게 지어서 책 내용과는 다소 괴리감이 있다. 이 책에서 얻은 것은 지프의 법칙이다. 난 구글처럼 자본도 인력도 없어 이렇게 독서리뷰를 써서 개인적인 데이터를 만들고 있다.


그나저나 이 책은 인문으로 분류할 듯 하지만 인문으로 하는 것이 맞을까라는 의문이 든다. 마지막으로 이 책 분야를 보려고 인터넷서점을 보니 재미있게 읽었다는 분들이 제법 있다. 내가 이상한거다.^^



까칠한 핑크팬더의 한 마디 : 800만 권에 속은 듯.

친절한 핑크팬더의 한 마디 : 많이 회자되면 성공한 거다.


함께 읽을 책

http://blog.naver.com/ljb1202/220629966673

빅데이터 인간을 해석하다 - 해석당하다


http://blog.naver.com/ljb1202/220421207875

이미지 인문학 - 현실, 진실, 사실


http://blog.naver.com/ljb1202/220118580306

생각의 시대 - 로고스






댓글(0) 먼댓글(0) 좋아요(1)
좋아요
북마크하기찜하기 thankstoThanksTo