수학의 아름다움 - AI, 빅데이터에 숨어 있는
우쥔 지음, 한수희 옮김, 권재명 감수 / 세종(세종서적) / 2019년 1월
평점 :
장바구니담기


정보량은 불확실성과 직결 … 수학의 아름다움

[리뷰] 『AI, 빅데이터에 숨어 있는 수학의 아름다움 : 구글 연구 개발자가 들려주는 알고리즘 속 수학 이야기』(우쥔 지음, 한수희 옮김, 권재명 감수, 세종서적, 2019. 01. 28.)

 

중학교 수학 시간에 배우는 ‘호도법’이란 게 있다. 반지름과 호의 길이를 이용해 전체 360도를 기준으로 각을 재는 방법이다. 그 방법을 고안한 사람은 천동설을 체계화 한 프톨레마이오스라고 한다. 이런 내용은 구글 개발자였던 우쥔이 쓴 책 『AI, 빅데이터에 숨어 있는 수학의 아름다움』에 나온다. 프톨레마이오스는 천동설이라는 오류로 악명이 나 있지만, 우쥔에 따르면 수학과 천문학에 많은 공헌을 했다.

 

구글차이나에서 수학의 중요성을 강조하면서 저자는 “올바른 수학 모델은 형식이 간단해야 한다”면서 책을 쓴 의도는 “IT 회사의 공학 주관자들이 부하 직원을 잘 인솔해서 공학 수준을 높이고 짝퉁을 멀리하길 바란다”고 강조했다.

 

검색을 하지 않고는 하루도 못사는 세상이 되었다. 즉, 포털사이트의 위력은 상상을 초월할 정도다. 그 근간을 이루는 것을 바로 알고리즘이다. 알고리즘이 어떻게 형성돼 ‘페이지랭크’나 스팸 처리 등이 일어나는지 저자 우쥔을 알기 쉽게 설명해주고 있다. 허나, 그보다 더욱 중요한 건 수학이다.

 



올바른 수학 모델과 짝퉁 멀리하기

 

컴퓨터가 자연어를 처리하는 건 그동안 참 어려웠다. 예를 들어, 두 문장이 있다고 하자. The pen is in the box.와 The box is in the pen.(울타리). 첫 번째 문장은 해석하기 쉽지만, 두 번째 문장은 pen이 울타리란 뜻을 갖고 있다는 건 알아야 한다. 즉, 모든 단어나 문장은 맥락을 알아야 하는 것이고, 자연어를 기계가 이해하는 건 그만큼 어렵다.

 

책에는 수학과 관련한 여러 흥미로운 내용이 있는데, 그중 세 가지만 소개해보자. 먼저 인간이 이해할 수 있는 인지 능력은 ‘3’이 한계치라는 점이다. 책에는 추장 얘기가 등장한다. “두 추장은 누가 말한 숫자가 더 큰지 비교하는 시합을 했다. 한 추장이 고심 끝에 '3'을 말했더니 다른 추장이 한참 생각한 후 네가 이겼다고 했다.”

 

다음으로 로마 숫자 얘기다. I, II, III까지는 쉽게 이해하지만, IV와 VI는 왜 이런 규칙이 있는지 헷갈렸다. 그런데 로마 숫자의 디코딩 규칙을 보면 이해할 수 있다. 작은 숫자가 왼쪽에 오면 뺄셈이고 오른쪽에 오면 덧셈인 것이다. IV는 5-1=4, VII는 5+2=7, IIXX는 20-2=18을 뜻한다.

 

마지막으로 흥미로웠던 건 ‘정보량’에 대한 것이다. 정보량은 불확실성과 연관돼 있다. 모르는 일들은 많은 정보가 필요하다. 즉 불확실성이 크면 정보량이 많이 요구된다. 하지만 많이 알고 있는 건 불확실성이 적기 때문에 정보량이 많이 필요 없다. 즉, 정보량은 불확실성이다.

 

책에는 어려운 수학공식도 많이 나온다. 시간을 충분히 들이고 탐독한다면 정말 좋은 책이다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo