지능의 기원 - 우리의 뇌 그리고 AI를 만든 다섯 번의 혁신
맥스 베넷 지음, 김성훈 옮김, 정재승 감수 / 더퀘스트 / 2025년 1월
평점 :
장바구니담기


맥스 베넷은 뇌과학자가 아니다. 소위 잘 나가는 인공지능 기업을 운영하는 사업가이다. 그런 사람이 지구에서 어떻게 생명 탄생 이후 뇌가 만들어지고 인간의 지능이 현재와 같은 모습을 갖게 되었는지에 대한 야심찬 책을 쓸 수 있었을까? 비전문가가 심리학, 진화생물학, 뇌과학, 고인류학에 대한 방대한 내용이 빼곡하게 채워져 있는 주제의 책을 과연 쓸 수 있을까?

너무 재밌다고 읽어보라며 책을 건넨 형의 말에 반신반의하며 읽었다. 읽고 난 뒤 정말 너무 재밌다. 감탄, 감탄, 감탄했다. 그가 섭렵한 지식의 방대함과 함께 깊이 있게 각 전문분야를 이해한 그의 능력에 놀라움을 금치 못했다.

주말에 시간을 들여 완독한 후 맥스 베넷이 왜 이 책을 썼는지 이해하게 되었다. 서문에서 그는 본인이 읽기 위해 이 책을 썼다고 했다. 이게 무슨 말인지 읽기 전엔 몰랐는데 다 읽고 난 뒤 정확히 알게 되었다. 그는 호기심 천국의 다독가임에 틀림 없다. 방대한 분야를 읽고 난 다음에 그는 자신이 확실하게 이해했다고 생각한 내용의 독서 노트를 작성하고 싶었을 것이다. 중요한 내용에 밑줄 치고 잊지 말아야겠다고 생각한 내용을 정리해 두고 싶었을 게다. 충분히 공감이 되는 마음이다. 생각 없이 다독하는 사람이 책을 쓸 중요한 이유 중 하나가 될 듯했다.

단지 요약 노트를 넘어서서 이 책은 기존의 논의에서 보지 못한 새로운 내용이 있다. 인공지능 전문가이기 때문에 쓸 수 있는 내용이 포함되어 있다. 기존의 전문 분야 연구자들은 인공지능의 전문가가 아니므로 지능의 기원과 관련된 세부 조각을 완성하고 큰 그림을 그려 넣었지만 인공지능의 측면에서 어떤 의미가 있는지 충분히 설명하지 않았다. 인공지능 전문가인 맥스 베넷은 자신의 장점을 100% 발휘했다.

혁신의 1단계 조종에서는 초창기 인공지능 연구의 산물인 로봇 청소기 룸바를 예로 들어 설명한다. 2단계 강화라는 혁신에서는 머신러닝의 대표적인 과제인 패턴인식을 연결하여 설명한다. 3단계 시뮬레이션에서는 요즘 핫한 생성모델, 모델 기반 강화학습을 소환한다. 4단계 이후는 아직 인공지능이 가보지 않은 길이라고 그는 단언하고 있으나 그와 관련된 인공지능주의자들의 반론을 함께 싣고 있다.

나는 룸바가 나오는 대목에 처음으로 탄성을 질렀다. 맥스 베넷이 이 책을 썼던 이유가 여기에 있었구나. 앞으로 이 책에 어떤 인공지능 얘기가 펼쳐질지 너무 궁금해졌고 맨마지막 LLM에 대한 설명까지 계속 흥미를 유지하며 읽었다.

글과 책에는 두 가지 종류가 있는 듯 하다. 한편으로 궁금증을 자아내어 새로운 분야로 이끄는 게이트웨이가 되는 책이 있고 다른 한편으로 지금까지 읽고 이해했던 내용을 새롭게 종합하여 그전에 읽었던 책을 다시 읽게 만드는 책이 있다. 내게는 맥스 베넷의 책은 후자의 책이었다. 그 동안의 이 분야에 대한 내 난삽한 독서에 지도를 만들어준 책이었다. 게다가 나도 내가 모르는 분야의 책을 써보고 싶다는 욕심을 들게 했다. 이 책을 읽는 잡식성 다독가들도 나와 비슷한 경험을 할 듯 하다.

댓글(0) 먼댓글(0) 좋아요(2)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

600만년전
250만년전
50만년전

1,000만 년 전까지만 해도 아프리카 동부는 나무들이 빽빽하게 끝없이 펼쳐져 있는 오아시스 같은 곳이었다. 이곳에서 우리 조상은 과일을 따 먹고 포식자들로부터 몸을 숨겼다. 그러다가 지각판의 이동으로 거대한 땅덩어리들이서로 부딪히면서 오늘날의 에티오피아를 따라 길게 새로운 지형과 산맥이 만들어졌다. 요즘에는 이 지역을 그레이트리프트밸리라고 부른다.
새로 생긴 산맥과 계곡 때문에 숲을 유지해주던 풍부한 해양 습기의 공급이 끊겼다. 이때부터 현재의 아프리카 동부를 이루는 익숙한 기후가 형성되기 시작했다. 숲이 천천히 죽어나가고 나무는 듬성듬성 모자이크처럼 자라면서 땅은 탁 트인 넓은 초원으로 바뀌었다. 오늘날의 아프리카 사바나를 만들어낸 변화가 시작된 것이다. 우거진 숲이 사라지면서 열대의 과일과 견과류를 먹고 살던 우리 조상들의 생태적 지위도 서서히 바뀌기 시작했다.
600만 년 전 즈음해서는 새로운 산맥이 길게 뻗어나가는 바람에 유인원조상들이 양쪽으로 갈라져 두 계통으로 나뉘었다. 별다른 변화 없이 여전히숲이 많은 서쪽에서는 계통도 별로 변하지 않고 그대로 남아 오늘날의 침팬지가 됐다. 하지만 산맥 동쪽은 숲이 죽으면서 트인 초원이 점점 많아지자 진화압이 작용하기 시작했다. 이 계통이 결국 인간으로 진화한다.
4 - P434

뒤죽박죽 섞여 있는 이런 대형 포유류들 가운데 안락한 숲속 서식지를잃어버린 초라한 유인원 한 마리가 있었다. 우리의 조상인 초라한 유인원은거대한 초식동물과 육식동물로 북적거리는 생태계에서 살아남기 위해 새로운 생태적 지위를 찾고 있었을 것이다.
우리 조상은 처음에는 동물의 사체를 청소하는 생태적 지위에 뛰어들면서 육식으로 식생활을 바꾸기 시작했다. 침팬지의 식단에서 고기가 차지하는 비율은 10퍼센트에 지나지 않지만 증거에 따르면 초기 인류의 식단에서는고기가 30퍼센트 정도를 차지했던 것으로 보인다.
연구자들은 그들이 남긴 도구와 뼈의 흔적을 통해 이들의 사체 처리 생활방식을 추론해냈다. 우리 조상은 사체의 고기와 뼈를 처리하는 데 사용한것으로 보이는 석기를 발명했다. 이 도구들은 발견된 장소인 탄자니아 올두바이협곡의 이름을 따서 ‘올도완 석기oldowan tools‘라 부른다.  - P436

50만 년을 빨리감기하면 아프리카 동부의 우리 조상은 호모에렉투Homo erectus, 곧 직립인간이라는 종으로 진화했다. 사실 이는 웃기는 이름이다. 우리 조상은 호모에렉투스 훨씬 전부터 서서 걸었기 때문이다. ‘호Homo‘는 사람 속을, ‘에렉투스erectus‘는 특정 인간 종을 지칭한다. 호모에렉투스의 등장으로 인간의 진화는 전환점을 맞이한다. 남의 불행을 이용해배를 채우는 소심한 사체 처리 동물이었던 초기 인류가 최상위 포식자인 호모에렉투스로 변모한 것이다.
9호모에렉투스는 초육식동물hypercarnivore이 되어 식단의 무려 85퍼센트 정도를 고기로 섭취했다. 10 호모에렉투스는 같은 지역의 경쟁자들을 몰아낼 정도로 크게 번창한 것으로 보인다. 그래서 호모에렉투스가 등장할 즈음에는아프리카 사바나의 육식동물 중 다수가 멸종하기 시작했다. " - P437


댓글(0) 먼댓글(0) 좋아요(1)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

나는 법을 코딩할 것인가, 학습시스템과 본능을 부호화할 것인가?

새는 모두 나는 법을 안다. 그러면 새는 모두 태어날 때부터 나는 법을 유전적으로 알고 있다는 의미일까? 그렇지 않다. 새들은 태어날 때부터 나는 법을 아는 것이 아니다. 모든 아기 새는 나는 법을 배워야 한다. 먼저 날개를 퍼덕이는 것부터 시작해, 하늘에서 맴도는 것을 익히고 활공을 시도하고 충분히 반복해서 연습한 후에 결국 나는 법을 터득한다. 하지만 하늘을 나는 것이새에게 유전적으로 새겨져 있는 것이 아니라면 어떻게 아기 새가 독립적으로그런 복잡한 기술을 배울 수 있을까?
하늘을 나는 것처럼 복잡한 기술은 유전체에 직접 새겨 넣기에는 정보의밀도가 너무 높다. 그래서 유전적인 학습 시스템(겉질 등)과 본능(뛰고 싶은 본능, 날개를 퍼덕이고 싶은 본능, 활공을 시도하고 싶은 본능 등)을 내재적으로 부호화하는 것이 더 효율적이다. 아기 새가 한 마리도 빠짐없이 하늘을 나는 법을 배울 수 있는 것은 학습 시스템과 본능이 결합한 교육과정 덕분이다 - P424


댓글(0) 먼댓글(0) 좋아요(3)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

보상함수=의도를 추론한 후, 학습한다!

응과 그의 연구진은 인간 전문가가 이런 곡예비행을 수행하는 동안 리모컨에 입력하는 값을 기록했다. 하지만 AI가 인간 전문가를 직접 모방하도록 훈련하지 않고(이런 방식은 효과가 없었다), AI가 먼저 전문가가 의도한 궤적을 추론하도록 훈련시켰다. 인간이 무엇을 시도하려 했는지 추론하게 한 것이다. 그 다음에는 AI 시스템이 그 궤적을 따르도록 훈련시켰다. 

이런 기술을 ‘역강화학습‘이라고 부르는 이유는 시스템이 먼저 인간 전문가가 최적화하고 있다고 믿는 보상함수 rewardfunction(의도)를 먼저 학습한 다음, 추론한 보상함수를 이용해 스스로를 보상하거나 처벌하면서 시행착오를 통해 학습하기 때문이다. 

역강화학습 알고리즘은 관찰된 행동에서 출발해 자체적인 보상함수를 만들어내는 반면, 표준 강화학습에서는 보상함수가 변경할 수 없도록 하드코딩 hard coding 되어 있을 뿐 학습되지 않는다. 전문가라도 헬리콥터를 조종할 때 계속해서 작은 실수를하고, 그런 실수를 지속적으로 만회한다. 응의 AI 시스템은 먼저 의도된 궤적과 동작을 확인함으로써 조종과 관련 없는 조종사의 오류들을 걸러내는 동시에 자신의 오류를 수정했다. 2010년에 웅의 AI 시스템은 이런 역강화학습을 이용해 자율적으로 헬리콥터를 조종해서 곡예비행를 수행하는 데 성공했다. - P379


댓글(0) 먼댓글(0) 좋아요(2)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

풍요와 뇌 발달

- 하지만 계급사회에서 피지배계층은 풍요에서 배제된다

초기 영장류는 나무 꼭대기에서 직접 과일을 따 먹는 독특한 식생활을한 것으로 보인다. 이들은 과일을 주로 먹는 동물이었다. 과일이 익으면 땅바닥으로 떨어지기 전에 바로 따 먹었다. 이런 방식 덕분에 영장류는 다른 종과 치열하게 경쟁하지 않고도 먹이에 쉽게 접근할 수 있었다. 초기 영장류가이런 독특한 생태적 지위를 통해 얻은 두 가지 선물이 특이할 정도로 큰 뇌와복잡한 사회집단으로 이어지는 문을 열어줬는지도 모른다. 첫째, 과일에 쉽게 접근하면서 초기 영장류는 풍부한 열량을 얻었고, 그 덕에 더 큰 뇌에 에너지를 소비할 수 있는 진화적 선택권이 생겼다. 둘째, 초기 영장류에게 시간적 여유가 많이 생겼다. 어쩌면 이것이 더 중요한 부분이다.
동물의 세계에서 자유시간은 지극히 드물다. 대부분의 동물은 하루하루매순간을 먹기, 쉬기, 짝짓기로 채워야 했다. 46 하지만 초기 영장류는 먹이를구하는 데 다른 동물들만큼 많은 시간을 들일 필요가 없었기 때문에 사회적위계에서 더 높은 자리를 차지하고 싶을 때 구사할 수 있는 새로운 진화적 선택지가 생겼다. 더 강한 근육을 진화시켜 싸움을 통해 꼭대기 자리를 차지하는 대신 더 큰 뇌를 진화시켜 정치공작을 통해 꼭대기에 이르는 방법을 모색한 것이다.
그래서 영장류는 자신의 남는 시간에 정치공작을 채워 넣었던 것 같다. - P340


댓글(0) 먼댓글(0) 좋아요(1)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo