인간의 지능은 뇌의 작동의 산물이다. 인간의 뇌는 860억 개의 신경세포가 무려 100조 개의 신경 연결을 한다. 마치 전기나 복잡한 회로의 배선 같지만 실상 차원이 다르다. 신경에는 전기신호가 흐르지만 신경세포간은 연결하는 시냅스에는 화학물질로 신호를 주고 받는다. 이 화학물질이 수백여가지이고 인간의 신경세포 연결배선은 시시각각으로 바뀐다. 사실상 복잡한 회로를 단순히 복제하는 것만으로는 인간의 뇌를 재생할 수 없다는 이야기다. 이처럼 복잡한 뇌도 최초는 있다. 약 6억년 전으로 지금으로 따지면 벌레 정도 크기의 동물에서 시작했다. 저자는 이런 뇌의 혁신이 5번 일어났으며 우리는 인공지능과의 융합으로 6번째의 혁신을 앞두고 있다고 말한다. 저자는 인공지능의 발달과 뇌의 혁신과정이 다소 비슷함을 잘 드러내고 있는데 이 점도 이 책의 훌륭한 지점이라 생각한다.
1. 생명의 탄생
40억년 전 해저의 열수공에서 뉴클레오티드가 우연히 대거 형성한다. 하지만 워낙 강한 에너지가 분출되는 곳이라 대부분의 뉴클레오티드는 형성과 동시에 거의 파괴된다. 하지만 이중 일부는 운좋게 살아남을 수 있었고 이들 중 일부에서 DNA유사물질이 생성되었다. 이 물질은 스스로를 복제했다. 이런 재생성은 열역학 2법칙에 위배되는 것 같지만 그렇지 않다. 복제와 동시에 자기가 파괴되기 때문이다. 하여튼 이 복제 물질은 떠돌다 우연히 지질방울에 포획되어 안정성을 갖게 되고 이것을 최초의 세포로 본다. 이런 열수공에서의 생명탄생 그리고 물질대사의 생합성의 등장은 트랜스포머에 잘 제시되어 있다.
그리고 리보솜이라는 뉴클레이티드 기반의 분자집단이 특정 서열의 DNA를 특정 서열의 아미노산으로 변환하기 시작하면서 혁명이 시작된다. 단백질은 일단 생성되면 세포내를 떠돌다가 세포의 벽에 박혀 기능한다. DNA를 상대적으로 매우 안정되어 반응성이 없다. 사실 스스로를 유지하고 복제하려면 그래야 할 것이다. 하지만 변화가 없기에 유전자는 주변세계에 대한 감응과 조작 및 대응이 어렵다. 이를 대신할 것이 바로 합성한 단백질인 것이다. 일부 단백질은 감각지각을 했다. 세균조차 이동과 주변세계 감지를 위한 단백질을 갖고 있다. 초기 원시 생명에서 모든 생명의 공통조상이 생겨났는데 이들은 DNA, 단백질 합성, 지질, 탄수화물이 공통 특성이다.
살아 있는 세포는 유지에 많은 비용이 든다. 유전자를 수리하고, 단백질을 보충하고, 세포를 복제해야 한다. 열수공의 수소는 최초의 에너지원이었지만 효율이 매우 낮았다. 이 부분 역시 트랜스포머에 잘 제시되어 있다. 그러다 생명 탄생 후 10억년이 지나서 광합성을 하는 남세균이 등장한다. 이들은 빛과 이산화탄소를 당분으로 전환하여 저장한 후 에너지로 사용했다. 에너지 효율이 매우 높아 광활한 바다는 순식간에 끈적한 미생물 매트로 뒤덮혔다.
그리고 광합성의 폐기물은 산소다. 24억년전 첫 번째 산소대폭발 사건이 발생한다. 자연히 이 독성가스인 산소를 호흡을 통해 에너지원으로 사용하는 세균이 등장한다. 호흡생명체는 산소와 당분을 결합하여 에너지를 생성한다. 당연히 당분이 많이 필요해 적극적으로 움직이며 사냥할 필요가 있었다. 이것이 지능발전의 토대다. 수소를 이용한 무산소 호흡은 산소호흡보다 에너지 효율이 15배가 낮아 생명은 적극적으로 움직이는 것이 불가능했다. 하지만 에너지 효율이 극적 개선되어 적극적 포식이 시작되었다. 먹히는 생물은 당연히 진화상 방어기제가 생겨났고 사냥꾼은 또 다시 이를 극복했다. 이런 식의 군비경쟁이 되먹임 되며 진화는 폭발했다. 그리고 이 과정에서 진핵생물이 최초로 등장한다.
진핵생물은 세균과 비슷하게 취급되지만 완전히 드라다. 세포의 크기가 무려 100배 커졌고, 에너지생산은 1000배에 달한다. 여기에 내부구조는 훨씬 복잡하다. 작은 마을과 대도시급의 차이라 할 정도다. 진핵생물은 다른 세포를 통째로 삼키는 섭식 영양을 했다. 진핵색물을 훗날 오늘날의 식물, 동물, 균류로 분화한다. 이들은 모두 다세포성이다.
그리고 8억년 전 생명은 복잡성에 따라 3단계로 분류된다. 1단계는 단세포 생명체로 세균과 진핵생물이다. 2단계는 소형 다세포 생명체, 3단계는 대형 다세포 생명체다. 이들은 크기에 차이가 있으나 모두 신경세포를 형성했다는 공통점이 있다. 신경세포는 매우 다양하나 본질적으로 동일하다. 균류는 식물보다는 동물과 비슷하다. 양자 모두 산소호흡을 하고 당분을 섭취한다. 먹이를 소화하고 효소로 세포분해하여 그 안의 영양분을 흡수한다.
대형다세포 생물의 당분 섭취 전략은 크게 2가지인데 잡아서 먹는 것과 죽을 때까지 기다리는 것이다. 동물이 선택한 것이 전자이고 균류가 선택한 것이 후자이다. 균류는 체외 소화를 하고 동물은 체내 소화를 한다. 균류는 수조개의 단세포 포자를 형성하고 이들이 휴면상태로 떠 다닌다. 그러다 죽어가는 개체에 우연히 포자가 떨어지면 커다란 균류구조물로 자라나 부패하는 조직 속으로 털같은 섬유를 뻗고 효소를 분비하여 영양분을 흡수한다. 이것이 체외소화다. 그래서 균류는 소화기관이 필요없다.
동물은 잡아먹기에 체내 소화를 하고 위가 필요하다. 그래서 모든 동물은 단세포 수정란 속에서 속이 빈 주머니배가 형성된다. 이것이 안으로 접히면서 작은 위장인 창자 배가 형성된다. 결국 창자배의 형성, 신경세포, 근육은 동물의 세 가지 필수 특성이 된다.
신경세포는 모든 동물이 공통적인 4가지 특성을 보인다.
우선 역치 이하에서는 반응하지 않는다. 역치 이상인 경우 강도와 무관하게 반응한다. 두 번째는 신경세포는 발화율 속도로 정보를 부호화한다는 것이다. 자극이 강할 수 록 세게 반응하는 것이 아니라 자주 발화하는 식으로 반응한다. 세번 째는 자연의 변수는 신경세포의 발화율을 한창 상회한다는 것이다. 신경세포의 발화율은 초당 500회에 불과하다. 하지만 자연의 강도변하는 이를 상회한다. 그래서 신경세포는 이를 압축하여 부호화한다. 결국 신경세포는 자극의 절대치가 아닌 상대치를 발화하여 개체가 외부의 자극의 강도를 인지하게 한다. 마지막은 흥분성 신경세포는 연결된 신경세포를 흥분시키는 신경전달물질을 분비하며 억제성 신경세포는 연결된 신경세포를 억제하는 신경전달물질을 분비한다는 것이다. 이 신경전달물질은 놀랍게도 동일하다.
2. 첫 번째 혁명
지구 상의 거의 모든 동물은 동일 체제를 갖고 있다. 입과, 뇌, 주요 감각기관, 배설물이 나오는 뒷 부분이다. 이런 특징을 가진 동물을 우린 좌우대칭동물이라 한다. 동물은 좌우대칭과 방사형이 있는데 방사형동물은 앞 뒤가 없이 중심축으로 양쪽이 비슷한 방사대칭형이다. 그래서 좌우대칭동물은 입과 배설구멍이 따로 있고 동물의 99%를 차지하며 방사형대칭동물은 입과 배설구멍이 동일한 1개로 동물의 겨우 1%다. 이처럼 좌우대칭이 진화상 압도적 우위를 차지한 것은 동물의 주요 정체성인 움직임이 효율적이기 때문이다. 좌우대칭은 방향의 전환이 빨라 움직이기에 효율적이다. 반면 좌우대칭은 방향의 전환이 매우 어렵다. 그렇기에 방사형대칭동물은 현재도 대개 한 부분에 고착하여 먹이가 오기를 기다린다. 반면 좌우대칭 동물은 적극적으로 움직이며 동물을 사냥하기에 오늘날 대부분을 차지한다. 그리고 움직임은 조종을 의미하며 이는 이를 가능케하는 뇌의 존재를 전제한다.
최초의 좌우대칭동물은 6억 3500만년전에서 5억 3900만년 사이인 에디아카라기에 등장한다.오늘날의 선충이 최초의 좌우대칭동물과 유사할 것으로 추정된다. 예쁜 꼬마선충은 신경세포가 302개에 불과하다. 페트리 접시에 선충과 먹이를 놓으면 선충은 직선이 아닌 원을 그리며 점진적으로 먹이를 향해 나아간다. 선충은 눈이 없고 후각만이 있다. 이들의 움직인 기제는 두 가지다. 냄새가 짙어지면 앞으로 나아가고 얕아지면 방향을 전환한다이다. 이런 식이면 원을 그리고 움직이게 된다. 이것이 조종의 혁신이다.
물론 과거의 세균도 움직이는 단백질이 있었다. 하지만 이건 개별세포가 움직이는 것이다. 수백만 다세포가 움직이려면 차원이 다르다. 세균이면 움직임을 가능케하는 작은 단백질 구조가 있으면 되지만 수백만개의 세포 연합체에는 전체를 움직이게 하는 신경세포와 근육이 있어야 한다.
조종을 하려면 좋은 것과 나쁜 것의 구분이 필요하다. 즉 외부의 자극에 대해서 감정가를 붙여야 한다. 선충엔 감정가 신경세포가 존재한다. 긍정적인 것은 먹이 냄새의 증가고 부정적인 것은 먹이 냄감소나 역치 이상의 온도, 구리 반응이다. 물론 세상은 단순하지 않기에 긍정과 부정은 동시에 나타날 수 있다. 이 경우 맞교환이 일어나는데 이것도 상황에 따라 다르다. 이런 걸 정리해 줄 기관이 필요한데 이것이 최초의 뇌로 보인다. 즉, 뇌는 이런 거대한 감각의 통합센터 역할을 한 것으로 보인다.
어떤 대상에 대한 감정가는 항상 일정하지 않다. 당연히 동물의 내적 상태에 따라 달라진다. 가령 선충은 배가 부르면 이산화 탄소를 회피하지만 배가 고프면 그냥 전진한다. 이산화탄소는 동물, 즉 먹이와 포식자 모두가 내뿜기에 양가적 감정을 불러 일으키는 자극이다. 그래서 배가 부르면 피하지만 배가 고프면 위험을 무릅쓰게 된다.
조종의 4요소가 있다. 좌우대칭형, 감정가 신경세포, 단일 결정을 내릴 뇌, 내적 상태를 바탕으로 감정가를 조절하는 능력이다. 여기서 내적상태는 감정가와 각성수준으로 구성된다. 현대 동물, 특히 인간의 감정은 매우 복잡하고 문화적 영향도 받지만 최초의 감정과 각성은 단순하다. 감정가는 언급한 것처럼 좋은가와 나쁜가, 그리고 각성은 움직이는데 에너지를 사용하는 여부다. 그리고 감정가와 각성의 두 가지 차원의 표현이 정동상태다. 긍정적 감정과 높은 각성은 흥분, 행복, 환희다. 긍정감정과 낮은 각성은 만족, 침착, 이완이다. 부정적 감정과 높은 각성은 불안, 긴장, 당황이고 부정적 감정과 낮은 각성은 우울, 슬픔, 지루함이다.
정동에 대한 의식적 경험은 정동의 원초적 매커니즘 이후 진화했다. 정동은 기본적으로 외부자극으로 촉발되나 자극이 사라진 이후에도 정동상태는 오래도록 지속된다. 실제 인간의 정동상태도 기본적으로 자극에 의해 촉발되지만 대부분 지속된다. 이는 자연의 단서가 지속적이지 않고 확실치 않으며 일시적이기 때문이다. 포식자의 냄새가 잠시 났다가 사라졌어도 탈출하고자 하는 정동상태가 지속되는 것이 났다. 냄새가 잠시 사라졌어도 포식자가 완전히 사라지지 않았거나 근처에 다시 나타날 수 있기 때문이다. 냄새가 사라졌다고 탈출상태가 바로 사라진다면 개체는 매우 위험했을 것이다. 또한 먹이의 경우도 냄개가 사라졌다 해도 탐색상태가 시속되는게 났다. 근처에 다시 나타날 가능성이 높아 계속 탐색하는게 낫기 때문이다.
동물에게 이런 정동상태를 유발하는 신경전달물질이 도파민과 세로토닌이다. 도파민은 긍정적인 감정가를 주는 것을 향하게 하는 것이고 세로토닌은 긍정적인 것을 얻었음을 알리는 물질이다. 즉, 뭔가 근처에서 좋은 일이 일어날 것 같다면 도파민을, 실제 좋은 일이 생기면 세로토닌이 분비된다. 도파민은 근처에 보상이 있을 때 분비되어 각성과 추적의 정동상태를 유발한다. 세로토닌은 보상을 소비하면 분비되어 낮은 각성과 보상 추적 행동을 억제한다. 그래서 긍정감정과 높은 각성시 도파민이 긍정감정과 낮은 각성엔 세로토닌이 부정감정과 높은 각성엔 아드레날린이 분비된다.
도파민은 쾌락을 느끼는 것이 아닌 쾌락의 예상신호다. 도파민을 대상에 대한 좋아함이 아니라 원함이다. 그래서 도파민은 선충이 먹이가 근처에 있지만 아직 먹지 못했을 때 분비된다.
선충의 탈출 정동상태는 노프에피네프린, 옥토파민, 에피네트린 등 다른 신경전달물질로 촉발한다. 이 반응에서 심장박동이 빨라지고 혈관이 수축하고, 동공이 확장하며 수면과 번식, 소화가 억제 된다. 이들은 세로토닌의 효과를 상쇄하여 동물이 쉬고, 만족하는 능력을 감소시킨다. 아드레날린으로 유도되는 탈출반응은 많은 에너지를 소비한다. 탈출을 위해 근육에서 막대한 에너지를 쓰기 때문이다. 그래서 세포에서 포도당이 나오고 세포성장이 중단되며, 소화도 일시 중지되고 번식이 중지되며 면역력도 떨어진다. 이것이 급성 스트레스 반응이다.
이 상태를 해소하는 것이 오피오이드다. 오피오이드는 부정적 감정과 신경세포활동을 억제하며 동물이 부상을 입어도 회복하고 휴식을 취하게 한다. 오피오이드는 진통효과가 있고 완화회복이 마무리될 때까지 번식과 성욕을 억제한다. 완화-회복을 거치면 선충은 폭식을 하여 평소의 무려 300배를 먹는다. 오피오이드 같은 항스트레스성 호르몬은 좋아하는 긍정적 감정가를 끄지만 스트레스 요인이 사라지면 감정가를 되살리며 오히려 도 좋아하게 한다. 그래서 폭식을 하는 것이다.
그런데 스트레스에 선충을 무려 30분 이상 노출시키면 급성스트레스 반응에 빠진다. 그런데 스트레스가 너무 길다보니 탈출을 하여도 소용이 없어 아예 곧 탈출시도를 멈추고 머무르게 된다. 탈출은 매우 많은 에너지를 소모하기에 탈출이 무용하다고 판단되면 버티며 에너지를 온존하는 것이다. 그리고 이는 당연히 생존에 더 유리하다. 그런데 이것이 만성 스트레스 반응과 우울증의 원인이 된다.
만성스트레스는 급성과 비슷하나 각성과 동기부여가 멈춘다. 그래서 만성스트레스 상태에서는 세로토닌이 분비되고 개체가 스트레스 상황에 익숙해지는 무감각 상태에 이른다. 이러면 감정가 반응에 무감각해져서 무쾌감상태에 이른다. 우울 상태에서 나타나는 감정의 공허다. 뇌에 오피오이드가 넘쳐나는 상태가 되면 약 기운이 잦아들때까지 만성스트레스 상태가 된다. 오피오이드 남용자는 완화, 적응, 만성 스트레스의 악순환에 빠져 있기에 기준치로 돌아가려면 더 많은 약이 필요해진다.
연합학습은 모든 좌우대칭동물에게서는 발견되나 방사대칭동물에게서는 발견되지 않는다. 감정가의 등장과 더불어 경험으로 좋음과 나쁨을 변경하는 능력도 함께 등장한 것으로 보인다. 자연은 변화무쌍하여 좋음과 나쁨은 고정되는 것이 아니기에 이 능력은 매우 중요하다. 최초의 뇌는 감정의 연합뿐만 아니라 세상의 규칙에 맞게 연합관계를 신속하게 바꾸는 매커니즘도 학습했을 것을 보인다.
최초의 좌우대칭동물은 획득, 소거, 자발적 회복, 재획득의 기술로 세상을 탐색했다. 연합학습에는 여러 가지 단서가 동시에 주어지는게 문제인데 이를 해결하는 방법은 다음과 같다. 적격성 흔적은 단서와 충격이 시간적으로 밀접한 것이다. 가리기는 단서 중 가장 강한 것 외에는 무시하는 것이며, 잠재적 억제는 과거에 늘 있던 자극은 미래의 연합으로는 억제하는 것이다. 차폐는 일단 단서와 연합이 형성되면 그것과 겹치는 나머지는 단서연합으로 채택하지 않는 것이다.
첫 번째 혁명을 정리하면 신경세포가 구축된 다세포 생물인 동물이 산소호흡을 바탕으로 높은 효율을 위해 에너지가 많이 필요해졌고 적극적인 포식자가 되었다이다. 그리고 이를 위해 빠른 방향전환과 이동을 위해 몸이 좌우대칭으로 진화하며 앞뒤가 생겨나게 되었다. 동물은 사냥과 회피를 위해 주변을 적극 탐색해야 하는데 그러면서 감각기관이 발달했고, 외부 자극의 좋음과 나쁨을 파악하는 감정가가 생겼으며 이에 대한 각성도 생겼다. 이 감각과 각성의 상태가 정동상태로 이를 촉발하는 물질이 도파민, 세로토닌이다. 그리고 외부 주변 환경은 중첩되기에 이를 종합적으로 판단할 뇌가 필요했다. 그리고 학습은 연합학습의 차원에 머물렀다.
3. 두 번째 혁명
캄브리아기는 생명체가 대폭발한 시기다. 책 눈의 탄생은 캄브리아기 생명체 대폭발의 원인으로 최초로 등장한 눈을 지목한다. 서로를 볼 수 있게 되며 포식작용이 활발해지고 이를 피하기 위해 반대측도 눈을 개발하였다. 그리고 더욱 서로를 향해 더욱 빠르게 이동하고 강한 무기와 방패를 개발하며 군비경쟁이 일어나고 이것이 캄브리아기 대폭발로 이어졌다는 논지다. 에디아카라기에서 5천만년 후가 캄브리아기다. 이 시기는 거대한 절지동물의 시기다. 그리고 초기좌우대칭동물과 비슷하고 약간 큰 어류와 비슷한 존재도 등장했다 이들은 등골뼈가 있었고 절지동물과 완전히 다르다. 이들에게서 척추동물의 뇌원형이 만들어진다. 이 초기 뇌는 전뇌, 중뇌, 후뇌의 구조다. 전뇌는 훗날 겉질과 바닥핵으로 중뇌는 시상과 시상하부, 후뇌는 그대로다.
숀다이크는 처음에 동물이 모방을 통해 학습한다고 생각해지만 실험결과 동물은 시행착오로 학습을 했다. 동물은 무작위로 행동을 한 후 확인된 감정가 결과로 자신의 행동을 조정하여 학습했다. 이것이 강화학습이다. 그런데 마빈스키는 인공지능을 강화학습으로 구축하자 시차를 두고 신뢰를 할당할 수 있는 합리적인 전략이 없으면 강화학습이 효과가 없다는 것을 발견한다. 이를 시간적 신뢰할당의 문제라 한다. 서튼은 그래서 강화학습에 기대를 도입한다. 실제 보상으로 행동강화가 아닌 예측되는 보상으로 행동이 강화한다는 것이다. 행위자가 학습하는 신호는 보상 그 자체가 아니라 어느 순간과 다음 순간 사이에 예측되는 보상의 시간적 차이다. 이것이 시간차 학습이다. 그래서 서튼은 시뮬레이션에서 행위자와 비평가를 동시에 훈련시키면 자력으로 강화가 된다고 추정하였다. 그리고 이는 1990년대에 데사우가 이 방식으로 프로그램을 개발하면서 입증된다.
생물에게 이런 강화학습을 일으키는 신경전달물질이 도파민이다. 도파민은 기대하지 않은 보상이 제기되는 경우 증가하고 기대한 보상이 누락하면 감소한다. 그래서 도파민은 보상의 신호라기 보다는 강화의 신호다. 시간적 신뢰할당 문제를 해결하려면 뇌는 실제 보상이 아니라 예측되는 미래 보상의 변화를 바탕으로 행동을 강화해야 한다. 시간차 학습 신호는 어류, 쥐, 원숭이, 인간에게서 발견된다. 선충을 비롯한 단순 좌우대칭동물은 이것이 없다. 서로 분화 후 진화했다는 증표다.
초기좌우대칭동물에게 도파민은 주변에 좋은 것이 있다는 신호였다. 척추동물에게는 이것이 전환하여 원함의 상태를 촉발하고 시간차학습을 일어나게 하는 것으로 바뀌었다. 즉, 도파민은 단순히 근처에 좋은 것이 있다는 막연한 신호에서 10초 후 멋진 일이 일어날 확률이 35% 정도 된다라는 식으로 전환한 것이다. 최근에 감지했던 먹이에 대한 애매한 평균에서 정교하게 측정하고 꼼꼼히 계산하며 끝까지 요동치는 예측되는 미래 보상 신호로 용도를 변경한 것이다. 실망과 안도 역시 미래 보상을 예측해서 학습하도록 설계된 창발적 속성이다. 보상과 처벌 뿐만 아니라 기대했던 보상이나 예상했던 처벌의 누락도 학습을 가능하게 한다.
시간차 학습의 전제조건은 당연히 시간의 측정이다. 척추동물의 시간 측정은 매우 정확하다. 민달팽이나 편형동물같은 단순한 좌우대칭동물은 시간 사이의 정확한 측정을 하지 못한다. 당연히 시간차학습도 불가능하다.
강화학습을 가능하게 하는 뇌의 진화는 바닥핵과 시상하부다. 바닥핵으로 들어오는 입력은 걸질, 시상, 중간뇌에서 온다. 그리고 미로 같은 하부구조를 거쳐서 바닥핵의 출력핵에 도달한다. 출력핵은 수천에서 수백만개의 억제성 신경세포로 구성된다. 뇌줄기 운동중추로 강력한 연결을 많이 내고 기본적으로 항상 활성화되어 있다. 뇌들이 운동회로들의 관문은 지속적으로 바닥핵으로 인해 억제되고 있다. 바닥핵의 특정 신경세포들이 꺼졌을 때만 뇌줄기에서 특정 회로들의 관문이 열리면서 활성화한다. 파킨슨 병 환자의 증상도 바닥핵의 붕괴로 인해 일어난다. 바닥핵은 동물의 행동과 외부환경 그리고 도파민 신경세포 그룹에서도 입력을 받는다. 바닥핵은 도파민 분비를 극대화하는 행동을 반복하도록 학습한다. 즉, 행위자의 역할을 한다.
시상하부에는 좌우대칭 동물의 감정가 감각장치에서 유래한 감정가 신경세포가 존재한다. 시상하부는 바닥핵으로 도파민을 전달하는 도파민 신경세포그룹과 연결되어 있다. 그래서 시상하부가 행복하면 바닥핵은 도파민을 증가하고, 불행하면 도파민이 떨어진다. 즉, 시상하부는 비평가 역할을 한다.
이 시기엔 척추동물은 패턴인식도 익혔다. 수억년간 동물은 패턴화 능력이 없어 지각의 감옥에 갇혀 있었다. 모든 척추동물은 신경세포의 패턴을 해독해서 사물을 알아본다. 50가지의 후각신경세포로 표현가능한 패턴은 무려 100조개 이상이다. 패턴화를 위해서는 일반화와 식별이 필요하다. 지도학습은 자료를 많이 주고 정답을 알려준다. 그 다음 출력이 실제와 가까워지는 방향으로 인공신경망이 가중치를 조정하여 정답에 가까워진다. 하지만 뇌는 누가 정답을 알려주지 않는다. 즉, 지도학습을 하지 않는다.
단순한 척추동물의 뇌 겉질은 3층 구조다. 최초의 겉질에서 피라미드 신경세포가 출현한다. 피라미드 신경세포에는 수백가지의 가지 돌기가 있어서 수천 개의 시냅스로부터 입력을 받는다. 이것이 패턴인식을 목적으로 설계된 최초의 신경세포다. 후각신경세포는 자신의 신호를 겉질의 피라미드 신경세포로 보낸다. 넓은 범위의 차원 확장이 일어나 소수의 후각신경세포가 훨씬 더 많은 겉질신경세포와 연결된다. 그리고 후각신경세포 하나는 겉질 세포의 한 부분 집합에만 연결된다. 이로 인해 포식자와 먹이의 냄새가 겹쳐도 입력받은 겉질 신경세포가 달라져 입력 정보가 겹쳐도 활성화 패턴이 달라질 수 있다.
척추동물은 뇌가 자동연합으로 내용주소화 기록장치를 사용한다. 경험의 부분집합으로 원래의 패턴을 다시 활성화하여 기억하는 회상 방식이다. 이 방식은 다른 유형의 요인으로 인해 간섭이 일어나나 기존의 학습한 것을 유지한 채 새롭게 학습하는 것이 가능하다. 반면 컴퓨터는 레지스터 주소화 기억장치로 기억을 저장할 고유 메모리가 필요하다. 간섭은 일어나지 않지만 그래서 새로 학습하면 기존 학습이 파괴되는 망각이 생긴다. 그래서 오늘날의 인공지등 역시 이러한 문제를 고스란히 갖고 있어 이어서 학습하는 것이 아니라 한번에 학습하고 멈춘 후, 나중에 다시 학습한다. 그래서 버전이 아예 달라지는 것이다.
척추동물은 불변성 문제도 해결해야 했다. 인공지능은 초기 개발시 갖은 고양이의 사진이지만 앞과 뒷 모습을 보면 다른 물체로 판단했다. 하지만 양자는 동일하며 동물은 이 문제를 해결해야 했다. 이는 생각보다 쉽지 않은 문제인데 갖은 사물이더라도 방향, 거리, 위치에 따라 다른 감각자극을 생성하기 때문이다.
그래서 포유류의 시각처리는 위계구조를 갖는다. 낮은 수준에서는 수용야가 좁고, 모서리나 선등 단순특성만을 본다. 그리고 높은 위계로 갈수록 수용야가 커지며 더 복잡한 물체를 알아본다. 위계가 같은 수준에 속한 신경세포들은 서로 반응하는 위치만 다르지 비슷한 특성에 반응한다. 이것이 합성곱신경망이며 이를 통해 불변성 문제를 처리한다. 그리고 현재 인공지능의 이미지 식별도 이런 방식으로 가능하다.
언급한 강화학습은 활용탐색 딜레마가 있다. 활용은 보상을 향한 활동이고, 탐색은 아직 알려지지 않은 보상을 향한 행동이다. 이는 모순된다. 즉, 강화학습은 실제 주변에 뭔가가 있다는 단서가 주어질때만 이뤄지는 셈인데 이런 방식으로만 활동한다면 먹이감을 찾거나 제대로된 회피가 어렵다. 그래서 진화한 것이 새로운 것을 찾고자 하는 성향이고 그것에 대한 보상인 호기심이다. 모든 척추동물은 호기심을 보유하고 있으며 무척추동물은 곤충, 문어, 오징어 같은 두족류만이 그것을 갖고 있다.
최초의 척추동물은 바깥 세상에 대한 내적 모델도 구축해야 했다. 그래서 대부분 공간지도 학습능력이 있다. 속귀에는 액체로 가득찬 반고리관이 있는데 반고리관에는 앞, 옆, 뒤를 향하는 3개의 고리가 있다. 이것들이 액체로 가득차서 움직임에 따라 활성화한다. 계속돌면 이동이 활성화하고, 멈추면 활성화가 끝나야 하지만 관성으로 인해 활성화가 다소 지속된다. 그래서 크게 지속해서 돌다가 갑자기 멈추면 어지러운 것이다. 이를 통해 척추동물은 안뜰감각을 생성하며 이를 통해 공간지도를 형성한다.
두 번째 혁명을 정리하면 캄브리아기 초기척추동물은 단순 감정가와 반응으로 이어지는 좌우대칭동물의 연합학습을 넘어 강화학습을 시작했다. 강화학습을 위해서 바닥핵과 시상하부고 서로 도파민을 통한 시간차 학습을 시작했으며 이를 더 잘 촉발시키기 위해 호기심이 진화했다. 주변 세계를 더 잘인식하기 위해 패턴화를 하기 시작했고, 공간에 대한 내적모델을 발생시켰다.
4. 세 번째 혁명
두 번째 혁명으로 성공적으로 진화한 초기 어류는 바다를 가득 메웠다. 4억 2천만년전에서 3억 7천 5백만년인 데본기다. 캄브리아기를 장악했던 절지동물과 무척추동물은 강한 시스템으로 무장한 이들에게 밀려났다. 살아남는 방법으로 두족류는 다른 방식으로 지능을 진화시켰고, 절지동물은 바다에서 탈출하여 최초의 육상동물이 되었다. 데본기에는 식물이 육상으로 진출한다. 무주공산이라 이파리와 씨앗을 진화시켜 크게 번성한다. 초기 작았던 것이 데본기 말에는 키가 30m에 육박할 정도였다. 이들은 토양을 만들어내어 절지동물이 살만한 장소를 생성했다. 이들이 산소를 대거 생산했으나 육상엔 이를 소비할 만한 주체가 없어 불균형이 발생한다. 온실가스의 큰 감소로 인해 빙하기가 도래한다.
어류는 밀물과 썰물시 육상에 고립될 우려로 대개 바다한가운데 살았다. 하지만 해안근처에는 영양이 항상 밀려들고 햇빛이 강해 먹을거리가 많았다. 어류 중 일부가 이 틈새를 노리고 육상으로 진출한다. 이들은 초기 조수간만때 형성된 웅덩이 사이를 뛰어다니며 생존하였고 점차 아가미를 폐로, 지느러미를 사지로 진화시킨다. 이것이 최초의 양서류와 양막류다. 포유류의 조상은 양막류로 물외에서 견디기 위해 가죽같은 껍질이 있는 알을 낳았다. 양막류는 3억 5천에서 2억 5천만년 사이 생태적 지위를 차지해 크게 진화한다. 지상은 수중과 다르게 온도변화가 극심하다. 양막류는 이에 대한 대응으로 두 가지로 분화한다. 하나는 기온이 낮아질 시 활동을 멈춰버리는 파충류이고 다른 하나는 기온이 낮아져도 체온을 높여 움직임을 가져가는 수궁류다. 수궁류는 온혈성으로 항상 몸을 데우기에 많은 열량이 필요하다. 수궁류는 항상 움직일 수 있기에 춥거나 밤이 되면 멈춰버리는 파충류를 마음껏 사냥할 수 있었다.
2억 5천만년 전 페름기-트라이아스기 멸종이 일어난다. 500-1000만년 간 해양생명의 96%, 육상생명의 70%가 멸종하는 사건이다. 먹이가 많이 필요했던 대형수궁류는 견디지 못했으며 오히려 움직임이 적어 먹이가 덜 필요한 파충류가 생존에 유리했다. 수궁류 중 땅을 파고 견과류를 먹는 견치류만이 살아남게 된다. 파충류는 이 위기를 넘기고 생태적 위치를 차지해 대형화하여 공룡으로 다양하게 진화한다. 하지만 이들은 다양한 신체구조와 크기를 갖게 되었으나 뇌는 거의 진화하지 않는다. 그래서 파충류의 뇌는 오늘날도 어류와 크게 차이나지 않는다.
이 견치류가 초기 포유류가 되는데 뇌가 진화하여 새로운 겉질이 생겨난다. 이는 바로 시뮬레이션을 하는 능력이다. 시뮬레이션의 전제조건은 멀리 볼 수 있는 시력과 온혈성이다. 시뮬레이션의 뇌가 폭발적으로 기능해야 하는데 이러려면 항상 체내 온도가 높아 많은 열량이 공급되며 신경이 빠르게 전달되어야 하기 때문이다.
초기 포유류의 겉질은 3개에서 4개로 분화한다. 바닥핵은 후각겉질과 해마, 편도체로 분화하여 새겉질의 입력 정보를 통합해 도파민을 분비하게 되었다. 시상하부는 감정가, 도파민 등 신경전달물질을 분비했다. 중간뇌와 뒷뇌는 반사행동을 담당했다. 그리고 새 겉질은 뇌의 극히 일부로 시뮬레이션 등 이시기 새롭게 생겨난 기능을 담당했다.
새 겉질은 이 시기엔 매우 작았지만 오늘날에는 인간뇌의 70%를 차지할 정도로 절대적이 되었다. 새 겉질은 두께가 2-4mm로 불과하다. 하지만 뇌는 두개골에 갇혀있어 커지는데 한계가 있지만 커져야 했기에 표면적을 늘리기 위해 주름졌다. 이를 모두 펴면 작은 책상 넓이 정도가 된다. 새겉질은 미세회로의 반복과 복제다. 새겉질 기둥이 빽빽히 모여있는 형태인 것이다. 그래서 놀랍게도 새겉질 영역이 본질적으로 동일해 서로 대체가 가능하다. 시각 겉질과 청각 겉질이 서로 교환 가능한 것이다. 새 겉질의 신경세포는 6층으로 구성된다. 이들은 특정 계산 수행을 위해 특정 방식으로 배선된다.
새 겉질은 다음가 같은 지각특성을 갖는다. 빈 부분의 채워넣기다. 그래서 인간은 완전한 삼각형은 아니지만 삼각형의 형태를 어느 정도 가진 형태를 보면 삼각형으로 인식한다. 다음은 다양하게 보이는 것을 한 번에 하나만 보는 것이다. 그림 중 소녀나 마녀로 보이는 것이나 토끼나 오리로 보이는 것들이 있는데 인간은 이를 둘다 인식할 수 있지만 한 번에 하나만 된다. 그래서 토끼로 볼 때는 토끼로만 보이다 다시 오리로 보려 노력하면 오리로만 보인다. 동시엔 되지 않는다. 마지막은 애매한 것을 특정한 것으로 인식하면 이후 그것으로만 보인다는 것이다. 개구리의 사진을 흑백으로 처리한 것을 보면 처음엔 다양하게 보인다. 그런데 이후 컬러로 그 음영이 개구리의 사진인 것을 확인하면 이후에는 놀랍게도 다양하게 보이던 그 음영이 개구리로만 보인다.
새겉질의 특성은 바로 시뮬레이션을 위한 다양한 생성이다. 조류와 포유류만이 잠을 자는 동안 꿈을 꾸는데 이는 생성 때문이다. 새겉질은 인식과 생성을 항상 하는데 이는 균형을 이뤄야 한다. 하지만 깨어있는 동안은 감각자극이 계속되기에 인식이 우위인 상태다. 그리고 인식과 생성은 동시에 일어날 수 없다. 그래서 포유류는 잠을 자는 동안 생성을 하게 된다. 포유류는 수면 장애를 겪게 됨녀 상당한 지각 장애가 일어난데 이것이 바로 인식과 생성의 불균형 상태로 보인다.
새겉질은 실제 입력 감각 데이터와 시뮬레이션 예측 데이터를 끊임없이 비교한다. 그래서 예상치 못한 변화를 빠르게 지각하고 수정한다. 예측은 좌우대칭동물인 경우 자극에 대한 반사를 했기에 매우 낮았고, 초기 척추동물의 경우 미래에 대한 보상에 대한 강화학습으로 나아갔기에 역시 미약했다. 하지만 초기 포유류는 모든 감각 데이터를 바탕으로 새 겉질이 시뮬레이션을 했기에 진정한 예측을 하기 시작했다고 볼 수 있다. 그리고 이 시뮬레이션으로 포유류는 상상이란걸 할 수 있게 되었다. 시뮬레이션 자체가 상상이다.
시뮬레이션은 3가지 큰 이점이 있다.
우선 대리 시행착오다. 실제 착오는 몸의 손상이나 영구적 절멸로 이어질 수 있다. 이를 대리로 해볼 수 있다는 것은 생존에 큰 장점이다. 다음은 반사실적 학습이다. 자극에 대한 반응, 그리고 강화학습은 실제로 무언가를 해야만 이뤄진다. 그리고 그 행동은 반드시 최적이라 볼수도 없다. 한 경로로 이동하는 것을 통해 먹이를 발견한다면 그것은 강화학습으로 이어진다. 하지만 그것이 반드시 최적이진 않다. 다른 최적경로도 있을 수 있지만 강화학습은 앞선 학습만을 개체에게 수행하게 한다. 가위바위보를 예로 들면 강화학습에 머무른 어류는 가위를 내서 지면 최적의 수는 다음에 바위를 내는 것이지만 보나 바위 두개를 다 내게 된다. 하지만 포유류는 이것을 되새기기에 반드시 보를 낸다. 즉, 시뮬레이션은 과거에 대한 되새김, 반사실적 학습을 가능하게 한다. 신뢰할당의 경우 초기 좌우대칭 동물은 차폐, 잠재적 억제, 가리기 등의 기본 규칙으로 신뢰를 할당한다. 초기 척추동물은 비평가가 미래 보상의 변화 예상 시점으로 신뢰를 할당했다. 그리고 초기 포유류는 반사실적 학습을 바탕으로 신뢰를 할당한다. 앞선 사건이 일어나지 않았다면 그 후의 사건이 일어날지 아닐지를 판단하는 인과를 알게 된 것이다. 마지막 이점은 일화기억이다. 시뮬레이션을 하려면 과거 사실을 기억해야 한다. 하지만 완벽한 실제 기억은 아니고 재창조한 것이다. 그래서 비운 부분을 채우기에 매우 부정확하다. 포유류의 뇌에서 일화기억은 새겉질과 해마가 협력한다.
모든 포유류의 새겉질은 두 부분으로 나뉜다. 뒤쪽 절반은 시각, 청각, 몸감각을 담당하는 감각 새겉질이다. 앞쪽 절반은 이마엽 세겉질로 세 가지로 나뉜다. 운동 겉질, 과립이마엽겉질, 무과립이마엽겉질이다. 과립세포는 새겉질 기준의 4층에 분포하며 과립이마엽겉질은 초기 영장류에서 진화했다. 그래서 최초의 포유류의 겉질은 무과립이마엽겉질(aPFC)이다.
감각새겉질의 기둥에는 감각기관의 입력이 주로 들어온다. aPFC에는 해마, 시상하부, 편도체의 입력이 들어온다. 이는 aPFC가 감정가, 장소, 정동상태를 처리함을 암시하며, 바닥핵이 주도하는 선택도 감시함을 의미한다. 예를 들어 시상하부가 특정하게 활성화되어 물을 먹으러 가면 aPFC는 이 행동이 물을 목기 위함이라고 학습한다. 이렇게 aPFC는 바닥핵의 행동촉발 전 동물의 행동이 예측가능하다.
감각 새겉질은 감각기관에서 입력을 받아 세계에 대한 모델을 형성한다. 그래서 외부의 사물에 대한 예측을 한다. 반면 이마엽 새겉질은 자기 모델을 형성한다. 해마, 시상하부, 편도체에서 입력을 받아 감정가나 정동상태로 이뤄지는 것들에 대한 설명이나 이유를 만들어낸다. 이렇게 외부와 내부에 대한 모델이 구축되어야 시뮬레이션이 가능하다.
개체는 특정 상황에서 가만이 있건, 행동을 하거나, 고민한다. 바로 이 고민하는 경우 aPFC가 활성화한다. 그래서 aPFC가 세운 기준이 대안을 제시한다. 그러면 이 대안을 감각새겉질이 시연하면 aPFC가 이를 검토하여 바닥핵을 활성화시켜 행동으로 이어지는데 이게 시뮬레이션이 진행되는 과정이다.
하지만 개체는 모든 것을 고민하지 않는다. 이 자체가 최적의 판단으로 이어질 수 있지만 시간과 에너지 낭비가 심하다. 그래서 많은 것들은 단순 자극으로 인해 그냥 촉발된다. 이것이 바닥핵이 직업 통제하는 행동으로 이 경우 시뮬레이션이 행해지지 않는다. 습관이나 무의식이라 볼 수 있다. 감각새겉질은 그저 감각입력을 바탕으로 설명하고 예측하는 수동추론을 하지만 aPFC는 생성모델을 구현하고 예측하는 능동추론이다. aPFC는 이렇게 개체가 자신의 행동을 설명하고 예측을 통해 행동자체를 변화한다. 이것이 지금 우리가 자유의지라 부르는 것의 기반이다. 여러 대안을 고민하고 선택하는 것이다.
aPFC에는 4번층이 없는데 이 부분은 감각입력을 토대로 하는 것이다. 하지만 시뮬레이션에서 감각입력에 의존하는 것은 크게 필요치 않으므로 초기엔 4번층이 있었지만 시뮬레이션이 강화하며 퇴화한 것으로 보인다.
운동겉질은 이마옆새겉질의 가장 자리의 얇은 띠다. 이는 몸전체의 운동을 관장한다. 다만 신체마다 동일할당은 아니다. 많은 사용하는 손과 입에 대한 할당은 크나 발에 대한 할당은 적다. 운동겉질의 이 할당은 뒤에 붙은 운동감각겉질에 동일하게 배당된다. 운동겉질로 인한 마비는 영장류만 일어난다. 이는 운동겉질이 자신의 예측을 실현하며 배선되었기 때문이다. aPFC가 동물이 왼쪽으로 방향을 전환한다고 예측하면 운동겉질이 동물이 왼발을 정확히 어느 발판에 닫는다고 예측한다. 이것이 체화다. 운동겉질은 운동명령을 단순히 만드는 장소라기 보다는 운동을 계획하는 장소다. 운동겉질의 감각운동 계획 수립으로 인해 초기 포유류는 정교한 움직임을 학습하고 수행한다. 그래서 포유류가 나무위에서 빠르게 움직이는게 가능하며 파충류는 이게 안되기에 나무위 생활이 거의불가능하다.
이 겉질들은 위계를 갖는다. aPFC가 개체로 하여금 잘 익은 과일을 따먹기 위해 한 나무에서 다른 나무로 이동한다는 상위목표를 수립하면 운동앞겉질이 큰 동작을 수행하기 위한 목표를 잡고, 운동겉질이 특정 팔다리, 몸통, 눈의 움직임을 게획하는 형태다. 그리고 이들은 이 가정에서 목표를 촉발하기도 하고 목표를 수정하기 위해 바닥핵과 계속 소통한다. 새로운 행동을 학습하려면 이 모든 수준의 위계가 활성화하나 특정 행동이 학습되면 매우 낮은 수준의 위계만 활성하한다. 자전거를 처음탄다면 모든 위계가 강하게 켜져있겠지만 자전거 타는 법을 학습하면 아마 운동겉질만 미약한 수준으로 활성화될 것이다.
세 번째 혁명은 육상동물의 탄생에서 시작되었다. 이들은 뇌는 더욱 진화시켜 세상을 예측하는 시뮬레이션 시스템인 새겉질을 탄생시켰다. 새롭게 생겨난 aPFC는 다른 겉질들과 연합하여 세상에 대한 모델을 만들고 자신의 모델을 만들어 시뮬레이션을 적극 실행한다. 이는 뇌의 강력한 기능을 요구하기에 동물은 온혈동물이 될 수 밖에 없었다.
5. 4번째 혁명
6500만년 전 소행성이 충돌한다. 지구는 2년간 먼지에 뒤덮혔고 조류를 제외한 공룡 대부분이 멸종한다. 포유류가 생태적 지위를 차지해 크게 진화하게 된다. 인간의 직계 조상은 아프리카의 키큰 나무위에서 진화한 동물이다. 이들은 야행성에서 주행성으로 진화하였고 몸이커지며 나무에서 체중을 지탱하기 위해 엄지가 발달한다. 주식은 곤충에서 과일로 바뀌었고 집단을 이뤘다. 이렇게 집단을 이루자 먹이 경쟁이 커졌고 이를 감담하기 위해 뇌가 커진 것으로 보인다.
지금까지 뇌의 향상과 커짐은 생태적 요구가 강요했다. 하지만 처음으로 사회적 요구가 이를 수행한다. 실제 영장류는 사회집단의 크기가 제각각인데 사회집단의 규모가 큰 영장류일수록 새겉질이 커진다. 집단생활은 이점과 비용이 있다. 이점은 먹이를 얻는 것의 수월함, 짝은 찾는 것의 수월함, 포식자에 대한 저항과 생존 등이다. 비용은 모두 모여 있기에 상호간의 경쟁과 충돌이 자주 발생한다는 것이다. 그래서 집단생활을 하는 개체는 그 비용을 낮추기 위해 힘과 복종을 알리는 매커니즘이 필요하다. 이것이 없다면 강한 개체든 약한 개체든 물리적 충돌을 하게 되고 이는 양자에게 치명적 부상이나 죽음으로 이어지는 큰 비용을 초래하기 때문이다. 힘과 복종을 알리는 매커니즘은 송곳니를 보이거나 으르렁거리기 위협하기 등이며 복종도 시선을 회피하거나 수그리는 행동등이다.
포유류 계통은 4가지 생활방식을 보이는데 단독생활, 짝 결합, 하렘, 다중 수컷 생활이다. 이중 하렘과 다중수컷생활이 집단형태다. 영장류는 집단을 이루는 경우 위계를 세우지만 항상 몸집이 크게 힘이 강한 수컷이 집단의 우두머리가 되진 않는다. 영장류 집단은 소위 정치를 하기 때문이다. 그래서 동맹이 중요하며 지위가 높은 가문일 수록 항상 동맹을 중시하고 강한 개체와 동맹을 한 하위개체 역시 이를 통해 자신의 지위를 상대적으로 높이는게 가능하다.
초기 영장류는 나무의 과일을 독차지한 것을 보인다. 풍부한 열량에 시간적 여유가 있기 때문이다. 이런 상황은 정치공작을 위한 뇌크기 향상을 가져왔다. 실제 오늘날의 영장류는 하루 시간의 무려 20%를 사고활동에 투자한다. 그래서 7천만년전 초기 포유류의 뇌의 크기는 0.5g에 불과하나 1천만년전 초기 영장류의 뇌크기는 350g으로 커진다.
초기 영장류의 뇌에는 과립이마엽새겉질(gPFC) 생겨난다. 그리고 몇몇 감각새겉질 영역을 합친 측두두정접합도 생성된다. gPFC는 자신의 성격평가, 자기와 관련된 마음 방랑등 전반적으로 자기 자신에 대한 생각을 할 때 활성화한다. gPFC는 과거든 미래든 자신이 만든 시뮬레이션 외에도 의도, 느낌, 생각, 성격, 지식 등 자신을 투사하는 능력이다. 즉, 자기 성찰 능력인 것이다. aPFC가 편도체, 해마에서도 입력을 받은 것과 달리 gPFC는 오로지 aPFC에서만 입력의 대부분을 받는다. 즉, 자기 의식에 대해서 피드백을 하는 메타인지인 것이다.
gPFC는 이렇게aPFC와 감각 새겉질에 대한 생성모델을 구축한다. aPFC가 의도, 자유의지, 즉, 의식을 만들었다면 gPFC는 그것을 성찰하는 메타인지, 마음을 만든 것이다. 개체가 길을 가다가 왼쪽으로 도는 이유는 초기좌우대칭동물은 반사작용으로 왼쪽에서 먹이 냄새가 났기 때문으로 설명하며 초기 척추동물은 왼쪽으로 도는 것이 미래 보상을 극대화하기 때문으로 설명하며, 초기 포유류는 왼쪽에 먹이가 있으니까라고 설명하며 영장류는 내가 배가 고프고 먹으면 기분이 좋아지는데 왼쪽에 내가 예상하는 한 먹을 것이 있으니까라고 설명하는 식이다.
영장류에서 gPFC가 클수록 사회적 위계에서 그 지위가 높은 경향이 있다. 그리고 gPFC로 인해 영장류는 마음이론이 가능하다. 다른 사람의 행동을 시뮬레이션 하여 타인의 의도를 이해해야 사회적 위계에서 유리하기 때문이다. 그리고 마음이론은 놀랍게도 학습에도 유용하다. 타인의 의도를 이해햐아 효율적 기술 전수가 가능하다. 상대방은 가르치는 과정에서 상당히 많은 행동을 하는데 이중에서 그의 의도를 파악해야 가르치고자 하는 부분에 집중할 수 있기 때문이다. 그리고 학습자가 오랜 시간 집중을 가능하게 하며 가르치는 자 역시 마음이론을 통해 학습자가 모르는 부분을 잡아내고 이것에 집중할수 있기 때문이다.
즉, 마음이론은 초기 영장류의 정치공작을 위해 주로 사용되었지만 모방학습으로 기능이 확장한 것이다. 그리고 이를 통해 영장류는 세대를 넘어선 기술의 이전과 그 축적 및 발전이 가능해졌다.
4번째 혁명은 사회성으로 촉발되었다. 영장류는 집단생활을 시작했고 정치공작을 위해 뇌가 커지게 되었다. gPFC가 생성되어 개체는 자기 자신에 대한 시뮬레이션에 대한 평가가 가능하게 되었다. 이는 고도로 미래를 예측하는 능력이 된다. 그리고 마음이론이 생겨났다. 자신에 대한 예측을 넘어서 타인에 대한 예측을 하게 되었고 이로 인해 정치행위가 더욱 고도화 된다. 마음이론으로 인해 영장류는 학습이 가능하게 되었고 이로 인해 기술의 세대이전도 가능하게 된다.
6. 5번째 혁명
마지막 혁명은 언어로 촉발되었다. 인간의 언어는 동물의 의사소통과 다르다. 우선 선언적 명칭인 기호를 사용하고, 문법이 존재한다는 점이다. 언어로 인해 인간의 자신의 내적 시뮬레이션과 성찰의 결과를 전례없이 유례없이 구체적이고 유연하게 전달이 가능하게 되었다. 그리고 언어로 인해 뇌가 학습하는 자료의 범위가 크게 확장한다
학습은 사실상 초기 척추동물부터 시작한다. 초기 척추동물의 학습자료는 자신의 실제행동이었다. 그리고 초기 포유류는 시뮬레이션을 했기에 자신이 상상한 행동이 학습자료였다. 초기 영장류는 정신화가 가능하여 다른 사람의 실제 행동도 학습자료가 되었다. 이제 언어를 사용하는 초기 인류는 다른 사람의 상상한 행동마저도 학습자료가 된다.
자신의 상상속에서 본 것을 공유하여 공통신화가 완성되고, 완전히 상상으로 만들어진 허구의 존재와 이야기가 전달가능하게 되었다. 공통의 신화는 직접 관계를 맺지 않는 타인도 조종 및 협력이 가능하게 하였으며 이로 인해 인간의 사회적 응집시스템과 그 규모는 상상을 초월하게 되었다. 이는 유발하라리가 사피엔스와 호모데우스에서 잘 제시한다. 언어는 정보를 응축하여 뇌에서 공간을 덜 차지하고 뇌에서 뇌로 신속하게 이를 전달한다.
언어로 인한 학습이 가능하게 되며 아이디어가 축적되어 이를 인간의 개별 뇌에 저장하는데 한계에 봉착하게 된다. 이를 해결하는 방법은 4가지다. 뇌를 더 크게 하는 방법이나 이는 자연적 한계와 속도에 부딪힌다. 진화는 아주 빠르진 않다. 다음은 집단 내 인간의 역할 세분화다. 각각의 전문지식과 기술을 보존하는 사회내 전문가 집단을 형성하여 유지 발전하는 것이다. 다른 방법은 인구 집단이 커지게 하는 것이다. 그러면 개별 뇌의 수, 즉 저장장치가 늘어나 유지할 수 있다. 마지막으로 가장 좋은 방법은 언어에 대응하는 문자를 발명하여 이를 기록 저장하는 것이다. 인간 집단은 이 4가지를 모두 사용하지만 가장 결정적인 것은 문자다. 실제로 문자가 없는 인구 집단의 경우 그 크기가 줄어들면 세대를 거치며 지식의 양이 감소하는 것으로 나타났다. 결국 언어와 문자의 등장은 인류 역사의 큰 변곡점인 셈이다.
인간은 언어를 사용하며 뇌가 변화했을 것이다. 브로카 영역이나 베르니케 영역이 언어와 관련이 깊어 보이나 최근의 연구는 언어가 이 지점에만 의존하지 않는 것을 보인다. 실제 언어와 관련이 깊은 좌반구가 없이 우반구만으로 언어의 학습이 아이들의 경우 가능하며, 인구의 10%는 언어에 우뇌를 사용한다. 즉, 언어는 뇌의 특정 영역에도 의지하나 전반적으로 관련한다고 보는 것이 타당해보인다.
1천만년 전까지 아프리카는 빽빽한 밀림으로 풍요로웠다. 그러다 지각변동으로 동아프리카 지구대가 생겨나며 서와 동이 분리된다. 서는 이전의 환경을 유지했으나 동쪽은 건조해져서 밀림이 사바나로 변한다. 여기서 침팬지와 우리의 조상이 분기한다. 서쪽은 침팬지 동쪽은 인간의 조상이 된다. 사바나가 되자 나무가 적어져 지상생활을하게 되었고 주식도 과일에서 육식을 시작한다. 초기엔 지능과 힘이 미약해 간단한 석기를 제작하여 사체를 처리했던 것을 보인다. 석기 덕에 육식동물이 남긴 사체의 골수섭취가 가능했다.
그러다 50만년전 호모에렉투스가 등장한다. 뇌의크기가 100만년전보다 2배 커져 더욱 정교한 석기 제작이 가능했다. 그리고 어깨와 몸통이 던지기에 적합해 침팬지보다 힘이 훨씬 약함에도 3배 속도로 투사하는 것이 가능했다. 다리가 길어지고 체모가 줄어들고 발아치가 깊어지며 오래달리기에 적합해졌다. 지구력 사냥을 한 것이다. 입과 소화관도 약화했다. 화식을 하니 씹는 것이 쉬워지고 소화시간도 짧아졌기에 가능했다. 그리고 조산을 했다. 뇌가 커지고 직립을 하니 좁아진 골반으로 아이를 낳는 것이 어려워졌다. 그래서 일찍 약한 개체를 출산했고 그러다보니 부부 협력 육아가 필수였다. 이는 일부일처로의 변화를 가져온 것으로 보인다. 할머니 육아도 같이 등장한 것으로 추정된다.
언어의 진화는 수수께끼다. 이를 부산물로 보는 진화학자도 많다. 저자는 언어가 부모 자식간의 관계에서 진화했을 것으로 본다. 집단에서 진화한 사회진화는 배신자의 등장으로 인해 설명이 어렵다. 다만 부모 자식간으로 이를 보면 혈연선택으로 설명이 가능하며 부모자식간에서 공통관심과 원시적 대화가 생성되었고, 인간은 기본적으로 집단을 이루고 있으니 이것이 소속 사회집단으로 확장되었다고 보는 것이다.
실제 인간의 언어는 사회집단과 매우 관련이 깊다. 인간이 사용하는 언어의 70%가 타인을 평판하는 뒷담화다. 뒷담화로 인간은 자신이 직접 경험하지 못한 이타적 행위자를 보상하며 배신자와 사기꾼을 처벌한다. 언어로 인해 인간의 사회집단을 훨씬 더 커졌고 이로 인해 뇌 역시 더욱 크게 진화할 수 밖에 없었다.
5번째 혁명에서 인간은 언어를 사용하며 공통의 관심사 학습 대상의 확장과 학습의 용이함, 사회집단의 확장으로 인해 뇌가 더욱 커졌다는 것이다.
저자는 마지막으로 인공지능이 등장하며 인간의 뇌가 6번째 혁명을 목전에 두었다고 본다. 다만 우리 뇌가 기존의 것을 유지하고 변형하면서 진화해온 만큼 기존의 것을 바탕으로 진화할 것으로 보고 있다.