7. 패턴인식의문제
5억 년 전, 비둘기부터 상어, 생쥐, 개 그리고 인간까지 오늘날 살아 있는 모든 동물의 조상이자 왕할머니였던 물고기 비슷한 동물이 자기도 모르는 사이에 위험을 향해 헤엄치고 있었다 - P178
우리 조상이 안전한 캄브리아기 해초 틈에서 나오는 순간 그 절지동물이 달려들었다. 수 밀리초 안으로 우리 조상의 탈출 반사반응이 발동했다. 왕할머니 물고기의 눈이 주변에서 빠르게 움직이는 사물을 감지하고 본능적으로 반사반응을 일으켜 반대 방향으로 몸을 틀었다. - P179
냄새를 인식하는 것은 생각보다 어렵다
초기 좌우대칭동물은 인간이 맡는 냄새를 지각할 수 없었다. - P179
선충과 비슷했던 우리 조상의 세상을 인식하는 능력은 개별 신경세포의감각장치로 제한되어 있었다. 이 동물은 단일 빛 자극 감지 신경세포의 활성화를 통해 빛을 인식하거나 단일 물리적 자극 감지 신경세포 mechano sensory neuron의 활성화를 통해 물리적 접촉을 인식했다. - P180
모든 척추동물은 신경세포의 패턴을 해독해서 사물을 알아본다. 이 능력이 동물의 지각 범위를 극적으로 확장시켰다. 50가지밖에 안 되는 후각신경세포로 구성된 작은 모자이크 안에 서로 다른 패턴으로 구성된 하나의 우주가 있다. 이 50가지 세포로 표현할 수 있는 패턴은 100조개가 넘는다.² - P181
패턴인식은 어려운 일이다. 오늘날 살아 있는 많은 동물은 또다시 5억년정도의 진화를 거쳤는데도 이런 능력을 얻지 못했다. 오늘날의 선충과 편형동물이 패턴인식을 한다는 증거는 찾을 수 없다. 척추동물의 뇌가 패턴인식의 문제를 해결하려 할 때는 계산과 관련해서두 가지 난제가 있다. - P182
(전략). 이것이 패턴인식의 두 번째 문제, 곧기존의 패턴을 어떻게 일반화해서 비슷하지만 똑같지는 않은 새로운 패턴을알아차릴 것인가라는 일반화 문제generalization problem다.³ - P183
7. 패턴인식의 문제
2. 켜지거나 꺼질 수 있는 50가지 세포에서 나올 수 있는 조합의 가짓수는 2⁵⁰다. 그리고 2⁵⁰은 대략1.1×10¹⁵이다.
3. D. A Wilson, 2009와 Laurent, 1999에서는 유사한 후각 부호화 모델을 제안했다. Barnes 외, 2008에서는 쥐의 후각겉질에서 패턴을 완성하는 증거를 찾아냈다. Yaksi 외, 2009에서는 어류에서 비슷한 유형의 패턴을 분리하거나 완성하는 증거를 찾아냈다. 3층 겉질에서 이런 자동연합이 일어난다고 주장한 최초의 논문은 Marr, 1971을 참고하라. - P512
컴퓨터가 패턴을 인식하는 방법
아이폰은 안면인식으로 잠금을 해제할 수 있다. 이렇게 하려면 스마트폰이 일반화 문제와 식별 문제를 해결해야 한다. (중략). 현대의 AI 시스템은 패턴인식의 이 두 가지 문제를 성공적으로 해결한 듯하다. 어떻게 해결한 것일까? - P184
표준 접근방식은 다음과 같다. 그림 7.4 같은 인공신경망을 만든다. 한쪽으로 입력 패턴을 제공하면 이 패턴이 신경세포의 층을 관통하며 이동하다가 인공신경망 반대쪽에서 출력 패턴으로 바뀌어 나온다. 신경세포 간 연결마다부여되는 가중치를 조절하면 인공신경망이 입력 정보를 대상으로 다양한 연산을 수행하게 만들 수 있다. - P184
정답과 함께 사례를 제공해서 인공신경망을 훈련시키는 이런 학습 유형을 지도학습supervised learning (사람이 인공신경망에 정답을 제공해 학습 과정을 지도)이라고 부른다. 이보다 더 복잡한 지도학습 방법이 많지만 원리는 같다. - P185
아이들은 달걀과 딸기라는 단어를 배우기도 전에 이 두 냄새가 서로 다르다는 것을 분명히 인식한다. 둘째, 역전파는 생물학적으로 일어날 수 없다. 역전파는 수백만 개의 시냅스를동시에 그리고 신경망의 출력을 올바른 방향으로 정확한 양만큼 조정하는 마술 같은 방식으로 작동한다. 뇌가 어떻게 이렇게 작동할 수 있는지는 상상하기도 힘들다. 그렇다면 뇌는 어떻게 패턴을 인식하는 것일까? - P186
패턴인식을 목적으로 설계된 최초의 신경세포
어류의 후각신경세포는 자신의 출력을 겉질이라는 뇌의 상부 구조로 보낸다. 칠성장어나 파충류 같은 단순한 척추동물의 겉질은 3층의 신경세포이며⁴ 얇은 판처럼 구성되어 있다. 최초의 겉질에서 새로운 형태의 신경세포인 피라미드 신경세포pyramidal neuron가 진화했다. 피라미드 모양으로 생겼다고 해서 붙여진 이름이다. - P186
4. 경골어류에는 뚜렷하게 구분되는 층이 없을 수도 있지만 칠성장어의 겉질에는 파충류처럼 층이 있다. 그래서 나는 초기 척추동물의 겉질에 층 구조가 있었다고 가정한다. Suryanarayana 외, 2022 - P512
그림 7.6에서 확장성과 희소성(확장 재부호화expansion recoding)이 식별 문제를 어떻게 해결하는지 직관적으로 이해할 수 있다. 포식자 냄새와 먹이 냄새의 패턴은 서로 겹치더라도 활성화된 모든 신경세포로부터 입력을 받는 겉질신경세포가 다르다. 그래서 입력 정보가 겹쳐도 겉질에서 활성화되는 패턴이 달라진다. 이런 연산을 패턴분리pattern separation, 비상관화decorrelation, 직교화orthogonalization 라고도 한다. - P187
자동연합은 척추동물의 기억과 컴퓨터의 기억에서 중요한 차이를 보여준다. 자동연합을 통해 척추동물의 뇌가 내용 주소화 기억장치 content-addressablememory, CAM를 사용한다는 뜻이다. 이는 경험의 부분집합을 이용해 원래의 패턴을 다시 활성화함으로써 기억을 회상하는 방식을 말한다. - P188
자동연합에 의한 기억은 메모리 주소를 잃어버릴 염려가 없지만 다른 유형의 요인 때문에 간섭을 겪을 수 있다. REM을 이용하는 컴퓨터는 정보가 저장된 장소를 분리해서 새로운 정보가 오래된 정보를 덮어쓰지 않게 한다. - P188
파괴적 망각: 연속학습 문제 2부
1989년에 닐 코언 Neal Cohen과 마이클 매클로스키 Michael McCloskey는 인공신경망에게 수학을 가르치려 했다.⁶ 복잡한 수학이 아니라 그냥 덧셈이었다. 두 사람은 모두 존스홉킨스대학교의 신경과학자였고 인공신경망이 기억을 저장하고 유지하는 방식에 관심이 있었다. - P189
6. McCloskey와 Cohen, 1989. 연속학습 문제에서 현재 직면하고 있는 도전과제에 대한 검토는Parisi, 2019; Chen Liu, 2018 - P512
현대의 AI 시스템은 이런 문제를 어떻게 극복하고 있을까? 사실 아직 극복하지 못했다. 프로그래머들은 AI를 학습시킨 후에 그냥 동결시키는 방법으로 이 문제를 피하고 있다. 우리는 AI를 순차적으로 학습시키지 않는다. 모든 것을 한꺼번에 가르친 다음 학습을 중단한다. - P190
패턴인식이 진화하자마자 파괴적 망각 문제에 대한 해결책도 함께 진화했다. 사실 어류도 파괴적 망각 문제를 끝내주게 잘 피한다. 물고기에게 작은탈출구를 통해 그물에서 빠져나가는 법을 훈련시키고 나서 1년 후에 다시 테스트해보자. 긴 시간 동안 물고기의 뇌는 끊임없이 패턴을 입력받으며 새로운 냄새, 장면, 소리를 알아보는 법을 학습했을 것이다. 그리고 꼬박 1년 후에똑같은 그물에 다시 넣으면 이 물고기는 탈출 방법을 여전히 기억하고 있어서 1년 전과 거의 똑같이 빠르고 정확하게 빠져나갈 것이다.⁷ - P191
불변성 문제
그림 7.7의 두 물체를 보자. - P192
다음 페이지의 그림 7.8을 보자. 앞에서 나왔던 도형과 같은지 알아보겠는가? 그림 7.8에 나와 있는 물체와 그림 7.7에 나온 물체가 당연히 같아 보이겠지만 사실 이것은 엄청나게 놀라운 일이다. 어디에 초점을 맞추느냐에따라 망막에서 활성화되는 신경세포가 전혀 겹치지 않을 수도 있다. - P193
동일한 시각적 대상이라도 시야 속 방향, 거리, 위치에 따라 활성화되는 패턴이 달라질 수 있다. 이것이 불변성 문제 invariance problem를 만들어낸다. - P194
이는 시각만의 문제가 아니다. 같은 단어를 아이는 고음으로, 어른은 저음으로 말해도 당신은 그 둘을 같은 단어로 알아듣는다. 불변성 문제를 해결한 것이다. 소리의 높이가 완전히 다르기 때문에 속귀에서 활성화되는 신경세포가 완전히 다른데도 당신은 그 둘이 같은 단어임을 알 수 있다. - P194
데이비드 허블David Hubel과 토르스텐 비셀 Torsten Wiesel은 고양이의 겉질을 마취하고 전극을 연결한 다음 고양이에게 서로 다른 시각적 자극을 제시하며 신경세포의 활성을 기록했다.⁹ 이들은 점, 선과 다양한 도형을 고양이의 시야에서 서로 다른 위치에 제시해 겉질이 시각 입력을 어떻게 부호화하는지 알고 싶었다. - P195
9. Hubel Wiesel, 1959, 1962, 1968. - P512
허블과 비셀의 초기 연구가 이뤄진 뒤 20년이 넘게 지난 1970년대 말에후쿠시마 구니히코라는 컴퓨터과학자가 그림 속 물체를 알아보는 컴퓨터를 만들려 애쓰고 있었다. 하지만 아무리 노력해도 이 장의 앞부분에서설명한 것처럼 그런 일을 해내는 표준 인공신경망을 만들 수 없었다. - P196
10. Manassi 외, 2013. 허락을 받아 사용. - P512
후쿠시마는 이 두 가지 발견이 뇌가 불변성 문제를 어떻게 해결했는지보여주는 단서일 것이라고 직감했다. 그는 허블과 비셀이 발견한 두 발견을포착하기 위해 설계된 새로운 인공신경망 구조를 발명했다.¹¹ 그의 구조는그림 하나를 완전히 연결된 인공신경망에 던져 넣는 표준 접근방식에서 벗어났다. - P197
11. Fukushima, 1980. - P512
후쿠시마의 합성곱 신경망이 뛰어난 이유는 영리하게 ‘귀납적 편향inductivebias‘을 도입했기 때문이다. 귀납적 편향이란 설계 방식을 통해 AI 시스템이 만들어내는 가정을 말한다. 합성곱 신경망은 한 장소에서 주어진 특성은 장소가 달라져도 동일한 특성으로 취급해야 한다는 이동 불변성 translationalinvariance 을 가정하고 설계됐다. - P198
합성곱 신경망은 뇌에서 영감을 받았지만 뇌의 시각패턴 인식 방식을 모방했다고 하기에는 사실 빈약하다. 첫째, 시각 처리는 처음에 생각했던 것처럼 위계구조가 강하지 않아서 입력이 한 수준을 건너뛰고 여러 수준으로 동시에 가지치기를 하는 경우가 많다. 둘째, 합성곱 신경망은 이동translation 의 제약이 있으며 본질적으로 3차원 물체의 회전을 이해하지 못한다. (후략).¹³ - P198
13. 현대의 합성곱 신경망은 동일한 물체를 회전시킨 사례를 대량으로 포함하도록 훈련용 데이터를보강해서 이 회전의 문제를 피한다. - P513
셋째, 현대의 합성곱 신경망은 여전히 지도학습과 역전파를 바탕으로 여러 연결을 마법처럼 동시에 업데이트하는 방식을 사용한다. (중략). 넷째, 결정적으로 합성곱 신경망은 어류의 단순한 시각겉질보다 훨씬 복잡한 포유류의 시각겉질에서 영감을 받았다. - P199
어쩌면 합성곱 신경망에서 얻어야 할 교훈은 이동 불변성처럼 인공신경망에서 모방하려는 특정 가정의 성공 여부가 아니라 그 가정 자체가 성공했다는 사실인지도 모른다. - P200
진화는 원래 특정 사물을 감지하는 새로운 감각신경세포를 만들어 동물을 무장시키는 방식으로 일을 했다. 하지만 캄브리아기 약육강식의 군비경쟁을 거치는 과정에서 무엇이든 알아볼 수 있는 범용 메커니즘으로 무장시키는새로운 방식으로 전환했다. 이런 새로운 패턴인식 능력과 함께 척추동물 감각기관의 복잡성은 폭발적으로 증가했고, 신속하게 오늘날의 형태로 꽃을 피웠다. - P200
패턴인식과 감각기관이 정교해지면서 강화학습 그 자체와 되먹임고리가형성됐다. 패턴인식과 강화학습이 동시에 진화한 것 역시 우연이 아니다. 뇌가 세상의 사물에 반응해서 임의의 행동을 배우는 능력을 키우면 세상의 사물을 더 많이 인식해서 얻는 이점도 많아진다. - P201
8. 생명에게 왜 호기심이 생겼을까
TD-개먼이 성공하자 연구자들은 서튼의 시간차학습을 온갖 게임에 적용하기 시작했다. 기존에는 풀 수 없었던 게임들이 하나둘 이 알고리즘을 이용해성공적으로 격파됐다. 시간차학습 알고리즘은 결국 핀볼Pinbalt, 스타거니starGunner, 로보탱크 Robotank, 로드러너 Road Runner, Pong, 스페이스 인베이더 SpaceIrvaders 같은 비디오게임에서 인간 수준의 성능을 뛰어넘었다. - P202
2018년이 되어서야 마침내 몬테수마의 복수 1단계를 통과할 수 있는 알고리즘이 개발됐다. 구글의 딥마인드DeepMind에서 개발한 이 새로운 알고리즘은 서튼의 기존 시간차학습 알고리즘에는 없던 낯익은 요소를 추가해 임무를완수했다. 바로 호기심curiosity이다. - P203
실제로 처음 호기심을 갖게 된 존재는 초기 척추동물이었다는 증거가 있다. (중략).² 척추동물은 ‘실질적인‘ 보상이 없어도 놀라움 자체만으로 도파민 분비가 촉발된다.³ 하지만 대부분의 무척추동물은 호기심을 보이지 않는다. - P204
8. 생명에게 왜 호기심이 생겼을까
2. 어류의 호기심에 대해서는 Budaev, 1997, 생쥐의 호기심에 대해서는 Berlyne, 1955, 원숭이의호기심에 대해서는 Butler와 Harlow, 1954, 유아의 호기심에 대해서는 Friedman, 1972를 참고하라
3. Matsumoto와 Hikosaka, 2009. - P513
쥐가 도박을 한다는 사실을 처음으로 알아차린 사람은 스키너였다. - P205
도박은 이런 속성을 활용하기 위해 꼼꼼하게 설계되어 있다. 도박에서는승리 확률이 0이면 안 된다. 그러면 게임에 참여하지 않을 것이다. 대신 승률을 48퍼센트 정도로 맞춘다. 이런 승률은 승리가 가능할 정도로 충분히 높고, 이겼을 때 놀라움을 느낄 만큼(도파민 분비를 촉진) 충분히 불확실하며 결국 장기적으로는 카지노가 당신의 돈을 모두 가져갈 정도로 충분히 낮다. 페이스북과 인스타그램의 피드도 이런 속성을 활용한다. 스크롤을 넘길때마다 새로운 게시물이 등장하고, 몇 번 스크롤 한 뒤에는 무작위로 흥미로운 뭔가가 등장한다. - P205
강화학습이 작동하려면 호기심이 필요하기 때문에 호기심과 강화학습은함께 진화했다. 패턴을 인식하고 장소를 기억하고 과거의 보상과 처벌을 바탕으로 행동을 유연하게 변화시키는 능력을 발견하면서 최초의 척추동물에게 새로운 기회가 열렸다. - P206
|