3부 Ai가 훔쳐간 상상

Ai는 추상화를 그릴 수 있을까?

AI와 추상화

AI는 그림을 잘 그린다. 정확하게는 구상화를 잘 그린다. 구상화는 모양을 구체적으로 상세하게 그린 그림이다. 이와 달리 추상화는 물체의 형상에서 본질을 뽑아내 그린 그림이다. - P160

추상화의 본질

칸딘스키는 추상화non-objective art의 선구자다.⁴⁷ 그는 "그림은 분위기mood를 나타내는 것이지 물체object를 나타내는 게 아니다."라고말했다.


47 월간조선 "이규현의 ‘아트토크‘-‘그린 것 없이 그린‘ 추상화". 2014. http://monthly.chosun.com/client/news/viw.asp?ctcd=&nNewsNumb-201409100052 - P162

그림이 구체적인 대상을 재현하는게 아니라면 뭐하러 그림을 그릴까? 추상화를 들여다보면 놀랍게도 또 다른 오브제가 보인다. 캔버스, 물감, 붓 자국 같은 것이다. 미술 용어로는 물성物性이라 한다. - P162

48프로그래밍의 본질적인 의미는 시뮬레이션simultation이다.⁴⁸ (중략). 그런데 실제 세계가 워낙 복잡해서 바로 컴퓨터 내부로 반영할 수 없어서 추상화와 구체화 과정을 거쳐야한다. (후략).

48 바람돌‘s Life, "객체지향 프로그래밍 1화 - 개념,  추상화,     클래스", 2015, http://moen,tistory.com/27 - P163

피카소의 뜨개질

피카소가 그린 화가와 뜨개질하는 모델>에는 뜨개질하는 여인을 그리는 피카소가 나온다. 하지만 캔버스에는 여인의 형체가없고 여러 개의 둥근 선과 직선이 마구잡이로 그려져 있다. 피카소는 지금 객체 지향 프로그래밍을 하는 중이다. - P164

카이스트에서 뇌과학을 연구했던 정재승 교수는 인공지능은 문제를 해결하는 데 특화되어 있고 인간은 문제를 정의 내리는 데 탁월하다고 말한다.  - P165

서울대 철학과 김상환 교수도 비슷하게 말한다.⁴⁹ "일상 대화나상식 수준의 생각 교환 아이디어 교환은 인공지능이 인간보다 잘할 겁니다. 인공지능이 정확하고 간결하고 경제적인 언어를 구사할 수 있기 때문이죠. 딥러닝은 거대한 빅데이터를 기반으로공통점을 추출하고 개념화합니다. 인간 사고의 단계에서 놓고 보면 초보적 수준이죠. 인간은 공통점을 추출한 다음 개념화하고 적당한 이름을 붙입니다. 그 과정에서 기존 개념으로는 분류가 안 되는 것들이 생깁니다. 기존 체계에 속하지 않는 것들이 갑자기 등장하는 것이죠. 이런 것들을 설명하기 위해 인간은 가설을 만듭니다. 넓은 의미에서 보자면 상상想像입니다. 창의성은 이러한 과정을 통해 생겨나는데 딥러닝, 다시 말해 인공지능이 아직까진 쫓아올 수 없습니다."


49 중앙일보, "AI는 없어 인간 지배 못해..... 생각의 주도권 잡아야" 2016. hip://news.joins.com/artcle/2023430 - P166

구글 딥마인드

구글은 딥마인드를 스타크래프트 2 게임에 적용하겠다고 2016년 11월에 발표했다. 스타크래프트 2는 실시간 전략 게임이다. 세종대 컴퓨터공학과 김경중 교수는 현재 인공지능이 프로 선수를 이기는 것은 무리라고 말한다.⁵⁰


50 바둑신문 "너흰 아직 준비가 안됐다. 스타크래프트 판 ‘인간 vs 인공지능‘ 대결 승자는?", 2017. http://baduknews.com/news/view.php?idx=630 - P167

스타크래프트 2는 바둑이나 포커처럼 명확한 규칙이 없다. 공격준비를 다 했다고 선포하고 공격하는 것도 아니고, 마린 몇 개만 생산해서 쳐들어가기도 한다. 상대가 뭘 하는지 전혀 모르는데도 자신감만으로 적진에 밀고 들어가기도 한다. - P168

알파고는 싱글 에이전트Single Agen다. 사람과 1대 1로 승부한다. 스타크래프트도 밖에서 보면 1:1로 보이지만, 깊이 들어가 보면 수많은 인공지능의 집합이다. 사람이 게임할 때 마린의 행동은 마우스 클릭으로 결정한다. - P168

인공지능이 스타크래프트를 하려면 알파고의 싱글 에이전트 학습 방식을 쓸 수 없다. 다른 에이전트의 행동으로 인한 불확실성 때문에 학습이 어렵고 기존의 경험을 활용할 수 없다. - P169

알파고가 사람과 바둑을 둬서 이긴 이유는 바둑의 환경이 완벽하기 때문이다. 바둑은 명확한 규칙과 정해진 상황에서만 작동하므로 알파고는 거의 모든 경우에 어떤 결과가 나올지 매우 정확하게 예측할 수 있다. - P170

상상하고 계획하는 인공지능


이 문제를 풀기 위해 인공지능이 선택한 것이 바로 상상想像이다. 2017년 7월 20일 구글 딥마인드는 회사 홈페이지에 ‘상상하고 계획하는 인공지능Agents that imagine and plan‘을 만들었다고 발표했다.⁵³


53 DeepMind. "Agents that imagine and plan", 2017, https://deepmind.com/blog/agents-imagine-and-plan - P171

발생 가능한 미래를 상상해서 변화하는 환경에 따라 행동을 계획하는 이 인공지능은 3가지 특징을 갖고 있다.

(중략).
둘째, 상상을 효율적으로 사용할 수 있다. 인공지능은 적절한 경로를 상상해서 문제에 적합하게 조정한다. 또한 보상과 상관없이 모든 상상에서 유용한 정보를 얻어낸다. (후략). - P172

상상하고 계획하는 인공지능에게 이 일을 시켜 보자. 그러면 그는 전투에서 이기기 위해 어떤 경로로 가서 어떤 저글링부터 공격해야 하는지 상상한다. 자신이 왜 움직이지는 해석한다. 자기가 저글링에게 다가가면 저글링이 어떻게 행동할지도 상상한다. 이제 인공지능은 자신이 원하는 보상을 찾는다. - P173

AI에게 숫자가 중요할까?


(전략).


파라미터와 방정식

ChatGPT의 기반 모델인 GPT-3의 파라미터 매개변수는 무려 1,750억 개다. GPT-1은 1억여 개, GPT-2는 15억 개니까 앞선 모델의 10배가 넘는 파라미터를 사용했다. GPT의 파라미터 개수가엄청나게 늘면서 이전 모델과 달리 ChatGPT가 사람처럼 말한다는 것에 모두 놀랐다. - P175

생각지 못한 무려

만약 파라미터가 무려 1조 개, 100조 개를 넘어가면 무슨 일이 벌어질까? 정말 상상도 할 수 없는 일이 벌어지지 않을까? 그래서 무려 1조 개, 무려 100조개 하는 식으로 사람들은 ‘무려‘라는 단어를 엄청난 숫자 앞에 쓴다. - P179

 한 논문에 따르면 우리나라속담 8,197개 중에서 숫자가 표현된 속담은 984개였다.⁵⁴ 그중에3이 표현된 것이 가장 많아서 287개 2%를 차지했다. 그다음은 1이 표현된 것이 170개.3%였다. 유독 3이 많은 이유는 홀수를 선호했던 우리 정서와 함께 3이 자연을 가장 잘 표현하는 수이기 때문이다.


54 박은하, "한국 속담에 표현된 수의 의미", 2009 - P182

아주 큰 숫자와 구글


속담에서 쓰는 숫자는 "세 닢짜리 십만 냥짜리 흉본다"에서 쓴 십만이 한계다. "저승길이 구만리", "앞길이 구만리 같다"처럼 보통은 구만까지 센다. 구만이면 아주 먼 숫자다. 옛날에 보통 살림에서는 이 정도 숫자면 충분하다. 하지만 요즘은 훨씬 더 큰 숫자를 쓴다. - P183

지금까지 우리가 만들고 아는 거대한 숫자 이름 중에서 가장 유명한 것은 구골이다. (전략). 구골은 1940년에 발행된 《수학과 상상Mathematics and theImagination》이란 책에 나오는 용어로 10의 100승을 말한다. - P185

거대한 깨달음

우리의 생각은 숫자와 뗄 수 없다. 세상을 이해하려면 숫자를 이해해야 한다. - P185

(전략).

아주 큰 숫자는 아주 큰 깨달음을 준다. 숫자는 단순히 숫자가 아니라 인간의 생각과 문화를 만드는 도구이자 목표였다. AI에게파라미터의 개수도 그런 의미가 되지 않을까? 어떤 숫자를 뛰어넘으면 AI가 거대한 깨달음을 얻을 수 있지 않을까? - P189

제1부 ai가 훔쳐간 감정


AI도 개과천선할까?

AI의 후회

후회는 이전의 잘못을 깨치고 뉘우친다는 말이다. 후회를 하려면 첫 번째로 이전의 잘못이 존재해야 한다. 두 번째로 그 잘못을 깨쳐야 한다. - P35

그런데 만약 코드에서 오류가 발생하면 어떻게 될까? 일반적으로 개발자가 테스트 서버에서 코드를 입력하고 실행했을 때 오류가 생기면 오류를 수정한다. - P35

(전략).

마지막 단계는 AI가 마음속으로 가책을 느끼는 것이다.
ChatGPT가 가책을 느낄 것 같진 않다. 하지만 최소한 사용자에게 사과는 한다.  - P36


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

새로운 수수께끼 풀이 방식을
시도한 작품입니다.
덕분에 작가 수명이 조금 더 늘었을지도.
한국 독자들도 새 히어로
블랙 쇼맨과 함께 모쪼록 이 책을
즐겁게 읽어 주시길.


2020년 11월, 히가시노 게이고

프롤로그

샤쿠하치(일본의 전통악기로, 대나무로 만든 수직형의 피리) 소리가흐르는 가운데 새카만 무대에 스포트라이트가 떨어졌다.
(중략). 하지만 이곳은 일본이 아니라 미국 라스베이거스였다. - P7

남자는 다시 검 끝을 위로 올렸다. 그러자 무대 가장자리에서 새카만 복장의 3인조가 나타났다. 외국인들에게도 잘 알려진 닌자 복장이었다. 복면을 뒤집어써서 머리부터 얼굴까지 모두 가렸다. - P8

두 번째 기둥으로 다가간 남자는 이번에는 숨도 쉬지 않고검을 휘둘렀다. 마찬가지로 말끔하게 절단된 기둥이 힘없이 바닥을 나뒹굴었다. 하지만 그 광경을 끝까지 지켜보지 않고남자는 세 번째 기둥으로 달려갔다.
정적 속에서 남자는 검을 가로로 크게 휘둘렀다. 공기를 가르는 소리와 멍석이 갈라지는 소리가 뒤섞여 장내에 울려 퍼졌다. 절단된 기둥 윗부분이 스르륵 기울며 바닥으로 떨어졌다. 아랫부분은 여전히 서 있었다. - P9

소복의 남자가 서서히 관객들 쪽을 돌아봤다. 팔을 더욱 활짝 벌리더니, 남자는 오만한 미소를 지으며 고개를 숙였다. - P10

1

모니터에 뜬 이미지를 본 순간, 얼굴이 화끈거릴 정도로 부끄러워졌다. 고등학생 때 친구와 둘이 찍은 사진이었다. 학교에서 돌아오는 길에 편의점 앞에서 찍었던 기억이 난다.
"이 사진은...... 빼야겠어." - P11

"네, 저희도 자주 그랬어요." 여자의 눈에 웃음기가 번졌다.
"옛날 생각나네요."
"그렇죠. 겐타 씨 때는 이런 거 없었어?"
겐타는 마요보다 일곱 살 많은 서른일곱이다.
"어땠더라. 잘 기억이 안 나네. 그리고 난 남학교였거든." - P12

남녀는 호텔 직원의 배웅을 받으며 웨딩숍을 나섰다. 그뒷모습에는 행복의 기운이 감돌고 있었다.
"왜 그래?"
겐타가 물었다.
"아니・・・・・・ 방금 나간 사람, 배가 불러 있더라고."
"그랬어? 난 못봤네." - P13

"요즘은 저런 분들도 많나요?"
직원은 살며시 고개를 끄덕였다.
"네, 1년에 몇 분은 계신 것 같아요."
"이제 혼전임신 같은 건 부끄러워할 일이 아니죠."
"글쎄요. 그렇지도 않아요. 역시 남들 눈을 의식하세요. 그래서 드레스를 고를 때, 잘 티가 나지 않게 이런저런 조언을 드리기도 하고요." - P14


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

ABC 추측은 아직 증명되지 않았다고 들었었다.



추천의 글


다시 한 번 독해력 교육을
돌아봐야 할 때


정혜승  경인교육대학교 국어교육과 교수


(전략). 그러나 2016년 알파고가 바둑 대국에서 이세돌 9단을 이기는 모습을 보면서 많은 사람들이 AI 기술이 인간을 이길 수 있을 뿐만 아니라 인간의 생존을 위협할 수 있다는 사실에 큰 충격을 받았다.
이 ‘사건‘ 이후 5년 뒤 또는 10년 뒤 사라질 직업을 검색하면서 Al부터 자신의 직업은 안전한지 걱정하거나 자녀에게는 어떤 직업을 갖게하는 것이 좋을지 고민하는 사람들이 많아졌다 - P10

저자인 아라이 노리코 교수는 먼저 AI와 AI 기술의 차이를 언급하면서 아직 AI는 존재하지 않고 그에 도달하기 위한 기술만 존재하며, AI가 인간의 능력을 넘어서는 순간인 ‘특이점‘은 불가능하다고 말한다. - P11

(전략). 그러나 150억개의 영어 문장을 학습하고도 일상적인 대화를 이해하지 못하는 인공지능이라니. (중략).
한편 이러한 ‘이해하는 ‘척‘은 안타깝게도 학생들에게서도 나타난다. 저자가 개발한 도구(리딩 스킬 테스트)로 평가한 결과 일본 중·고등학생들의 독해력 수준은 매우 낮은 것으로 나타났다. 높은 수준의 독해력이 아닌, 기초적인 문장 이해와 추론 능력을 평가하는 시험에서 많은 일본학생들의 점수가 우려할 만큼 낮게 나온 것이다. - P11

저자가 반복적 문제 풀이를 우려하는 것도 우리가 주목해야 할 부분이다. 프레임 안에서 반복하는 것은 AI가 가장 잘 하는 영역이므로 단순 반복적 교육은 AI와 차별화되는 인간의 능력을 계발하는 데 도움이되지 못한다. - P12

 기본적인 독해력을 강조한다고하여 고차적 수준의 독해력을 기르는 교육이나 학생 중심의 창의적 교육을 하지 말자는 주장을 하는 것으로 이해해서는 안 될 것이다. - P12

추천의 글


정보 검색자를 넘어
인공지능 시대의 주역으로

이순영  고려대학교 국어교육과 교수


인공지능이 화두인 시대이다. - P13

생활의 편의를 제공하던 과학 기술이 AI를 실현하는 단계가 되면서 현재 우리가 직면한 감정은 ‘두려움‘이다.  - P13

이제 우리는 인류의 긴 역사 속에서도 가장 중요한 변곡점에 이른 것을 인정하고, AI 시대에 살아남는 법을 고민해야만 한다. 다가올 미래에대한 두려움을 극복하는 가장 좋은 방법은 미리 알고 준비하는 것이다. - P14

이 책에는 일본 학생들의 독해력이 얼마나 부족한 수준인지를 설명하고 있지만, 사실 이 문제는 우리나라가 더욱 심각하다. 국제적으로 공신력이 있는 국제학업성취도평가(PISA) 결과에 의하면, 2006년 이래 우리나라 중등 학생들의 읽기 능력은 지속적으로 크게 하락하고 있다. - P14

AI의 시대에 ‘독해력‘을 갖추지 못한 학생과 개인에게는 미래가 없다. 텍스트의 의미를 깊이 이해하고 타인과 소통하며 새로운 지식을 만들어내는 역량이 없는 ‘정보 검색자‘들에게는 상상력도, 공감력도, 인지적 유연성도, 깊은 수준의 사고력도 기대할 수 없기 때문이다. - P15

2장

도로보군은
왜 도쿄 대학에
들어갈 수 없는가?


독해력과 삼식의 벽
: 주입식 교육의 실패


도쿄 대학 불합격


2011년부터 도쿄 대학 합격을 목표로 열심히 공부해 온 도로보군이지만 합격 전망은 여전히 어둡다. (중략). 5교과 8과목의편차치는 57.1로, 전국 756개 대학 중 70퍼센트에 해당하는 535개 대학에 합격할 확률이 80퍼센트가 넘는다는 판정을 받았다. 그중에는 MARCH나 간칸도리쓰에 속하는 유명 대학도 있다. - P91

 그러나 편차치 65를 넘기는 것은 불가능하다고 생각한다. 그렇게 생각하는 데는 이유가 있다. 입시에는 현재의 AI가 지닌 능력으로 뛰어넘을 수 없는 여러 가지 벽이 있으며, 지금 보유한 기술의 연장선상에서는 그 벽을 넘을 수가 없기 때문이다. 벽을 돌파하려면 완전히 다른 방식이 필요하다. 이 장에서는 도로보군이 편차치 65를 넘어설 수 없는 이유를 설명하려 한다. - P92

도로보군에게 슈퍼컴퓨터는 필요 없다


(전략).
사실 이 프로젝트를 시작하고 얼마 지나지 않았을 무렵에 한 기관으로부터 "도로보군 프로젝트에 저희가 보유한 슈퍼컴퓨터를 사용해 주셨으면 합니다"라는 제안을 받았다. 그래서 프로젝트 연구자들을 대상으로 사용 희망자를 모집했는데, 모두가 난감한 표정을 지으며 "쓸 데가 없어요"라고 말했다. 그중에서도 수학 팀의 지적은 매우 흥미로웠다.
"평범한 수준의 서버를 사용해서 5분 안에 풀지 못하는 문제는 슈퍼컴퓨터를 사용한다 해도 지구가 멸망할 때까지 못 풉니다." - P93

왜 인간이 이 문제를 쉽게 풀 수 있는지는 알 수 없다. 우연히 답이 대각선의 교점이어서인지도 모른다. 교점이라는 것은 인간에게 ‘자연스러운‘ 존재다. ‘페르마의 정리‘도 최근에 일본인 수학자 모치즈키 신이치(望月新一)가 증명해서 화제가 된 ‘ABC 추측‘도, 정리 자체는 고등학생조차 이해할 수 있을 만큼 ‘자연스럽다.‘ 그러나 컴퓨터는 ‘자연스러운 정리‘라는 것이 무엇인지 알지 못한다. - P94

양자컴퓨터도 마찬가지다. 요코하마 아레나 같은 거대한 공연장에서 모든 사람이 네트워크에 접속하려 할 때 어떤 액세스 포인트에 연결하면 원활한 접속이 가능한가 같은 문제를 해결하는 데는 양자컴퓨터가 유용할 것이다(한편 현재의 ID 및 비밀번호 시스템이 단숨에 붕괴된다는 엄청난 부작용도 뒤따른다). - P95

우리는 흔히 머리가 좋은 사람을 가리켜 두뇌 회전이 빠르다고 말한다. (전략). 여기에 일부 연구자나 언론이 "딥러닝은 인간의 뇌를 모방한 것입니다"라는 안이한 해설을 덧붙인 결과, "AI가 슈퍼컴퓨터로 딥러닝을하면 머리가 아주 좋은 사람하고 똑같아지겠구나"라고 지레짐작하게된 것이 아닐까? - P95

빅데이터에 대한 환상


2011년에 도로보군 프로젝트를 시작한 뒤로 나는 수많은 학회와 기업에 초빙되어 도로보군을 주제로 강연을 했다.
(중략).
합격할 수 있다고 생각하는 사람들이 제시하는 근거는 크게 두 가지다. 첫째는 "얼마 전까지만 해도 컴퓨터가 프로 장기 기사를 이기는 날이 오리라고 누가 예상이나 했겠는가? 그러므로 인공지능이 도쿄 대학에 합격하는 날도 얼마든지 올 수 있다"라는 대답이다. (중략).
둘째는 "기출문제라는 빅데이터를 활용하면 가능할 것이다"라는 대답이다. 나는 이쪽이 좀 더 심각한 문제라고 생각한다. (후략). - P96

도쿄 대학 합격자의 센터 시험 정답률은 약 90퍼센트다. 도로보군이 센터 모의시험을 볼 수 있도록 협력해 준 입시 학원 요요기 제미날에서는 "영어의 경우 만점 가까이 받지 못하면 (도쿄 대학 합격은) 무리입니다"라는 조언을 들려줬다.  - P97

(전략).
즉, 대학 입시의 경우에는 빅데이터를 모으고 싶어도 모을 수가 없다는 말이다. 게다가 빅데이터가 모였다 한들 그것을 활용해서 입시 문제를 풀 수 있게 되리라는 보장도 없다.  - P97

AI에 대한 미국과 일본의 인식 차이


한편 왓슨을 개발한 IBM의 인식은 이와 대조적이다. 도로보군에 관한 《뉴욕타임스》의 특집 기사에서 IBM은 "이만큼 다양한 영역을 아우르는 입시 문제를 (불과 수년 안에) 높은 정확도로 풀기는 매우 어려울것"이라는 견해를 내비쳤다. (전략).
AI에 관한 미국과 일본의 인식에는 큰 차이가 있다. 그중 하나가 AI에거는 기대이다. 도로보군에 대한 ‘과대평가‘에서도 알 수 있듯이 일본에서는 AI 전문가조차도 가까운 미래에 AI가 꿈같은 세상을 실현해 줄 것이라고 기대하지만, AI 분야를 선도해 온 미국에서는 AI의 실력을 냉정하게 판단하는 연구자가 많은 듯하다. - P98

또한 Al에 대한 투자 면에서도 현실 감각의 차이가 보인다. 일본의 경우는 AI에 그토록 큰 기대를 품고 있음에도 정부와 기업 모두 무엇을지향하며 AI에 투자해야 하는가라는 현실 감각이 결여된 까닭에, 허황된 소리를 하는 연구자에게 거액의 예산을 안겨주거나 무작정 고액의 비용을 들여 AI 컨설팅을 받고 보는 등 우왕좌왕하는 모습이 눈에 띈다. - P98

왜 이런 차이가 생겨났을까? 여기에는 두 가지 이유가 있다.
첫 번째 이유로는 <제5세대 컴퓨터 프로젝트>의 실패가 남긴 여파를들 수 있다. 이는 1982년 당시 일본의 통상산업성(오늘날의 경제산업성)이추진한 국가 프로젝트다. 논리적인 추론을 고속으로 실행하는 병렬 추론 기계 및 운영체제를 구축함으로써 논리를 통한 자동 진단과 기계 번역을 실현한다는 목표 아래 500억 엔이 넘는 예산이 투입되었다. - P99

. "이런 꿈을 실현하고 싶다"라는 희망찬 이야기나 "사실 <제5세대 컴퓨터 프로젝트>는 성공했다"라고강변하는 보고서는 발견했지만, 정작 중요한 문제인 "왜 실패했는가?", "어떻게 실패했는가?"에 관한 보고서는 존재하지 않았던 것이다. - P99

두 번째 이유로는 많은 미국 기업이 현실적인 사정 때문에 AI를 필요로 했다는 점을 들 수 있다. 미국에서는 구글이나 페이스북 등이 엄청난 데이터가 자동으로 축적되는 ‘무료 서비스‘를 전 세계 규모로 확대해나가고 있다. 대규모 무료 서비스를 제공하는 업체의 경우에는 "인력을쓰지 않고 서비스를 제공할 수 있는가?"를 정확히 판단하는 것이 경영의 성패로 직결된다. - P100

요컨대 제조 기업은 딥러닝처럼 통계에 입각해서 판단했다가 중대한사고를 초래했을 때 그에 대한 책임을 져야 한다. 배상 책임뿐만 아니라사고에 따른 브랜드 이미지 훼손까지 고려해야 하는 까닭에 쉽사리 신기술 개발에 손을 댈 수가 없다. - P101

가시밭길을 걷게 된 도로보군의 영어 공략


(전략).
앞에서 나는 도로보군이 세계사 문제를 푸는 방식은 기본적으로 왓슨과 같은 정보 검색 방법을 따른다고 말했다. 또한 수학 문제가 특유의 정확하고 한정적인 어휘로 서술되어 있다면 논리적인 자연어 처리와수식 처리를 조합해서 고득점을 올릴 수 있다는 이야기도 했다. 그런데 이 두 가지 방법으로 극복할 수 없는 과목이 있다. 바로 국어(일본어)와영어이다. - P102

영어는 더욱 난적이었다. 프로젝트가 시작된 2011년에 센터 시험 기출문제를 분석했을 때, 내부의 자연언어처리 팀이 "지금의 자연언어처리 기술로는 해결이 곤란한 문제가 집중적으로 배치되어 있다"라고 말한 과목은 현대 국어가 아닌 영어였다.
사실 센터 시험의 영어는 어느 정도 출제 패턴이 정해져 있다. 첫 번째는 단어의 발음과 강세 문제, 두 번째는 문법이나 어법, 어휘 등 주로 문법과 관련된 문제다. 여기까지는 오늘날의 AI로 어떻게 대응해야 할지 전망이 선다. 만점을 받을 자신이 있다는 말은 아니다. - P103

어딘가의 연구 그룹이 도로보군이 영어 과목을 극복하는 데 도움을주지 않을까? 2013년 나는 고심 끝에 NTT의 커뮤니케이션 과학 기초연구소의 문을 두드렸다. (중략). 내가 제일 먼저 찾아간 곳은 기계 번역팀이었는데, 그때 기계 번역 팀의 젊은 연구원에게 들은 말이 지금도 잊히지 않는다.
"이건 센터 시험 특유의 부자연스러운 영어입니다. 점수를 내고 싶다면 센터 시험의 일영 대역 데이터를 100만 건 가져와 주십시오. 그러면 검토해 보겠습니다." - P104

200점 만점에 120점을 목표로 영어 팀을 결성하다


그런 어려운 상황 속에서 "재미있어 보이네요. 한번 해봅시다"라며 발 벗고 나서준 사람들이 있었다. NTT도코모의 음성 인식 비서 서비스 ‘말해줘 컨시어지‘ 개발의 핵심 멤버였던 히가시나카 류이치로(東中郞一郎)와NTT 출신의 대학 연구원들이었다. - P105

영어 팀은 ‘200점 만점에 120점‘을 첫 5년간의 목표로 삼았다. 첫 번째 문제와 두 번째 문제를 완벽하게 풀고, 세 번째 문제는 정답률 70퍼센트를 목표로 하며, 네 번째 문제와 다섯 번째 문제 중 기계 번역이나정보 집약 기술로 풀 수 있을 것 같은 문제는 놓치지 않는다. 이렇게 함으로써 확실하게 100점을 쌓아나간다. 그리고 나머지는 당분간 운에 맡기기로(달리 표현하면 ‘연필을 굴리기로‘) 했다. - P105

상식의 벽에 부딪히다


연구실의 문을 열고 들어온 로봇이 냉장고를 열더니 그 안에 있는 주스캔을 꺼내 사람에게 건넨다. 최첨단 인간형 로봇의 시연회에서 종종볼 수 있는 광경이다. 그러나 설령 그 로봇을 독자 여러분의 집에 파견한들 냉장고에서 주스 캔을 꺼내 오지는 못할 것이다. - P106

요컨대 지극히 한정된 조건하에서가 아니라면 로봇은 냉장고에서 주스캔을 꺼내는 일조차 쉽게 하지 못한다는 말이다. 로봇이 "체스 챔피언은 이겨도 근처에 심부름조차 보내지 못한다"라고 놀림받는 이유가 여기에 있다. - P106

 그런데 사실은 여러분이 잘못 생각하는 것이 있다. 우리 인간이 ‘단순하다‘라고 여기는행동이 사실 로봇에게는 단순하기는 커녕 매우 복잡한 행동이라는 점이다.  - P107

150억 문장을 암기시키다


2014년 가을 도로보군은 센터 모의시험의 영어 과목에 도전했다. 첫번째 문제인 발음과 강세 문제를 무난히 돌파한 후, 기출문제에서는 84퍼센트의 정확도를 보인 어구 정렬 문제에 돌입했다. 어구 정렬 문제란 이를테면 다음과 같은 문제를 말한다.

This problem is tool [ ] [ ] [ ] [ ][ ] [ ] Jease.
위의 미완성 문장의 빈칸 6곳에 (complex, me, solve, for, to, with)를 적절히 집어넣어 올바른 문장으로 만드시오. - P108

인간 수험생이라면 어휘와 문법, 구문에 대한 지식을 이용해 이 문제를 풀 것이다. too를 실마리로 삼아 ‘too+ 형용사 + for 목적격+ to 동사원형‘이라는 구문 유형에 맞춰 의미 있는 문장을 완성시키는 것이다. 한편 우리는 도로보군에게 문법도 구문도 일체 가르치지 않았다. - P108

"올해부터 출제 경향이 바뀌었나요? 도로보군의 성적이 아주 처참합
"니다."
"그런가요? 특별히 출제 경향이 바뀌었다는 느낌은 받지 못했습니다. 예년과 다를 바 없는 문제였어요. 수험생의 정답률도 별 차이가 없었고요."
요컨대 다른 수험생들에게는 기출문제와 별반 다르지 않은 문제가 도로보군에게는 ‘전혀 다른 문제로 다가왔다는 뜻이었다. - P109

①~⑥을 나열해 적절한 문장을 만드시오.

Maiko: Did you walk to Mary‘s house from here in this hot weather?
Henry: Yes. I was very thirsty when I arrived.

So [ ] [ ] [ ] [ ] [ ] [ ] drink.
① asked 
② cold
③ for
④ I 
⑤ something
⑥ to - P110

도로보군은 3,300만 개의 문장을 검색한 끝에 정답 후보를 두 개로 압축했다.

So Cold. I asked for something to drink. (추워서 마실 것을 부탁했어.)
So I asked for something cold to drink. (시원한 음료를 부탁했어.)

두 문장 모두 문법적으로는 이상하지 않다 - P110

대화하는 AI는 구글과 아마존, 마이크로소프트, IBM, 소프트뱅크등 AI를 연구하는 전 세계 기업들이 총력을 기울이고 있는 분야다. 정말로 대화하는 AI가 실현되려면 당연히 센터 시험의 객관식 회화문 완성 문제 정도는 맞힐 수 있어야 한다. 그러나 현재의 AI는 그런 수준에전혀 미치지 못한다. - P112

영어 팀이 경험한 ‘실패‘는 논문에 실리지 않는다. 뉴스에 보도될 일도 없다. 뉴스에 보도되는 것은 딥러닝이 성공한 사례뿐이다. 그러나 여러분의 회사에 도움이 되는 것이 과연 성공 사례뿐일까? "아무리 투자를 해도 딥러닝으로는 성과가 나지 않는다"라는 점이야말로 지금 모두가 간절히 필요로 하는 정보가 아닐까? - P113

센터 시험의 정답률을 높이는 데 필요한 것은 ‘오류가 없는 교과서적인 영어‘이다. 트위터에 올라오는 일본어 트윗 가운데 교과서적인 일본어가 차지하는 비율이 얼마나 되는지를 생각해 보면, 영어 트윗 가운데교과서적인 영어가 얼마나 적을지도 쉽게 상상할 수 있다.
문법에 맞지 않은 영어 문장은 아무리 늘어난들 데이터의 축적에 도움이 되지 않는다. - P113

의미를
이해하지 못하는 AI

컴퓨터는 계산기다

(전략).
내가 어디에 있든 간에 회사 근처로 돌아가는 방법을 알려달라고 하면 스마트폰은 금방 가르쳐준다. 선물로 받은 송이버섯을 맛있게 요리하는 방법도 척척 알려준다. - P115

그러나 AI는 의미를 이해하지 않는다. 입력에 반응해서 ‘계산‘한 답을 출력할 뿐이다. - P115

AI(컴퓨터)가 계산기라는 말은 계산할 수 없는 것, 달리 말해 덧셈과곱셈의 식으로 번역할 수 없는 것은 처리하지 못한다는 뜻이다. 그래서 AI 연구자들은 영상 처리를 하는 방법, 질문에 응답하도록 하는 방법,
영어를 일본어로 번역하는 방법 등 세상의 온갖 것을 수식으로 나타내기 위해 매일같이 두뇌를 전력으로 가동하고 있다. - P116

수학의 역사


(전략).
인간의 인식이나 인간이 인식하고 있는 사상을 수식으로 번역한다는 것. 이는 곧 수학의 역사라고 할 수 있다.
17세기 이탈리아의 천문학자 갈릴레오 갈릴레이는 ‘우주는 수학이라는 언어로 쓰여 있다"라고 말했다. 갈릴레이가 등장하기 전의 중세 수학은 굳이 따지자면 신학이나 점술과 매한가지인 존재였다. - P116

한편 당시 천문학의 중심지였던 프랑스에서는 가톨릭의 역사에 남은 엄청난 사건이 발생했다. 두 명의 교황이 서로 자신의 정통성을 주장하는 ‘교회의 대분열(시스타)‘이 일어난 것이다. (중략). 그러자 빈의 합스부르크가문이 그들에게 손길을 내밀었는데, 천문학자가 아니라 점성술사로서 초빙하고자 한 것이었다.
날씨는 농작물의 작황에 영향을 끼치며 작황은 국가의 힘을 좌우했기 때문에 통치자인 합스부르크 가문은 점성술에 매우 큰 관심을 보였다. 그 무렵 사람들은 태양도 딜도 별도 구름도 전부 한 하늘에 있으며, 태양이나 달, 별을 관측한 데이터를 수집·분석하면 향후의 날씨나 작황을 예측할 수 있을 것이라고 여겼다. (후략). - P117

그러나 중세의 빅데이터 과학이 이루어낸 성과가 전혀 없었던 것은 아니다. 당시 개발된 십진 소수나 로그와 같은 계산 기술은 현재까지도 남아 있으며, 특히 로그의 발견은 당시 천문학자들의 수명을 두 배로 연장시켰다는 말이 있을 만큼 혁명적이었다.  - P118

이런 것을 보면 과학적 발견은 어떤 한 사람이 갑자기 떠올린 영감에서 비롯되기보다 때가 무르익어 동시다발적으로 ‘언어로서‘ 출현할 때가 많은 것 같다. 수학의 언어는 선형적으로 발전하지 않는다. 특정 시기에 지수함수적으로 발전하며, 그 언어를 전부 소화하고 나면 안정기에 접어들어서 이후로는 아주 천천히 발전하게 된다. - P120

통계에 크게 주목했던 유명한 인물로 플로렌스 나이팅게일이 있다. ‘백의의 천사‘라고 불리며 간호사의 시조로 알려진 나이팅게일은 매우논리적인 여성이었다. 그녀는 병동의 관리와 매일매일의 간호 업무에관해 상세한 기록을 남겼다. 병들거나 다친 군인 중 사망자의 수와 감염자의 수를 나날이 기록했고, 통계 데이터의 변화를 바탕으로 병동에 배치된 침대의 적절한 간격을 계산했으며, 환기 방법 및 시트 세탁법 등을 과학적으로 확립했다. - P121

수학이 표현할 수 있는 것 : 논리, 확률, 통계

이야기가 조금 옆길로 샜는데, 내가 하고자 하는 얘기는 이런 것이다. 수학은 기나긴 역사를 통해서 인간의 인식이나 인간이 인식하고 있는 사상을 설명하기 위한 수단으로 논리와 확률, 통계라는 언어를 획득했다. 혹은 이 세 가지 언어만을 획득할 수 있었다. - P122


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

판본에 대하여

본 영역본은 초판 원본 텍스트(1516)를 근거로 삼고 있다. 필자는 거기에 원본 출판 2년 후에 인쇄된 불완전한 문장 하나라틴어 원본, p. 66)를 추가했을 뿐이다. - P31


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 

2

부식과 환원

1
"누가 뭐래도 10퍼센트예요. 모처럼 입지 조건이 좋은데 금액을 더 내리라니 절대로 안 돼요."
이쿠보 데루코는 일방적이었고 여지라고는 전혀 없었다.
"아뇨, 금액을 내리라는 말씀이 아니라 사정 결과에 따라 고독사 판정이 나지 않을 수도 있다는 설명을 드리는겁니다." - P81

이오키베가 대표로 있는 ‘엔드 클리너‘는 사건 사고가 발생한 집을 청소하거나 유품을 정리하는 일 외에도 상황에 따라서 집을 매입하기도 한다. 다만 그렇게 문제가 발생한 집은 고독사는 10퍼센트, 자살은 30퍼센트, 타살은50퍼센트나 거래 시세가 하락한다. - P82

"사람이 죽은 곳을 다른 사람에게 세놓는다니 아무리 남편의 유산이라도 참을 수 없네요. 하지만 단 하나 남은 유산이라 절대로 헐값에 넘기고 싶지는 않아요."
찝찝하니 처분하고 싶은 마음도, 1엔이라도 비싸게 팔고 싶은 마음도 모두 이해가 갔다.
이오키베는 지나온 응접실을 무심히 관찰했다. 생활용품은 전부 오랜 세월 사용한 것들로 고급스럽기는 하지만 낡은 티가 났다. - P83

데루코는 잠시 상대의 진의를 살피듯 노려보다가 말하느라 지쳤는지 짧게 탄식했다.
"그럼 일단 심사만이라도 받아 보죠. 결과가 나오면 협상하는 것으로 해요.‘
"좋습니다." - P84

"돈은 목숨 다음으로 소중하다고 말하는 사람도 있을정도잖아. 없는 것보다는 있는 게 좋지. 적은 것보다는 많은 편이 좋고, 당연한 이치야, 당연한 것을 부끄러워할 필요 없단다."
(중략).
"그건 그렇고 돌아가신 이네 씨에 대해 아는 게 있니?"
"아뇨. 가끔 공부를 가르쳐주신 적은 있지만요." - P85

"주인이 아무리 적어도 10퍼센트 이상 내릴 수는 없다며 완강해서."
"저희 아직 현장도 못 봤잖아요.
"안 봐도 대충 짐작이 가. 겨울이라지만 사망한 지 일주일이 지났어. 죽은 곳이 거대한 냉장고가 아니라면 몸에서 나온 체액이 바닥에 스며들었겠지. 제발 배수구 바로위에서 죽지 않았기만 바랄 뿐이야." - P85

"입지가 아무리 좋아도 문제가 일어난 집이면 의미 없어요."
"그런 집을 되살리는 것도 우리 일이야."
사망한 거주자의 넋을 달래는 것은 승려의 역할이지만고인의 원한이 서린 집을 정화하는 일은 이오키베와 직원들의 몫이라고 생각했다. - P86

가즈사는 진작에 이오키베의 속셈을 꿰뚫어 본 듯 가스미를 의심의 눈초리로 노려봤다.
"며칠 전에 니시신주쿠에 있는 구축 맨션에서 이네라는사람이 사망한 채 발견됐잖아."
"아아, 그 집 특수청소를 이오키베 씨가 맡았습니까?"
"어떤 상태였어?"
"그야 특수청소를 해야 하는 상태였죠." - P88

"한창 일할 사십 대 중반이었죠. ‘이네 라이징‘이라는 벤처회사를 차렸더라고요."
"젊은 나이에 사장님이었군."
(중략).
"여러 여자를 만나는 바람에 더 고립된 겁니다. 이 여자와 함께 있을 때 다른 여자에게 온 전화는 수신 거부했겠죠." - P89

"목욕하다가 사망한 것 같은데 혼자 사는 데다 욕조에받은 물을 데우는 기능이 설정되어 있었어요. 더 이상 설명은 필요 없죠?"
아무에게도 발견되지 않은 채 목욕 중 급사했고, 목욕물은 데우기 기능 때문에 온도가 계속 유지됐다. 시신은뜨거운 물 속에서 급속히 부패하고 육체와 조직이 녹았다. 그렇게 인간 스튜가 된 것이다. - P90

"시신은 누가 발견했어?"
"부하직원과 맨션 관리회사 담당자요. 이네는 매일 출근하지 않고 중요할 때마다 지시를 내리는 경영자였어요.
애초에 집을 사무실처럼 사용해서 회의도 온라인으로 진행했다고 해요. 그런데 아무리 전화해도 받지 않고 메일에 답장도 없기에 이상해서 부하 한 명이 맨션으로 찾아왔죠."
"변고를 잘도 눈치챘네."
"전조가 있었거든요." - P91

신주쿠 경찰서 정문을 나설 때 가스미의 얼굴은 우울했다.
"욕조에서 죽었다는 말을 들으니 심란해?"
"욕실 건은 전에도 경험한 적 있지만 욕조에서 사망한건은 처음이에요. 아까 형사님 이야기만 듣고 상상해도......."
하긴 인간 스튜라는 단어는 원하지 않아도 상상력을 자극한다. 자신들처럼 특수청소를 생업으로 삼는 자들이라면 일반인보다 생생하게 떠올릴 수 있어서 더욱 그랬다. - P93

특수청소를 할 때는 특히 체액을 다루는 데 유의해야한다. 침투한 체액은 건축재료를 망가뜨린다. 그런 의미에서 시신에서 흘러나온 체액량이 특수청소나 교체 범위를 결정한다.
욕조에서 죽었다는 말은 욕조를 채웠던 물이 전부 체액으로 변했다는 뜻이다. - P94

가스미의 말뜻을 이해했다. 법의학교실에 근무하는 지인도 비슷한 말을 한 적이 있다.
시신 냄새는 달리 무엇과도 비교할 수 없는 냄새인 데다 그 어떤 악취보다도 집요하게 들러붙는다. 방호복으로완전히 무장해도 머리카락은 냄새가 잘 배서 이오키베도 머리를 짧게 깎을까 생각한 적이 있을 정도다. - P95

12층 건물의 11층, 1105호가 의뢰받은 집이었다. 이렇게 고층 집에서 진행되는 특수청소는 더욱더 다른 주민을배려해야 했다. 방호복 차림으로 엘리베이터를 타고 오가면 병원균을 퍼뜨릴 수도 있어서 해당 집 앞에서 여러 번갈아입어야 했다. - P96

이번 의뢰는 레벨 C등급의 플러스알파로 작업한다. 레벨 C의 필수장비는 화학 방호복(부유분진 및 미스트 방호용밀폐복), 화학물질 대응 장갑(아우터), 장화, 자급식 공기호흡기, 산소호흡기 또는 방독 마스크지만 이외에도 나일론 원단으로 만든 이너를 껴입어 체액이 피부에 닿지 않도록 이중으로 방어했다.
(중략).
준비를 마치고 드디어 현장으로 들어갔다. 관리회사에서 빌린 열쇠로 문을 여는 순간 불온한 공기가 뿜어져 나왔다. - P97

벤처기업을 창업하고 여러 여성과 사귄 젊은 사장. 타인의 눈에는 화려한 독신으로 보였던 이네는 숨을 거두기직전 어떤 후회를 하고 어떤 한을 품었을까.
방 세 개짜리 맨션, 남자 혼자 살기에는 넓은 집이다. - P98

무심코 주변에 시선을 던지니 감식이 채취 작업을 하다가 남긴 흔적이 보였다. 일단 조사해야 할 것들을 조사한 후 사건성이 없다고 판단했나 보다. 쓰레기통은 감식반에서 샅샅이 수거한 듯 내용물이 아무것도 남아 있지 않았다. - P99

육안으로 확인할 수 있는 것은 체액뿐이지만 체액에는당연히 병원균과 각종 해충이 바글거릴 터며 그것들을 남김없이 없애지 않으면 특수청소하는 의미가 없었다.
"우선 오염의 근원부터 제거할까."
이오키베가 백엔숍에서 산 곤충망을 꺼냈다. 욕조내액체 표면에 고형물이 떠 있어서 시행착오 결과 곤충망으로건져내는 방법이 가장 수월한 길이라는 사실을 알게 됐다. - P100

"표면을 덮고 있는 젤리 형태 물질은 뚜껑 역할을 하거든 건져내자마자 엄청난 냄새가 뿜어져 나올 테니 조심해."
고형물을 건져 올리는 순간 훅하는 소리와 함께 하얀기체가 새어 나왔다. 방독마스크를 쓰지 않았다면 그 자리에서 기절했으리라. - P101

굳은 기름을 제거하자 머리카락 덩어리가 나왔다. 시신이 부패해 두피가 통째로 벗겨졌으니 고인의 헤어스타일이 어땠는지 짐작할 수 있었다. 역시 가스미가 놀란 듯 손놀림을 멈췄다.
(중략).
"사람은 죽으면 이렇게 부품처럼 변하네요.‘ - P102

고형물과 부패물을 양동이에 거의 다 옮겨 담은 다음에는 욕조 안쪽을 닦아냈다. 사용한 수건은 작업 후 모두 폐기한다. 다 닦아내면 전용 약품으로 살균과 탈취를 반복한다. 냄새의 근원을 완전히 뿌리 뽑지 않으면 오존 탈취기를 사용해도 의미가 없기 때문이다. - P102

두 번째 단계는 청소에 사용한 곤충망과 수건과 부패물을 폐기하는 것이다. 체액이 묻은 폐기물은 모두 감염성폐기물로 분류되기 때문에 다른 쓰레기와 함께 버릴 수 없다. 전용 용기에 모조리 넣어 뚜껑을 단단히 닫은 후 복도로 운반했다. - P103

"역시 피곤하지?"
"몸은 그렇게 힘들지 않아요.‘
(중략).
"솔직히 욕실에 들어가는 순간 토할 뻔했어요. 필사적으로 참았지만요."
"참았으면 대단한 거야." - P104

(전략).
"확실히 모순되기는 해. 그래서 가스미 씨는 어떤 결론을 내렸어?"
"결론이랄 것도 없죠. 여자관계가 복잡했다면 상황이이해가 가요. 사망자 본인은 요리 같은 건 전혀 안 하는 사람이지만 사귀던 여자 중에 요리를 좋아하는 사람이 있었겠죠. 화장품도 마찬가지예요. 집에 묵는 날이 많을수록자연히 여성용 세안용품 등도 늘어나죠. 경찰이 압수했을지도 모르지만 분명 세안용품 중에 여성용도 있을 거예요." - P105


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo