추천의 글
다시 한 번 독해력 교육을 돌아봐야 할 때
정혜승 경인교육대학교 국어교육과 교수
(전략). 그러나 2016년 알파고가 바둑 대국에서 이세돌 9단을 이기는 모습을 보면서 많은 사람들이 AI 기술이 인간을 이길 수 있을 뿐만 아니라 인간의 생존을 위협할 수 있다는 사실에 큰 충격을 받았다. 이 ‘사건‘ 이후 5년 뒤 또는 10년 뒤 사라질 직업을 검색하면서 Al부터 자신의 직업은 안전한지 걱정하거나 자녀에게는 어떤 직업을 갖게하는 것이 좋을지 고민하는 사람들이 많아졌다 - P10
저자인 아라이 노리코 교수는 먼저 AI와 AI 기술의 차이를 언급하면서 아직 AI는 존재하지 않고 그에 도달하기 위한 기술만 존재하며, AI가 인간의 능력을 넘어서는 순간인 ‘특이점‘은 불가능하다고 말한다. - P11
(전략). 그러나 150억개의 영어 문장을 학습하고도 일상적인 대화를 이해하지 못하는 인공지능이라니. (중략). 한편 이러한 ‘이해하는 ‘척‘은 안타깝게도 학생들에게서도 나타난다. 저자가 개발한 도구(리딩 스킬 테스트)로 평가한 결과 일본 중·고등학생들의 독해력 수준은 매우 낮은 것으로 나타났다. 높은 수준의 독해력이 아닌, 기초적인 문장 이해와 추론 능력을 평가하는 시험에서 많은 일본학생들의 점수가 우려할 만큼 낮게 나온 것이다. - P11
저자가 반복적 문제 풀이를 우려하는 것도 우리가 주목해야 할 부분이다. 프레임 안에서 반복하는 것은 AI가 가장 잘 하는 영역이므로 단순 반복적 교육은 AI와 차별화되는 인간의 능력을 계발하는 데 도움이되지 못한다. - P12
기본적인 독해력을 강조한다고하여 고차적 수준의 독해력을 기르는 교육이나 학생 중심의 창의적 교육을 하지 말자는 주장을 하는 것으로 이해해서는 안 될 것이다. - P12
추천의 글
정보 검색자를 넘어 인공지능 시대의 주역으로
이순영 고려대학교 국어교육과 교수
인공지능이 화두인 시대이다. - P13
생활의 편의를 제공하던 과학 기술이 AI를 실현하는 단계가 되면서 현재 우리가 직면한 감정은 ‘두려움‘이다. - P13
이제 우리는 인류의 긴 역사 속에서도 가장 중요한 변곡점에 이른 것을 인정하고, AI 시대에 살아남는 법을 고민해야만 한다. 다가올 미래에대한 두려움을 극복하는 가장 좋은 방법은 미리 알고 준비하는 것이다. - P14
이 책에는 일본 학생들의 독해력이 얼마나 부족한 수준인지를 설명하고 있지만, 사실 이 문제는 우리나라가 더욱 심각하다. 국제적으로 공신력이 있는 국제학업성취도평가(PISA) 결과에 의하면, 2006년 이래 우리나라 중등 학생들의 읽기 능력은 지속적으로 크게 하락하고 있다. - P14
AI의 시대에 ‘독해력‘을 갖추지 못한 학생과 개인에게는 미래가 없다. 텍스트의 의미를 깊이 이해하고 타인과 소통하며 새로운 지식을 만들어내는 역량이 없는 ‘정보 검색자‘들에게는 상상력도, 공감력도, 인지적 유연성도, 깊은 수준의 사고력도 기대할 수 없기 때문이다. - P15
2장
도로보군은 왜 도쿄 대학에 들어갈 수 없는가?
독해력과 삼식의 벽 : 주입식 교육의 실패
도쿄 대학 불합격
2011년부터 도쿄 대학 합격을 목표로 열심히 공부해 온 도로보군이지만 합격 전망은 여전히 어둡다. (중략). 5교과 8과목의편차치는 57.1로, 전국 756개 대학 중 70퍼센트에 해당하는 535개 대학에 합격할 확률이 80퍼센트가 넘는다는 판정을 받았다. 그중에는 MARCH나 간칸도리쓰에 속하는 유명 대학도 있다. - P91
그러나 편차치 65를 넘기는 것은 불가능하다고 생각한다. 그렇게 생각하는 데는 이유가 있다. 입시에는 현재의 AI가 지닌 능력으로 뛰어넘을 수 없는 여러 가지 벽이 있으며, 지금 보유한 기술의 연장선상에서는 그 벽을 넘을 수가 없기 때문이다. 벽을 돌파하려면 완전히 다른 방식이 필요하다. 이 장에서는 도로보군이 편차치 65를 넘어설 수 없는 이유를 설명하려 한다. - P92
도로보군에게 슈퍼컴퓨터는 필요 없다
(전략). 사실 이 프로젝트를 시작하고 얼마 지나지 않았을 무렵에 한 기관으로부터 "도로보군 프로젝트에 저희가 보유한 슈퍼컴퓨터를 사용해 주셨으면 합니다"라는 제안을 받았다. 그래서 프로젝트 연구자들을 대상으로 사용 희망자를 모집했는데, 모두가 난감한 표정을 지으며 "쓸 데가 없어요"라고 말했다. 그중에서도 수학 팀의 지적은 매우 흥미로웠다. "평범한 수준의 서버를 사용해서 5분 안에 풀지 못하는 문제는 슈퍼컴퓨터를 사용한다 해도 지구가 멸망할 때까지 못 풉니다." - P93
왜 인간이 이 문제를 쉽게 풀 수 있는지는 알 수 없다. 우연히 답이 대각선의 교점이어서인지도 모른다. 교점이라는 것은 인간에게 ‘자연스러운‘ 존재다. ‘페르마의 정리‘도 최근에 일본인 수학자 모치즈키 신이치(望月新一)가 증명해서 화제가 된 ‘ABC 추측‘도, 정리 자체는 고등학생조차 이해할 수 있을 만큼 ‘자연스럽다.‘ 그러나 컴퓨터는 ‘자연스러운 정리‘라는 것이 무엇인지 알지 못한다. - P94
양자컴퓨터도 마찬가지다. 요코하마 아레나 같은 거대한 공연장에서 모든 사람이 네트워크에 접속하려 할 때 어떤 액세스 포인트에 연결하면 원활한 접속이 가능한가 같은 문제를 해결하는 데는 양자컴퓨터가 유용할 것이다(한편 현재의 ID 및 비밀번호 시스템이 단숨에 붕괴된다는 엄청난 부작용도 뒤따른다). - P95
우리는 흔히 머리가 좋은 사람을 가리켜 두뇌 회전이 빠르다고 말한다. (전략). 여기에 일부 연구자나 언론이 "딥러닝은 인간의 뇌를 모방한 것입니다"라는 안이한 해설을 덧붙인 결과, "AI가 슈퍼컴퓨터로 딥러닝을하면 머리가 아주 좋은 사람하고 똑같아지겠구나"라고 지레짐작하게된 것이 아닐까? - P95
빅데이터에 대한 환상
2011년에 도로보군 프로젝트를 시작한 뒤로 나는 수많은 학회와 기업에 초빙되어 도로보군을 주제로 강연을 했다. (중략). 합격할 수 있다고 생각하는 사람들이 제시하는 근거는 크게 두 가지다. 첫째는 "얼마 전까지만 해도 컴퓨터가 프로 장기 기사를 이기는 날이 오리라고 누가 예상이나 했겠는가? 그러므로 인공지능이 도쿄 대학에 합격하는 날도 얼마든지 올 수 있다"라는 대답이다. (중략). 둘째는 "기출문제라는 빅데이터를 활용하면 가능할 것이다"라는 대답이다. 나는 이쪽이 좀 더 심각한 문제라고 생각한다. (후략). - P96
도쿄 대학 합격자의 센터 시험 정답률은 약 90퍼센트다. 도로보군이 센터 모의시험을 볼 수 있도록 협력해 준 입시 학원 요요기 제미날에서는 "영어의 경우 만점 가까이 받지 못하면 (도쿄 대학 합격은) 무리입니다"라는 조언을 들려줬다. - P97
(전략). 즉, 대학 입시의 경우에는 빅데이터를 모으고 싶어도 모을 수가 없다는 말이다. 게다가 빅데이터가 모였다 한들 그것을 활용해서 입시 문제를 풀 수 있게 되리라는 보장도 없다. - P97
AI에 대한 미국과 일본의 인식 차이
한편 왓슨을 개발한 IBM의 인식은 이와 대조적이다. 도로보군에 관한 《뉴욕타임스》의 특집 기사에서 IBM은 "이만큼 다양한 영역을 아우르는 입시 문제를 (불과 수년 안에) 높은 정확도로 풀기는 매우 어려울것"이라는 견해를 내비쳤다. (전략). AI에 관한 미국과 일본의 인식에는 큰 차이가 있다. 그중 하나가 AI에거는 기대이다. 도로보군에 대한 ‘과대평가‘에서도 알 수 있듯이 일본에서는 AI 전문가조차도 가까운 미래에 AI가 꿈같은 세상을 실현해 줄 것이라고 기대하지만, AI 분야를 선도해 온 미국에서는 AI의 실력을 냉정하게 판단하는 연구자가 많은 듯하다. - P98
또한 Al에 대한 투자 면에서도 현실 감각의 차이가 보인다. 일본의 경우는 AI에 그토록 큰 기대를 품고 있음에도 정부와 기업 모두 무엇을지향하며 AI에 투자해야 하는가라는 현실 감각이 결여된 까닭에, 허황된 소리를 하는 연구자에게 거액의 예산을 안겨주거나 무작정 고액의 비용을 들여 AI 컨설팅을 받고 보는 등 우왕좌왕하는 모습이 눈에 띈다. - P98
왜 이런 차이가 생겨났을까? 여기에는 두 가지 이유가 있다. 첫 번째 이유로는 <제5세대 컴퓨터 프로젝트>의 실패가 남긴 여파를들 수 있다. 이는 1982년 당시 일본의 통상산업성(오늘날의 경제산업성)이추진한 국가 프로젝트다. 논리적인 추론을 고속으로 실행하는 병렬 추론 기계 및 운영체제를 구축함으로써 논리를 통한 자동 진단과 기계 번역을 실현한다는 목표 아래 500억 엔이 넘는 예산이 투입되었다. - P99
. "이런 꿈을 실현하고 싶다"라는 희망찬 이야기나 "사실 <제5세대 컴퓨터 프로젝트>는 성공했다"라고강변하는 보고서는 발견했지만, 정작 중요한 문제인 "왜 실패했는가?", "어떻게 실패했는가?"에 관한 보고서는 존재하지 않았던 것이다. - P99
두 번째 이유로는 많은 미국 기업이 현실적인 사정 때문에 AI를 필요로 했다는 점을 들 수 있다. 미국에서는 구글이나 페이스북 등이 엄청난 데이터가 자동으로 축적되는 ‘무료 서비스‘를 전 세계 규모로 확대해나가고 있다. 대규모 무료 서비스를 제공하는 업체의 경우에는 "인력을쓰지 않고 서비스를 제공할 수 있는가?"를 정확히 판단하는 것이 경영의 성패로 직결된다. - P100
요컨대 제조 기업은 딥러닝처럼 통계에 입각해서 판단했다가 중대한사고를 초래했을 때 그에 대한 책임을 져야 한다. 배상 책임뿐만 아니라사고에 따른 브랜드 이미지 훼손까지 고려해야 하는 까닭에 쉽사리 신기술 개발에 손을 댈 수가 없다. - P101
가시밭길을 걷게 된 도로보군의 영어 공략
(전략). 앞에서 나는 도로보군이 세계사 문제를 푸는 방식은 기본적으로 왓슨과 같은 정보 검색 방법을 따른다고 말했다. 또한 수학 문제가 특유의 정확하고 한정적인 어휘로 서술되어 있다면 논리적인 자연어 처리와수식 처리를 조합해서 고득점을 올릴 수 있다는 이야기도 했다. 그런데 이 두 가지 방법으로 극복할 수 없는 과목이 있다. 바로 국어(일본어)와영어이다. - P102
영어는 더욱 난적이었다. 프로젝트가 시작된 2011년에 센터 시험 기출문제를 분석했을 때, 내부의 자연언어처리 팀이 "지금의 자연언어처리 기술로는 해결이 곤란한 문제가 집중적으로 배치되어 있다"라고 말한 과목은 현대 국어가 아닌 영어였다. 사실 센터 시험의 영어는 어느 정도 출제 패턴이 정해져 있다. 첫 번째는 단어의 발음과 강세 문제, 두 번째는 문법이나 어법, 어휘 등 주로 문법과 관련된 문제다. 여기까지는 오늘날의 AI로 어떻게 대응해야 할지 전망이 선다. 만점을 받을 자신이 있다는 말은 아니다. - P103
어딘가의 연구 그룹이 도로보군이 영어 과목을 극복하는 데 도움을주지 않을까? 2013년 나는 고심 끝에 NTT의 커뮤니케이션 과학 기초연구소의 문을 두드렸다. (중략). 내가 제일 먼저 찾아간 곳은 기계 번역팀이었는데, 그때 기계 번역 팀의 젊은 연구원에게 들은 말이 지금도 잊히지 않는다. "이건 센터 시험 특유의 부자연스러운 영어입니다. 점수를 내고 싶다면 센터 시험의 일영 대역 데이터를 100만 건 가져와 주십시오. 그러면 검토해 보겠습니다." - P104
200점 만점에 120점을 목표로 영어 팀을 결성하다
그런 어려운 상황 속에서 "재미있어 보이네요. 한번 해봅시다"라며 발 벗고 나서준 사람들이 있었다. NTT도코모의 음성 인식 비서 서비스 ‘말해줘 컨시어지‘ 개발의 핵심 멤버였던 히가시나카 류이치로(東中郞一郎)와NTT 출신의 대학 연구원들이었다. - P105
영어 팀은 ‘200점 만점에 120점‘을 첫 5년간의 목표로 삼았다. 첫 번째 문제와 두 번째 문제를 완벽하게 풀고, 세 번째 문제는 정답률 70퍼센트를 목표로 하며, 네 번째 문제와 다섯 번째 문제 중 기계 번역이나정보 집약 기술로 풀 수 있을 것 같은 문제는 놓치지 않는다. 이렇게 함으로써 확실하게 100점을 쌓아나간다. 그리고 나머지는 당분간 운에 맡기기로(달리 표현하면 ‘연필을 굴리기로‘) 했다. - P105
상식의 벽에 부딪히다
연구실의 문을 열고 들어온 로봇이 냉장고를 열더니 그 안에 있는 주스캔을 꺼내 사람에게 건넨다. 최첨단 인간형 로봇의 시연회에서 종종볼 수 있는 광경이다. 그러나 설령 그 로봇을 독자 여러분의 집에 파견한들 냉장고에서 주스 캔을 꺼내 오지는 못할 것이다. - P106
요컨대 지극히 한정된 조건하에서가 아니라면 로봇은 냉장고에서 주스캔을 꺼내는 일조차 쉽게 하지 못한다는 말이다. 로봇이 "체스 챔피언은 이겨도 근처에 심부름조차 보내지 못한다"라고 놀림받는 이유가 여기에 있다. - P106
그런데 사실은 여러분이 잘못 생각하는 것이 있다. 우리 인간이 ‘단순하다‘라고 여기는행동이 사실 로봇에게는 단순하기는 커녕 매우 복잡한 행동이라는 점이다. - P107
150억 문장을 암기시키다
2014년 가을 도로보군은 센터 모의시험의 영어 과목에 도전했다. 첫번째 문제인 발음과 강세 문제를 무난히 돌파한 후, 기출문제에서는 84퍼센트의 정확도를 보인 어구 정렬 문제에 돌입했다. 어구 정렬 문제란 이를테면 다음과 같은 문제를 말한다.
This problem is tool [ ] [ ] [ ] [ ][ ] [ ] Jease. 위의 미완성 문장의 빈칸 6곳에 (complex, me, solve, for, to, with)를 적절히 집어넣어 올바른 문장으로 만드시오. - P108
인간 수험생이라면 어휘와 문법, 구문에 대한 지식을 이용해 이 문제를 풀 것이다. too를 실마리로 삼아 ‘too+ 형용사 + for 목적격+ to 동사원형‘이라는 구문 유형에 맞춰 의미 있는 문장을 완성시키는 것이다. 한편 우리는 도로보군에게 문법도 구문도 일체 가르치지 않았다. - P108
"올해부터 출제 경향이 바뀌었나요? 도로보군의 성적이 아주 처참합 "니다." "그런가요? 특별히 출제 경향이 바뀌었다는 느낌은 받지 못했습니다. 예년과 다를 바 없는 문제였어요. 수험생의 정답률도 별 차이가 없었고요." 요컨대 다른 수험생들에게는 기출문제와 별반 다르지 않은 문제가 도로보군에게는 ‘전혀 다른 문제로 다가왔다는 뜻이었다. - P109
①~⑥을 나열해 적절한 문장을 만드시오.
Maiko: Did you walk to Mary‘s house from here in this hot weather? Henry: Yes. I was very thirsty when I arrived.
So [ ] [ ] [ ] [ ] [ ] [ ] drink. ① asked ② cold ③ for ④ I ⑤ something ⑥ to - P110
도로보군은 3,300만 개의 문장을 검색한 끝에 정답 후보를 두 개로 압축했다.
So Cold. I asked for something to drink. (추워서 마실 것을 부탁했어.) So I asked for something cold to drink. (시원한 음료를 부탁했어.)
두 문장 모두 문법적으로는 이상하지 않다 - P110
대화하는 AI는 구글과 아마존, 마이크로소프트, IBM, 소프트뱅크등 AI를 연구하는 전 세계 기업들이 총력을 기울이고 있는 분야다. 정말로 대화하는 AI가 실현되려면 당연히 센터 시험의 객관식 회화문 완성 문제 정도는 맞힐 수 있어야 한다. 그러나 현재의 AI는 그런 수준에전혀 미치지 못한다. - P112
영어 팀이 경험한 ‘실패‘는 논문에 실리지 않는다. 뉴스에 보도될 일도 없다. 뉴스에 보도되는 것은 딥러닝이 성공한 사례뿐이다. 그러나 여러분의 회사에 도움이 되는 것이 과연 성공 사례뿐일까? "아무리 투자를 해도 딥러닝으로는 성과가 나지 않는다"라는 점이야말로 지금 모두가 간절히 필요로 하는 정보가 아닐까? - P113
센터 시험의 정답률을 높이는 데 필요한 것은 ‘오류가 없는 교과서적인 영어‘이다. 트위터에 올라오는 일본어 트윗 가운데 교과서적인 일본어가 차지하는 비율이 얼마나 되는지를 생각해 보면, 영어 트윗 가운데교과서적인 영어가 얼마나 적을지도 쉽게 상상할 수 있다. 문법에 맞지 않은 영어 문장은 아무리 늘어난들 데이터의 축적에 도움이 되지 않는다. - P113
의미를 이해하지 못하는 AI
컴퓨터는 계산기다
(전략). 내가 어디에 있든 간에 회사 근처로 돌아가는 방법을 알려달라고 하면 스마트폰은 금방 가르쳐준다. 선물로 받은 송이버섯을 맛있게 요리하는 방법도 척척 알려준다. - P115
그러나 AI는 의미를 이해하지 않는다. 입력에 반응해서 ‘계산‘한 답을 출력할 뿐이다. - P115
AI(컴퓨터)가 계산기라는 말은 계산할 수 없는 것, 달리 말해 덧셈과곱셈의 식으로 번역할 수 없는 것은 처리하지 못한다는 뜻이다. 그래서 AI 연구자들은 영상 처리를 하는 방법, 질문에 응답하도록 하는 방법, 영어를 일본어로 번역하는 방법 등 세상의 온갖 것을 수식으로 나타내기 위해 매일같이 두뇌를 전력으로 가동하고 있다. - P116
수학의 역사
(전략). 인간의 인식이나 인간이 인식하고 있는 사상을 수식으로 번역한다는 것. 이는 곧 수학의 역사라고 할 수 있다. 17세기 이탈리아의 천문학자 갈릴레오 갈릴레이는 ‘우주는 수학이라는 언어로 쓰여 있다"라고 말했다. 갈릴레이가 등장하기 전의 중세 수학은 굳이 따지자면 신학이나 점술과 매한가지인 존재였다. - P116
한편 당시 천문학의 중심지였던 프랑스에서는 가톨릭의 역사에 남은 엄청난 사건이 발생했다. 두 명의 교황이 서로 자신의 정통성을 주장하는 ‘교회의 대분열(시스타)‘이 일어난 것이다. (중략). 그러자 빈의 합스부르크가문이 그들에게 손길을 내밀었는데, 천문학자가 아니라 점성술사로서 초빙하고자 한 것이었다. 날씨는 농작물의 작황에 영향을 끼치며 작황은 국가의 힘을 좌우했기 때문에 통치자인 합스부르크 가문은 점성술에 매우 큰 관심을 보였다. 그 무렵 사람들은 태양도 딜도 별도 구름도 전부 한 하늘에 있으며, 태양이나 달, 별을 관측한 데이터를 수집·분석하면 향후의 날씨나 작황을 예측할 수 있을 것이라고 여겼다. (후략). - P117
그러나 중세의 빅데이터 과학이 이루어낸 성과가 전혀 없었던 것은 아니다. 당시 개발된 십진 소수나 로그와 같은 계산 기술은 현재까지도 남아 있으며, 특히 로그의 발견은 당시 천문학자들의 수명을 두 배로 연장시켰다는 말이 있을 만큼 혁명적이었다. - P118
이런 것을 보면 과학적 발견은 어떤 한 사람이 갑자기 떠올린 영감에서 비롯되기보다 때가 무르익어 동시다발적으로 ‘언어로서‘ 출현할 때가 많은 것 같다. 수학의 언어는 선형적으로 발전하지 않는다. 특정 시기에 지수함수적으로 발전하며, 그 언어를 전부 소화하고 나면 안정기에 접어들어서 이후로는 아주 천천히 발전하게 된다. - P120
통계에 크게 주목했던 유명한 인물로 플로렌스 나이팅게일이 있다. ‘백의의 천사‘라고 불리며 간호사의 시조로 알려진 나이팅게일은 매우논리적인 여성이었다. 그녀는 병동의 관리와 매일매일의 간호 업무에관해 상세한 기록을 남겼다. 병들거나 다친 군인 중 사망자의 수와 감염자의 수를 나날이 기록했고, 통계 데이터의 변화를 바탕으로 병동에 배치된 침대의 적절한 간격을 계산했으며, 환기 방법 및 시트 세탁법 등을 과학적으로 확립했다. - P121
수학이 표현할 수 있는 것 : 논리, 확률, 통계
이야기가 조금 옆길로 샜는데, 내가 하고자 하는 얘기는 이런 것이다. 수학은 기나긴 역사를 통해서 인간의 인식이나 인간이 인식하고 있는 사상을 설명하기 위한 수단으로 논리와 확률, 통계라는 언어를 획득했다. 혹은 이 세 가지 언어만을 획득할 수 있었다. - P122
|