[알라딘서재]구글에서 배우는 딥러닝

구글에서 배우는 딥러닝ｌ마이리뷰

빙혈 () l 2017-10-03 22:26

https://blog.aladin.co.kr/773561189/9631907

구글에서 배우는 딥러닝 닛케이 빅데이터 지음, 서재원 옮김 / 영진.com(영진닷컴) / 2017년 9월 평점 :

사람처럼 생각하고 스스로 학습하며 사람보다 더 정확한 판단을 내릴 줄 아는 실체가 등장한다면, 사람이 기존에 하던 일을 모두 대신할 것이 분명합니다. 같은 일을 맡겨도 더 바람직한 성과를 낸다면, 당연히 "그것"이 사람을 밀어내야 하지 않겠습니까? 그런데 만약 인간의 미래가 그런 방향으로 진행한다면, 우리는 미래를 대비할 필요가 없습니다. 모든 변화를 그저 겸허히 수용하는 마음 자세를 다지거나, 혹 남는 힘이 있다면 관계 당국에 "기본 소득제를 빨리 시행하라!" 같은 청원을 넣는 데 쓰면 충분합니다. 자기 힘으로 번 돈이 아닌데 과연 "소득"이란 말을 쓸 수 있을지는 극히 의문이긴 하죠.

먼 미래에는 어떤 모습이 될지 모릅니다만, 현재까지의 발전상을 보면 이른바 AI라는 것이, 현재 기업들에서 무분별하게 광고해 대는 단계에는 아직 현저히 미치지 못하는 게 분명합니다. 대신, "그 앞에 굴복해야 할 것"이 아니라, "가지고 놀면 아주 재미있고 유용한 것"이라는 건 아주 확실합니다. 이는 완제품 형태의 소비재로서도 그렇고(NUGU, 에코, 이 책에도 나오는 구글홈 같은 것들), 개발자나 사업가 입장에서도 그렇습니다. 훨씬 의미가 큰 건 후자인데, 제3의 물결 당시 기회를 한 번 놓쳤던 분들은, 이번 기회는 반드시 잡아채어야 거대한 부의 끝자락이라도 향유할 수 있을 것입니다. 그러기 위해서는 현재 AI 개발의 트렌드를 선도하는 "딥 러닝" 기법에 대해 개략적인 컨셉이라도 잡을 필요가 있겠고, 전혀 개념이 안 잡힌 독자, 그러면서도 당장 어느 지점에서 첫발을 떼야 하긴 하는 분들에게 이 책이 아주 유용한 길라잡이 구실을 할 수 있겠습니다. 영진닷컴에서 출판되었다고 혹시 수험서 아닌가 착각하시는 분들도 있겠는데, 아닙니다. 전혀 모르는 독자들 읽으라고 낸 책입니다. 머신 러닝 관련해선 아직 자격증 제도가 마련된 바 없고, 제 생각에는 다른 프로그래밍 분야에 비해 "자격증"이 가장 덜 필요해질 섹터가 아닐까도 싶습니다.

제3의 물결로 대변되는 정보화 사회에서는, 프로그래머, 시스템 분석가의 역할이 매우 중요했습니다. EDPS는 아직 용량과 효율이 미흡하여, 밀도 높게 설계된 프로그램의 도움 없이는 유의미한 작업을 전혀 해 낼 수 없었고, 이 때문에 "소프트웨어"의 역할이 그처럼 중요했던 것입니다. 현재까지도 예컨대 "삼성은 하드웨어에 집착하는 이상 미래가 없다. 구글처럼 소프트웨어 중심 기업으로 가야 한다" 같은 (딱히 뚜렷한 근거도 없는) 예언 같은 진단이 인기를 끄는 건 이 영향이남아서라고 볼 수 있습니다. 딥러닝은 그와는 정반대입니다. 사람이 짠 프로그램의 도움, 명령을 일일이 의존하지 않아도, 방대한 데이터셋으로부터 자신이 스스로 모델을 만들고, 어떤 경로로 그러는지 자신도 모른 채(이게 중요하죠) 정확한 답을 도출합니다. 이 컨셉 자체는 아주 예전부터 생각되었으나, 1) EDPS는 성능이 떨어지고, 2) 얘한테 학습을 시킬 방대한 데이터가 부족했죠. 프로그램을 대신할 정도로 유의미한 "학습"을 시키려면, 데이터라도 엄청 많아야 했는데 그럴 모을 방법이 없었던 예전입니다. 현재는 이 두 가지 장애가 모두 극복(AI 개발 때문에 인위적으로 추진된 건 아니고[그런 건 절대 불가능], 다른 분야에서의 성과가 우연히 이 쪽에 유입된 거죠)되었기에 가능합니다. 즉, 그닥 창의적인 혁신은 아닌 셈입니다.

작년 상반기 구글의 허사비스 CEO가 야심차게 선보인 "알파고" 때문에 특히 자극 받은 건 일본인가 봅니다. 현재 한국은 이 분야 투자나 발전이 아주 더디며, 온갖 걸 다 과잉투자하는 중국은 예상 밖으로 인공지능에 대해서만은 큰 관심이 부족하다는군요. 일본인들답게, 전문 지식을 최대한 문외한들이 알기 쉬운 수준으로 변환시켜, 자신들의 상식에 맞는 체계로 하나하나 더듬어 올라가는 모습이 훤히 보이는 책 구성입니다. 그런데 이 이유 때문에, 이 분야에 대해 전혀 알지 못하는 독자들이 읽기엔 참 편합니다. 제목은 "구글에서 배우는 딥러닝"이라고 되어 있지만, 이는 기법을 현저히 발전시킨 주체가 구글이라서일 뿐이고, 그 내용은 구글의 성과를 차근차근 독자의 눈높이에 맞게 설명함과 동시에, 현재 일본의 여러 기업들이 어느 수준에까지 다다랐는지까지도 풀어 헤치는 방향입니다.

책에서는 일단 "딥러닝은 머신 러닝의 많은 기법 중 하나이다."라는 전제를 깔고 설명을 시작합니다. 사실 제 생각에 사업상, 혹은 기타 실용의 필요로 이 분야를 공부하는 이들에게는, 이런 체계 제시가 필요없다고 봅니다만, 일본 책 답게 "프로그램은 그저 돌아가기만 하면 되는거여!" 같은 부실, 날림 사고와는 매우 거리가 먼, 돌다리도 두들겨 가며 건너는 소심함이 돋보이는 대목입니다. 머신 러닝의 다른 기법 준 하나로 "귀납 추론"이 간략하게 설명도 되어 있습니다만, 사실 일반적인 프로그래밍과는 정반대로, 대전제→ 소전제→ 결론(이게 연역입니다)의 단계를 거치지 않는, 방대한 사례로부터 합당한 결론을 이끌어내는 귀납적 사고는 모든 머신 러닝에 공통적으로 들어 있다고 하겠습니다.

pp. 17~20에 제시된 뉴럴 네트워크에 대한 설명이, 독자로서는 기존의 전산 처리 시스템과 이것이 무슨 차이가 있는지 가장 역점을 두어 이해해야 할 대목입니다. 중간계층이 여러 층으로 구성되어야, 복잡한 특성을 지닌 데이터를 처리할 수 있고, 이것이 위로 올라갈수록 고차원의 판단으로 수렴할 수 있습니다. 사람의 인지 구조를 모방한 것인데, 사실 딥러닝 자체가 천재적인 발상으로 고안된 건 아니고, 책에도 나와 있듯 그저 "실용적이고 쉬운 방법으로 인공지능을 구축할 수 있어서"일 뿐입니다. 그러니 일반인들은 "아니 전산학 개론도 어려워 죽겠는데 머신러닝을 어떻게 배우라고?" 처럼 겁을 먹을 이유가 전혀 없습니다. 도스보다 뒤에 나왔다고 윈도가 더 어려운 게 아니듯 말입니다. 딥러닝은, 이치만 잘 알면 그저 갖고 노는 장난감에 불과하며, 책 후반부에도 나오지만 무슨 레고 메뉴얼 부록으로 주듯 구글에서는 API를 무료로, 일반인들도 갖고 놀아 보라고 자신들 사이트에 게시해 놓기까지 했습니다.

인공지능을 활용한 필터링을 통해 G메일은 스팸메일을 크게 줄였다고는 합니다만, 제 개인적으로는, 처음 메일을 제게 보낸 거래 상대방이 이미지 파일을 첨부해서 보냈다는 그 이유 때문만이었는지, 이 중요한 메일을 스팸함에 넣어 큰 곤란을 겪을 뻔했습니다. 이게 빅데이터의 함정입니다. 대세, 주류는 양적으로 판단할지 모르나, 질적인 소수의 중요성을 전혀 분간 못 합니다(그리고, 별로 개선될 것 같지도 않습니다). 외국어 통역 등도 결정적인 팩터는 "남들이 잘 쓰지 않는 미묘하고 고급진 표현"을 다루는 데에 있는데, 그걸 천한 빅데이터로 과연 귀납해 낼 수 있겠습니까? 아직까지는 단순 반복, 비창의적 영역에 이 AI라는 게 용도가 제한되었음도 우리는 알 수 있겠습니다.

앞서도 말했지만 이 딥러닝을 통한 여러 성과물은 우리 일반인들도 (마치 컴맹도 윈도 쓰듯) 갖고 놀 수 있다는 게 큰 장점입니다. 현재까지 구글이 얼마나 이 장난감을 개발시켰는지 확인하려면, 책에도 나와 있지만 아래 사이트로 들어가보시면 될 듯합니다. (역자분께서 현재는 API가 여섯 개로 늘었다는 사실까지 친절히 알려 주시네요. 이미지를 클릭하면 해당[구글] 사이트로 이동합니다)

일본과 중국 여러 기업에서 이 AI를 채택한 여러 사례를 책에서 소개합니다. 흥미롭기도 하고, 이 결정이 기존 채용 인력을 감축하는 데까지 이어지지는 않지만(그러나, 기업마다 사정이 다를 것입니다), 장래 채용 인원을 줄이는 데에는 영향을 끼치리라는 전망도 합니다. "아직은 복잡한 응대에 사람이 필요합니다."라는 관계자의 말. 인공 지능 시대에 하나 확실한 건, 자기 일 어설프게 하는 사람은 모조리 도태된다는 결과입니다. 똑부러지게, 창의적으로, 핵심을 이해하고 알고리즘의 먼 단계까지 내다보는 능력이라야지, 남의 말이나 외우고 따라하며 부족한 부분을 감추느라 목소리만 높이는 사람에겐 전혀 장래가 없습니다.

저자는 "...우리가 어렸을 때 배운 암상자와도 같아서, 무슨 메커니즘이 작동하는지는 컴퓨터도 모르고 우리도 모르지만, 여튼 적합한 결과가 튀어나온다" 같이 설명합니다. 우리나 일본이나 특정 시기 교육 커리큘럼이 비슷해서, 저 역시 "어둠 상자" 그림이 교과서에 나왔던 게 기억 나네요. 예전에도 그랬고 가까운 미래에도 역시, "맥락"을 이해하는 건 아직은 사람의 지성과 감성밖에 없습니다. AI는 도구일 뿐이며, 마법처럼 도출한 결과를 두고 "어떻게 해서 그런 결과가 나왔는지"까지 알아내는 사람만이, 미래의 경쟁에서 한 발 앞서 나갈 것입니다. 단순 반복 노가다는 사람이 할 게 아니라 기계한테 시켜야죠.