당신이 알고 싶은 음성인식 AI의 미래 - PC, 스마트폰을 잇는 최후의 컴퓨터
제임스 블라호스 지음, 박진서 옮김, 장준혁 감수 / 김영사 / 2020년 1월
평점 :
장바구니담기


<당신이 알고 싶은 음성인식AI의 미래> 라는 책은 

현재까지의 음성인식 기술 발전 과정과 앞으로의 예측을 실리콘밸리에서 일어났던 AI 경쟁을 통해 알려줍니다


2011년 10월 애플이 SIRI를 발표

2014년 봄 MS는 코타나 발표

2014년 11월 아마존 에코 발표

2016년 구글 어시스턴트 발표


인류의 가장 편안한 의사소통 방식은 "음성" 이라고 합니다.


고런 기초적인 연유로 음성, 컴퓨터과학자들과 SF작가들은 명령어 입력방식을 "말로" 하는 것에 대해 끊임없이 생각하고 방법을 연구해보고 있었다는 것


이 책에선 SIRI가 음성인식 AI의 태동(물론 지금은 알렉사와 구글 어시스턴트가 대세고, 알렉사가 최고로 발전가능성이 높다고 저자가 말미에 이야기 합니다.)

이므로 SIRI 가 나오기까지 연대기를 살펴본 후 발전 가능성까지 고찰해봅니다.




                             

시리의 결점때문에 대부분의 사람들은 기술 혁명의 중요성을 높이 평가하지 않았지만, 애플의 경쟁사들은 그 중요성을 간과하지 않았다. 실제로 시리가 공개될 무렵에는 모든 경쟁사가 음성지원 비서를 연구하고 있었다.

P.34

 

- 2008년


마술사를 꿈꾸던 컴퓨터공학자 애덤 체이어(1988 브랜다이스대 컴공졸)와 모토로라 지사장 출신으로 모토로라의 안드로이드 폰 주도 작업 실패로 갈길을 잃었던 대그 키틀러스 그리고 스탠포드대학교 컴퓨터 공학자 톰 그루버가 2008년 1월 독립벤처로 SRI인터내셔널에서 분사한 액티브테크놀러지를 만든다.

말그대로 가상비서를 만든다는 이념으로(초장기 투자자금 850만달러 받음)


20여명의 직원으로 가상비서 시스템 개발진행 ; 처음엔  HAL이라고 이름 붙힘(2001 스페이스 오딧세이의 악당 AI)

추후 노르웨이식 이름 SIRI ; 당신을 승리로 이끄는 아름다운 여성! 으로 변경하여 개발

(에이전트- 카테고리 방식/ 단어가 아니라 전체적인 의도를 파악하는 알고리즘; 온톨로지)


- 2010년


2010.2.4 개별앱으로 출시하였고

스티브 잡스의 눈에 뛰어 

2010.4.30 미공개가격으로 애플에 매각됨(1억 5천만달라에서 2억 5천만 달러라고 소문남)


-2011년

2011.10.4 애플 아이폰에 탑재, 시리공개(10.5 잡스 사망)

이때부터 시리는 최초의 탑재형 가상비서가 되고, 발전을 거듭하지만  잡스가  죽어서 관심이 덜해서 인지 생각만큼 크게 발전 하지 못하고, 혹평도 받는다


- 아마존의 반격

<스타트렉>을 어렸을 때 부터 아주 즐겨봤다던 제프 베조스는 아마존이 내세우는 컨텐츠가 킨들 밖에 없어 고심중

2011.9. YAP을 인수하며 도플러 프로젝트 추진 (음성인식과 자연언어이해, 원거리 음성인식을 목표)

2014.11 아마존 에코출시(알렉사 탑재 ; 알렉사는 알렉산드리아 말함/ 가장 발달한 원거리 음성인식과 언어이해로 아마존 이용까지 가능)

아마존은 그전까지의 가상비서들이 물어보면 가능답변들을 알려주는 단계(검색시스템)에서 한단계 더 나아가

완벽한 해결법을 알렉사가 제시해주는 방법을 고민하고, 트루테크놀러지라는 업체를 인수해 에코에 탑재

취지는 더 검색안해도 되게 확답을 주게 하려고 한답니다!


그후 페북의 저커버거가 자비스 같은 음성인식을 만든다고 하고, 안끼는데 없는 MS 마저 코타나 출시 하며 

군웅할거의 음성인식 전쟁이 실리콘 밸리에서 일어나는 중


지금도 계속해서 음성인식 개발에 박차를 가하고 있는 상태인데,

애플은 잡스가 없어서인지, 시리 개선에 그다지 속도를 내지 못함

아마존은 아마존생태계와 어울려, 에코의 저가보급 등을 통해 끊임없이 생태계 확장하고 있어 향후 발전 가능성이 높음


음성인식을 획기적으로 발전시킨 기술(여기는 제가 문돌이라 제목 위주로 요약)

1. 머신러닝(인공신경망, 딥러닝)

2. 음성인식시스템(신경망 접근법, 음성과학자들의 음성컴퓨팅 개발)

3. 자연어 이해

   ; 언어를 숫자로 나타내는 워드임베딩(어휘 각각에 고유한 벡터를 부여해 분포의미로 특징을 식별

4. 자연어 생성

   ; 시퀀스 투 시퀀스 (사람이 말한 것 -> 컴푸터가 응답해야 하는 것) 전환시스템

5.. 음성합성기술

   ; 파라메트릭(파형을 합성하고 조합해 음성샘플 만듦)



그외 

애플이나 아마존은 헐리우드 극작가를 고용해 가상비서 시리나 알렉사에 캐릭터를 설정하고 의미부여를 하는 부서가 있음

단. 구글은 이름부터 어시스턴트라고 개별 이름을 짓지 않으며 인간성을 부여하려 하지 않음!(공대마인드!)



앞으로는 더욱더 발전할 음성인식AI의 모습으로 

대화전문가(친밀감을 느낄 수 있는 존재) -> 음성인식 친구AI (헬로 바비 ; 음성인식 바비인형) -> 현인 ; 모든 답을 알려준다 (아마존 에코에 탑재된 트루놀리지 시스템의 이념) 

을 보여주고,


개인정보문제,

2015년 벤턴빌 살인사건에서 그 장소에 아마존 에코가 있었다면 녹음한 것이 있을 수 있다는 전제하에

판사가 영장을 발부해 아마존 에코 서버를 조사한 사건을 계기로 음성인식시스템이 개인정보를 어느정도 침해하는가 문제와...

(에코 조사 결과, 쇼핑기록만 있고, 단서가 될만한 게 녹음된 거는 없었다고 합니다)


미래의 불멸을 대비한 DAD봇 등에 일정한 기억과 시퀀스를 삽입한 음성인식을 통해 

우리가 잃어버린 존재에 대한 추억으로 기능할 음성인식로봇까지 살펴봅니다.


 참고로 시리의 최초개발자들이  애플에서 퇴사후(잡스 사후 1년도 안되 다 나옴) 다시 만든 

VIV(라틴어로 삶) 라는 인공지능 업체를 2억 1천 4백만달러에 삼성이 인수해 (2016년)

삼성도 음성인식 AI에 도전(그게 빅스비인가?????)



저자가 향후 예상하는 음성인식 AI의 업계전망

1. 애플(제조업체로, 제조 하드웨어에 보다 신경을 많이 쓰고, 고가 정책(아이폰이나 홈팟 너무 비쌈/ 잡스 사후 잡스만큼 시리를 중요하게 생각치 않음!)

2. MS(900명 이상의 음성인석 전문인력에, 소프트웨어 강자지만, 모바일 플랫폼 부재로 그냥 고군분투 중/ 안습이라는 뉘앙스)

3. 페북 (와일드카드! 저커버거의 의지와 이용자수 50억명 이상이니 뭘 해도?)

4. 구글과 아마존( 둘다 AI 생태계 확보를 위해 저가에 구글홈이나 에코 등 적극 보급에 나서 향후 발전가능성이 높은데, 저자는 AI와 수익이 연결될 수 있는 쪽은 아마존쇼핑과 연계될 수 있기 때문에 아마존쪽이 우세할 거라고.....)

5. 아따 삼성은............../ 빅스비는.........언급이 없네요,......



-----------------------------------------------------------------------------

- 미국에는 참 엔젤투자자들이 많네요! 끊임없이 투자 받습니다. 많이도 망하고요

- 실행가들(?) 과 혁신가들이 끊임없이 경쟁하니 뭔가가 나옵니다. 애플, 아마존, 구글, ms 박터지게 싸움

- 음성인식 이름이나 창업가들의 꿈 이야기 할 때 sf 영화(스타트렉, 스페이스오딧세이)나 문학(신화) 등이 모티브로 많이 나옵니다.

- 애플은 잡스 사후, 관리의 팀쿡이 맞는 듯/ 예전 구글맵이나 시리 등 모두 스티브 잡스가 직접 전화해 연락 잡아 무조건 인수하던데, 팀쿡은 이런 모습이 예전보다는 덜한 듯/ 창업자가 아니니 맘대로 할 수 없는게 당연한지도 모르겠지만요....그래도 비츠 인수는 대박? 인건가 .....에어팟도 대박이긴 한데....

- 음성인식의 아버지(?) 아담 체이어는 2008년 애플에 시리 한번 팔고(2억달러) 다시 2016년 삼성에 viv 2억달러에 팔았으면 대략 4억달러...........

- 대화형 ai를 아마존에서 업글하기 위해 <알렉사프라이즈> 진행하는 이야기가 나오는데, 전세계 유수의 대학참가팀들에게 상금을 미끼로 대회를 하면서 심지어 그 동안에도 알렉사에 시험하며 머신러닝시키는 모습 후덜덜.....그후 채용까지

- 언어입력이나 이해의 어려움에 대해 엄청 설명하고 또 그걸 극복하고 해결하는 모습은 문돌이로는 저걸 어떻게 코딩하는 거지에 대한 궁금증은 계속 생깁니다.

 

 


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo