5장은 음성 인식, 자연어 처리, 그리고 인공지능을 결합한 기술로 설명할 수 있는 스마트 스피커에 관해 다루고 있다. NLP로 처리된 명령을 기반으로, 스마트 스피커는 관련 작업을 수행하거나 정보를 찾아낸다. 그런 다음, 음성 합성 기술을 사용해 텍스트 결과를 다시 음성으로 변환해 사용자에게 답변을 제공한다. 단순한 음성 인식 장치를 넘어서, AI의 도움으로 지속적으로 사용자와의 상호작용을 개선하는 디지털 비서로 진화하고 있다.

6장은 인간을 뛰어넘는 기계번역을 살펴본다. 이러한 기술은 문장을 단순히 단어별로 번역하는 것을 넘어서, 문장의 맥락을 이해하고 더 자연스러운 번역을 제공한다. 초기에는 단순한 규칙 기반 기계 번역이었으나 현대에는 딥러닝과 인공지능의 발전으로 번역 품질이 크게 향상되었다. 누구나 쉽게 사용할 수 있는 번역 도구 덕분에 다양한 인어 간의 장벽을 허물 수 있어 좋지만, 기계 번역은 인간처럼 창의적이거나 유연하게 언어를 사용하기 어렵다. 이 기술의 한계를 잘 이해하고 적절히 활용하면 좋을 것 같다.
7장에서는 GPT-4의 등장으로 더욱 주목받는 챗봇의 원리를 들여다본다. 챗봇의 핵심 원리는 자연어 처리와 머신러닝이다. 두 기술이 결합되어 챗봇이 사람의 말을 이해하고 대화할 수 있게 만든다.' 구글 미나'와 '페이스북 블렌더봇' 모두 자연스러운 대화를 가능케하는 기술의 진보를 보여주는 대표적인 챗봇이다. 이들은 딥러닝을 기반으로 자연스러운 대화를 할 수 있는 AI 시스템을 목표로 하고 있다.
8장은 자동차 운전의 필수품으로 자리 잡은 네비게이션을 살펴본다. 자율주행 시대의 핵심으로 미래의 네비게이션의 원리는 어떻게 될까. 네비게이션 시스템 및 AI의 복잡성을 설명하는 데 중요한 원리로 오컴의 면도날 법칙을 언급한다. 단순한 경로가 항상 가장 좋을 수는 없지만, 지나치게 복잡한 경로 계산을 피하고, 최적화가 이루어져야 한다는 것이다. 미래의 네비게이션은 길 안내를 넘어서 도로 상태, 날씨 정보 등 종합적으로 분석하고 자율주행차 스스로가 경로를 최적화하는 기능을 갖추게 된다. 실시간 변화하는 교통 정보를 반영하여 교통 체증이나 사고 위험까지 사전에 피할 수 있도록 돕는 미래의 자율주행차에서 중요한 역할을 하게 될 것이다.
9장에서는 유튜브의 알고리즘부터 다양한 추천 알고리즘의 원리를 다룬다. 알고리즘은 기본적으로 사용자 맞춤형 추천을 위해 빅데이터와 머신러닝의 결합 기반으로, 사용자의 취향과 행동을 정교하게 예측하고 분석해서 최적화된 콘텐츠를 제시한다. 알고리즘은 사용자에게 더욱 개인화된 경험을 제공하기 위해 끊임없이 발전하고 있으며, 사용자 유지율을 높이는 핵심적인 요소라고 할 수 있다.
AI가 생성한 합성 영상은 실제와 구분이 어려울 만큼 현실적으로 구현되어 우리 일상 속에 등장하고 있어 때로는 심각한 문제를 야기하기도 한다. 실시간 통역 기능을 제공하며 언어의 장벽을 허물어주거나, 카카오톡은 대화 요약 기능까지 탑재하는 등 AI는 디바이스와 소프트웨어에 빠르게 통합되고 있다. 이미 대중화되고 개인화되어 우리의 삶 속에 깊이 스며들고 있는 AI에 대한 지식을 제대로 배우고 활용해야 일상과 업무에서 유용하게 활용할 수 있을 것이다. 이 책은 기초지식부터 상세한 정보를 제공하기 때문에 미래에 대한 통찰까지 가능케 한다.
*출판사로부터 도서를 무상 제공받아 작성한 개인적인 리뷰입니다.