-
-
트랜스포머로 시작하는 언어 모델과 생성형 인공지능 - 100개의 그림 예제로 이해하기
추형석 지음 / 위즈앤북 / 2025년 1월
평점 :

요즘은 인공지능으로 인해 하루하루가 정말 급변하고 있는 것 같다. 얼마전 OpenAI의 chatGPT가 사진을 지브리, 심슨 애니메이션 등 많은 사람들이 좋아하는 애니메이션으로 변환시켜주는 서비스를 제공했다. OpenAI의 CEO 샘 알트만도 자신의 SNS 프로필 사진을 지브리 애니풍으로 변환된 사진을 게시하자, 많은 사람들이 신기해하고 재미를 느끼며 너도나도 사진을 지브리 애니메이션 풍으로 바꾸며 프로필 사진을 바꾸기에 여념이 없다. 이렇듯 AI가 제공하는 기능이 점점 더 확대되면서 우리의 생활도 더 빠르게 변화하고 있다.
많은 전문가들이 얘기하는데, 이러한 AI의 급성장은 트랜스포머라는 모델이 등장하면서 인공지능의 또 다른 혁신을 했다고 얘기한다. 트랜스포머의 출현은 자연어 처리(NLP)와 생성형 인공지능(Generative AI)의 패러다임을 바꾸어 놓았고, 이를 기반으로 탄생한 GPT, BERT, DALL-E와 같은 모델들은 이제 우리와 일상과 산업을 혁신하고 있다고 한다.

신구대학교 AI 소프트웨어학과 교수로 재직 중인 추형석 교수님이 쓴 '트랜스포머로 시작하는 언어 모델과 생성형 인공지능'에서는 트랜스포머의 기본 원리부터 이를 기반으로 한 언어 모델의 발전 과정과 생성형 인공지능의 시대 흐름을 그림 예제를 활용하여 쉽게 체계적으로 설명하고 있다. 특히 인공지능의 핵심적 원리와 기술을 시대별로 구분된 100개의 주제와 그림을 통해 직관적으로 이해하도록 구성되어 있다.

책은 총 5장으로 구성되어 있는데, 1장은 트랜스포머의 개념적 이해와 언어모델에 대한 개념을 설명한다. 2장은 트랜스포머의 구조와 분석에 대한 내용을 다루고 있고, 본격적으로 트랜스포머가 어떻게 동작하는지 설명한다. 3장은 사전 학습 언어 모델의 개요와 접근 방법을 다루고 현재 다양하게 출시 되어있는 BERT, OpenAPI의 GPT 등 사전 학습 언어모델(PLM)에 대해 설명한다. 4장은 거대 언어 모델에 대한 개요와 규모, 구조 등을 다루고 있고 GPT-3, LaMDA, MT NLG 등의 언어모델에 대한 설명을 하고 있다.
5장은 chatGPT와 생성 인공지능에 대한 내용으로 ChatGPT의 성공과 변화, ChatGPT의 다양한 버전별 특징, Gemini, Copilot, LLaMA 등 다양한 생성형 인공지능에 대한 설명과 인공지능의 미래에 대해 다룬다.

과거 순환신경망(RNN)과 장단기기억(LSTM)이 시간적 의존성을 극복하지 못하고 한계를 드러냈을 때 트랜스포머는 어텐션 매커니즘을 설명한 'Attention is all you need'라는 논문을 통해 이를 극복했다고 한다. 이를 통해 트랜스포머는 언어 모델로 확장되고, 거대 언어 모델로의 확장, 기반 모델의 등장으로까지 발전했고, 질문에 대한 답변 뿐만 아니라 이미지, 동영상까지 제작하는 수준에 이르렀다. 책 속의 설명이 다소 어려울 수 있겠지만, 각 주제별로 한페이지 분량의 설명, 예제 그림을 통한 설명으로 너무 깊게 들어가지 않으면서도 독자들이 이해할 수 있는 수준으로 설명하고 있다.

지금까지는 ChatGPT를 비롯한 다양한 생성형 AI들을 이용하는데 그쳤는데, 그 AI들이 어떻게 동작하는지를 알게 되니 앞으로 등장할 AI에 대해 더 기대감이 높아졌다. 과연 인공지능은 어디까지 발전하고, 인류는 이를 어떻게 활용할지 미래가 궁금해진다.
출판사로부터 도서를 제공받아 작성한 리뷰입니다
#트랜스포머로시작하는언어모델과생성형인공지능 #트랜스포머 #생성형인공지능 #추형석 #위즈앤북 #네이버북유럽카페