트랜스포머로 시작하는 언어 모델과 생성형 인공지능 - 100개의 그림 예제로 이해하기
추형석 지음 / 위즈앤북 / 2025년 1월
평점 :
장바구니담기


*출판사로부터 책을 제공받았으나 최대한 솔직하게 작성했습니다.



접기/펴기

트랜스포머로 시작하는 언어 모델과


 

 

트랜스포머로 시작하는 언어 모델과 생성형 인공지능

저자

추형석

출판

위즈앤북(Wiznbook)

발매

2025.01.10.

오늘도 안녕하세요,


네이버 블로거 '조용한 책 리뷰어'


'조책' 입니다 :)



#책추천 #책읽기 #책스타그램 #책리뷰 #서평 #서평단 #도서서평 #독서노트 #독서일기 #독서 #서평 #서평단 #신간소개 #북유럽 #트랜스포머로시작하는언어모델과생성형인공지능 #추형석 #위즈앤북



 




저자인 추형석 작가는 국가수리과학연구소 박사후 연구원과 소프트웨어정책연구소 선임연구원 그리고 현재는 신구대학교 AI 소프트웨어학과 교수로 재직중이며 인공지능 분야 최신 기술 동향 분석과 인공지능 R&D 기획, 인공지능 인재 양성, 인공지능 컴퓨팅 인프라 구축 등 인공지능 관련 정책 연구등의 주요 업무를 수행하고 있음을 소개한다.



OPEN AI와 대결하는 거대 테크 기업의 언어 모델을 분석


 





저자는 머리말을 통해 이 책은 단순히 트랜스포머를 설명하는데 그치지 않는다면서 트랜스포머의 등장 이후 인공지능은 생성형 AI라는 새로운 시대를 맞이하게 되었고, 플랫폼과 오픈 소스를 통해 개발의 진입장벽이 현저하게 낮아지고 있으며 특히 생성형  AI를 언어 모델의 관점에서 집중적으로 분석하여 글로벌 빅 테크 기업의 경쟁 구도를 설명한다고 안내한다.



또한 누구나 쉽게 노트북에서도 실행해 볼 수 있는 사전 학습 언어 모델과 실습도 영상으로 담아 실제 인공지능을 활용해 볼 수 있는 기회도 제공한다는 점도 알린다.



책은 제1장 인공지능의 혁신 트랜스포머로 시작해 제5장  CHAT GPT와 생성 인공지능까지 5개의 장 전체 약 220페이지에 달하는 분량으로 구성되어 있다.




 




거대 언어 모델은 적어도 자연어 처리 분야에서 높은 범용성을 갖는다며 기반 모델은 자연어 처리를 포함해 컴퓨터 비전, 신호 처리, 데이터 분석 등 다양한 과업을 거대 언어 모델의 방식으로 수행할 수 있는 것을 의미한다며 2022년에는 텍스트를 이용하여 이미지를 생성하는 모델로 시작했고, 2023년에는 GPT-4와 같이 이미지와 언어를 동시에 처리할 수 있는 기능을 선보이고 있다고 설명한다.



트랜스포머는 기계 번역에 초점을 맞춰 고안된 인공지능 모델이라며 기계 번역의 전형적인 모델 구조는 정보를 다각도로 분석해 특징을 추출하는 인코더와 추출된 특징으로부터 새로운 정보를 생성하는 디코더 형태를 취한다고 한다.



또한 언어 모델이란 사람이 구사하는 언어를 모사하는 것을 통칭한다며 사람이 구사하는 언어의 특징은 주어진 문맥 흐름에 맞추어 다양한 주제로 설명, 설득, 추론 등이 가능하며 언어 모델을 조금 더 쉽게 설명하면 주어진 문단이나 문장 혹은 단어 뒤에 올 다음 단어를 예측하는 것으로 이해할 수 있다고 알린다.



책은 전반적으로 컴퓨터를 전공하지 않은 나같은 독자들도 알기 쉽게 기본적인 개념 이해부터 친절한 설명을 통해 돕고 있다.



문과의 삶을 살아온 내겐 너무나도 어렵고 자칫하면 외계어처럼 보일 수도 있지만, 저자는 나와 같은 초심자라고 말하기도 힘들 정도의 입문자에게도 개념 이해를 돕는다는 점에서 이 책은 언어 모델과 생성형 인공지능에 관심 있는 모두에게 추천하고 싶다.




요약


거대 언어 모델


트랜스포머 기계 번역


Chat GPT


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo