-
-
쉽고 빠르게 익히는 실전 LLM - ChatGPT 활용부터 LLM 파인튜닝, 임베딩, 고급 프롬프트 엔지니어링까지 I LLM FAQ, AI/ML 용어 해설집 수록
시난 오즈데미르 지음, 신병훈 옮김 / 한빛미디어 / 2024년 2월
평점 :
제목에는 '쉽고 빠르게 익히는'이라는 표현이 들어있지만... 세상에 쉽고 빠르게 익힐 수 있는 건 별로 없다. 설명이 쉽고 간단하면 더 깊은 내용을 알고 싶고, 깊은 내용을 설명하다 보면 어렵고 느려진다. 이러저러한 책이나 영상 강의들을 보지만 '문과도 할 수 있다'. '초보자도 알 수 있다'면서 쉽게 설명하는 것은 그냥 혀끝으로 맛을 보고 "아, 달구나!"라고 느끼는 딱 거기까지인 경우가 많다. 정작 알고 싶은 것은 단맛 중에서도 어떤 단맛이 나는지, 저 단맛은 어떻게 만든 건지, 저런 단맛이 나는 다른 요리는 어떻게 만들 수 있는지 이런 것들인데 이건 또 다른 영역이다.
이 책은 그보다는 조금 더 깊은 맛을 느낄 수 있도록 되어 있다. 원제가 <Quick Start Guide to Large Language Model>이다. 이미 만들어진 LLM들을 현실 시나리오에 빠르고 효과적으로 적용할 수 있는 방법을 보여주기 위해서 씌여진 것 같다. 즉, 구슬은 이미 서 말이 있고 그걸 효과적으로 잘 꿰는 방법을 가르쳐주는 것이다. 앞부분에서 구슬이 어떻게 만들어진 것일까? 하는 궁금증에 대해서도 간단하게 설명해 준다. 하지만 이미 배경지식이 있는 사람이 정리하는 차원에서 읽기에 좋지 초보자가 볼 수 있는 책은 아닌 것 같다.
화려하지는 않지만 적당한 그림들이 삽입되어 있어서 그림만 보고도 이해하기 쉽게 되어 있고, 간략한 코드도 제공된다. 특히 용어에 대해서 하나하나씩 짚어서 설명해 놓은 것은 매우 유용하다.
1부에서는 LLM에 대해 소개하고 있다. LLM이 무엇인지 어떻게 동작하는지 설명하고 의미 기반 검색에 대해 설명한다. 마지막으로 프롬프트 엔지니어링에 대해서 소개한다. 프롬프트 엔지니어링만 따로 다루는 책들도 많이 나와 있는데 이 장은 굉장히 일반적이고 기본적인 내용을 다룬다. 2부에서는 맞춤형 파인튜닝, 고급 프롬프트 엔지니어링, 모델 아키텍처와 임베딩을 맞춤화 하는 방법을 다룬다. 몇 가지 알고리즘에 대한 설명과 실습 코드가 있다. 깊고 방대한 내용을 다루는 것은 아니지만 역시 낯선 용어나 개념을 이해할 수 있도록 조목조목 설명해 놓아서 정리하기에 좋다. 3부에서는 고급 LLM 사용법을 다루면서 최종적으로는 프로덕션 환경에서 LLM을 배포하는 방법을 다루고 있는데 이 책을 읽는 사람들은 이 3부에 제일 관심이 많지 않을까 싶다. 300페이지 가량 되는 책이라서 세세하게 설명을 붙여놓지는 않았지만, 그래서 스터디용으로 사용하기에 좋은 책 같다. 기초부터 배포까지 전체적인 흐름과 방향은 잡아주면서 실제 삽질은 스터디를 통해 해결하게 하는.. 원래 실력은 삽질의 시간에 비례해지 않던가.^^
마지막 LLM에 관해 많이 하는 질문들, 용어들, LLM 애플리케이션 개발 시 고려할 사항들을 부록으로 붙여준 것도 도움이 많이 된다. 그리고 전체적으로 옮긴이가 독자의 이해를 돕기 위해 주석을 다는 데 신경을 많이 썼구나 하는 것을 느낄 수 있었다.