-
-
그림으로 이해하는 챗GPT 구조와 기술 - 챗GPT, 쉽고 재미있게 시작하자! ㅣ 그림으로 이해하는 시리즈
나카타니 슈요 지음, 박광수 옮김 / 길벗 / 2025년 11월
평점 :
본 도서는 출판사로부터 무상으로 제공받아 주관적인 리뷰를 했습니다.
챗GPT가 일반에게 소개된 시기가 2022년 11월말이었습니다. 이제 3년이 되었습니다. 그간 정말 엄청난 변화가 있었습니다. 저도 하루라도 안쓰면 안될정도로 이제 챗GPT가 일상화가 되었습니다. 인터넷에 처음나왔을때의 느낌입니다. 인터넷이 없으면 못살죠. 이제 챗GPT가 없으면 못살느낌... <그림으로 이해하는 챗GPT 구조와 기술>은 챗GPT가 이루어지게 한 LLM를 쉽게 공부할 수있게 해줍니다. 챗GPT가 무엇이냐부터, 인공지능, 머신러닝, 딥러닝, API를 이용한 개발까지 생성형AI의 기초부터 활용까지 그림을 최대한 이용해서 설명합니다. 단순한 이용자로 남는다면 챗GPT에 프롬프트를 쓰면 됩니다. 그런데 좀더 인공지능의 활용도의 깊이를 높일려면 원리도 같이 알아두는 것이 좋을 겁니다.

저자는 나카타니 슈요 사이보즈 랩소속 개발자입니다. <프로그래밍체험 만화> 등의 저서가 있는 머신러닝, 자연어처림 LLM등을 연구개발하고 있다고 합니다.
요즘 챗GPT로 할께 많죠. 질문도 하고 아이디어도 만들고, 번역, 프로그래밍도 가능합니다. 그간 있었던 언어모델의 업그레이드와 다양한 모델 상황도 공부영역이 됩니다. 모델의 성격이 추론, 속도 등의 차이라는 것도 알게 됩니다. 초반은 아무래도 기초적인 아니 일반적인 사용법 그리고 서비스의 큰 핵심을 공부합니다. 이 과정이 결국 범용인공지능(AGI)으로 가는 길이겠죠. 머신러닝과 딥러닝은 LLM이 나오기전 인공지능을 공부할때 꼭 배우는 과정이죠. 지금은 LLM 밑에 근간을 이루는 구조입니다. 물론 작은 모델을 만들을 때 알고 있어야 하는 형태입니다.

자연어처리는 어렵기는 한데, 현재의 LLM의 근원같은 것이었습니다. 지금은 멀티모달이라고 해서 이미지도 같이 처리를 하지만 챗GPT는 LLM은 언어모델이기 때문입니다. 자연어처리와 딥러닝이 만나면서 언어처리에 혁명이 일어난 것이라고 합니다. LLM은 '언어를 단순화해서 재현한 모델'이라고 합니다. 이런 방법을 통해 언어모델이 언어능력을 갖게 된다고 합니다. 신기합니다. 언어모델이 텍스트를 생성하는 원리는 자기회귀언어모델때문이라고 합니다. RNN이란 명칭으로 사용됩니다. 인공지능을 공부하다보면 모델의 평가에 대한 이야기가 많이 나옵니다. 평가방법은 GLUE, MT-Bench, HumanEval 등의 방법이 사용된다고 합니다. 그리고 파인튜닝정도는 용어라도 알고 있으면 it뉴스를 듣는데도 요긴합니다.

트렌스포머는 구글이 개발한 개념인데, 이것이 인공지능의 역사를 바꿨다는 소리가 많습니다. 이는 RNN을 기반으로 LSTM으로 발전되고 여기서 일반 개념을 짤라낸것이 트랜스포머라고 합니다. 간편하게 만든것이 대박을 친거죠. BERT, 개념을 포함하면서 GPT가 나오게 됩니다. 어쩌면 구글이 트랜스포머를 공개하면서 선두를 챗GPT에서 뺏앗긴 결과가 되었습니다. 마지막은 할루시네이션이라는 환각현상까지 논의를 해서 대책부분도 확인할 수있었습니다. 어떠한 제품도 원리를 알면 더 활용도가 높아지는 분야가 있는데 대표적인 분야가 인공지능이라고 생각이 됩니다. 그래야 다양한 인공지능 모델의 업그레이드될때마다 본질에 맞게 사용하면 휠씬 큰 포퍼먼스를 낼수가 있다는 겁니다.