쉽고 빠르게 익히는 실전 LLM - ChatGPT 활용부터 LLM 파인튜닝, 임베딩, 고급 프롬프트 엔지니어링까지 I LLM FAQ, AI/ML 용어 해설집 수록
시난 오즈데미르 지음, 신병훈 옮김 / 한빛미디어 / 2024년 2월
평점 :
장바구니담기


  작년 한 해를 후끈 달아오르게 하고 이제는 노말이 되어가는 생성형 AI들은 신기하기만 하다. 그들은 엄청난 규모를 자랑하는 서버에서 자신들만의 모델을 만들어 가고 있다. 대화형 AI들은 굉장히 광범위한 학습을 하게 되는데 이를 위한 대규모 언어 모델(Large Language Models)을 LLM이라고 한다. 덱스트의 이해와 분석을 중심으로 하는 고급 기술이기도 하다. 많은 양의 학습 데이터가 필요하기 때문에 붙여진 이름이기도 하다.

  LLM의 원리와 이해가 담겨 있는 이 책은 한빛미디어의 지원으로 읽어볼 수 있었다.

  AI와 대화하는 것은 나름 흥미롭다. 기존의 헬퍼 형식의 chatbot들과는 다른 꽤나 다양한 주제에 대한 얘기를 할 수 있다. 하지만 그것이 어떻게 작동하는지는 꽤나 어려운 일인 것 같다. 

  대부분의 LLM 모델은 트랜스포머 아키텍처로부터 시작되었지만 그 특성에 따라 일부만 취해 학습을 진행해 왔다. 몸집을 가볍게 하여 각자의 특기를 가지려고 하는 것 같다. 모든 것을 학습한다는 것은 어려운 일이고 많은 자원이 필요하기 때문이다. 그런 면에서 보면 인간의 뇌는 정말 대단한 것 같다. 

  이 책은 기본적으로 어렵다. LLM 자체가 쉽지 않아 보이는 것도 사실이고 꽤나 다양한 모델과 접근법이 머릿속에 잘 이해가 되질 않는다. 기본적인 학습이나 동작은 알 것 같지만 꽤나 고급적인 부분까지 파고드는 느낌이라 어느 부분에서는 전혀 이해하질 못해 그냥 텍스트만 읽었다. 사실 입문조차 제대로 안 한 상태여서 그럴지도 모르겠다.

  책을 읽으면 LLM이라는 것을 어떻게 접근해야 할지 조금 알 수 있고 LLM들의 특징과 그들이 만들어내는 오류들도 이해할 수 있게 된다. 어떻게 사용하는 것이 더 나을지라는 고민에 약간의 해법을 줄 수 있을 것 같다.

  개인적인 역량이 부족하여 책을 소화하기에 어려움이 있었지만 LLM에 대한 관심은 더 깊어진 것 같다. 

  LLM의 기초부터 고급 프롬프터 엔지니어링까지 다채로운 부분에 대한 접근이 있으니 관련 분야를 정복하려는 사람들에게는 충분히 좋은 책이 되지 않을까 싶다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo