챗GPT API를 활용한 챗봇 만들기 - 개정판, 5일 만에 배우는 AI 챗봇 개발의 모든것(LLM,프롬프트 엔지니어링, 오픈AI API, 에이전트, 벡터DB)
이승우 지음 / 한빛미디어 / 2024년 8월
평점 :
장바구니담기


장인정신으로 저자가 경험한 지식을 체계화하여 독자로 하여금 시행착오와 시간 낭비를 줄여주는 명작.

간만에 장인정신이 깃든 책을 만났다. 한페이지 한페이지 전달력은 물론이고 실용적 측면에서 정점에 다다른 책.

개인적으로 한빛미디어에서 다양한 활동을 하고 있다. 원서를 발굴하고 평가하며 베타리딩에 종종 참여하는 프리뷰어스 활동을 비롯하여, 5년 넘게 나는 리뷰어다 활동을 하며 신간에 대한 서평을 남기고 있다. 언젠가는 나도 이 책처럼 장인정신이 깃든 책을 남기고 싶다는 소망과 함께.

활동중에 2024년 최고의 한빛미디어 책을 선정해달라는 설문을 받았는데 다른 우수한 책들도 너무 많았지만 난 주저없이 이 책을 꼽았다. 그만큼 한페이지 한페이지의 농도가 참 진했다.

이 책은 매우 빠른 시간내에 쉽게 GPT API를 활용하여 서비스를 구축하는 기술을 익힐 수 있는 책이다. 책에 담긴 내용들이 너무 유익하고 다양하며 전달력이 뛰어나 제목만으로 이 책을 표현하기가 어렵다.

대부분의 책들이 제목 하나만큼도 제대로 담아내지 못하는 경우가 흔한 점에 비추어 볼 때 이 책은 되려 제목이 책의 내용을 전부 담아내지 못해 저평가 될 수밖에 없는 셈이다. 독자 입장에서는 반드시 잡아야 하는 책이다.

본론으로 들어가 본격적으로 이 책을 소개하자면 GPT를 활용하여 쉽게 성능좋은 챗봇 서비스를 만드는 기술서라 할 수 있겠다. 완성된 챗봇의 모양은 다음과 같다.완성

책에서 배울 내용을 일목 요연하게 정리한 도식도는 다음과 같다. 챕터 하나하나가 한권의 책으로 낼 수 있을만큼의 거대한 주제들이다.표지

예를 들어 12장~13장에서 소개하는 벡터DB는 기본적인 DB 인프라는 물론 NLP, LLM, 임베딩, 트랜스포머, 인코딩 들의 기본지식을 알아야 완벽하게 소화할 수 있는 부분이다. 묘하게도 저자는 실용적인 관점에서 이에 필요한 지식을 꽤 압축하여 전달하는데 그럼에도 내용을 이해하고 따라 실습하기에 무리가 없다는 점이 신기했다.

또한 극도의 실용을 추구한다는 점도 개인적으로 마음에 드는 부분이다. 챗봇 자체를 구현하는 것도 좋지만 이를 카톡으로 연결하는 기능도 소개하고 있어 다방면으로 손쉽게 이용할 수 있는 서비스의 기능을 극대화하는데 도움을 준다.카톡

2장에 필요한 만큼만 배우는 파이썬 챕터 하나만 봐도 주옥같다. 파이썬을 쓸만큼만 배운다는 것은 말이 쉽지 실상은 그렇지 않다. 어느정도 파이썬의 완숙한 경지에 이르러야 이런 경지가 가능할 듯 싶다. 놀랍게도 이 책의 2장만 배워도 왠만한 파이썬 코딩에 큰 문제는 없을 것 같다. 시중에 나온 꽤 괜찮은 파이썬 도서보다 이 책의 챕터 하나가 훌륭해 보인다.파이썬
파이썬

주요 개념에 대한 압축 전달은 아래 그림만 봐도 얼추 이해될 것이다. 탐색 기법에서 주요 개념과 논문을 한페이지에 깔끔하게 전달한다. 저자의 전달력에 경의를 표하고 싶은 부분이다.개념

전달력을 높이는 다양한 방법 중에 숨어있는 하나의 장치는 바로 직관적으로 이해하기 쉬운 도식도이다. 예시를 통해 구체적으로 기술을 체감할 수 있도록 구성되어있으며 화살표에는 순번이 매겨져 있어 그림 하나만 제대로 이해해도 GPT를 활용한 서비스의 대부분을 쉽고 빠르게 이해할 수 있어 좋다.

그런 부분들을 따로 뽑아 그림으로 발췌해본다. 책 내용을 몰라도, GPT를 활용한 서비스를 구축하지 않았어도 이 그림만 봐도 상당히 많은 부분이 사전지식없이도 이해될 것이다.도식도
도식도
도식도
도식도
도식도
도식도
도식도
도식도
도식도

쭉 훑어보면 알겠지만 이 책에서 전달하고자 하는 핵심 내용 부분만 발췌한 것이다. 각 챕터별 중요한 정보들을 이 그림만 봐도 일목요연하게 이해할 수 있다. 잘 만들어진 책은 이처럼 시각적 요소만 봐도 책 내용 대부분을 이해할 수 있다.

책의 부제에는 “5일 만에 파이썬, 프롬프트 엔지니어링, 오픈AI API, 에이전트, 벡터DB 마스터하기”라고 적혀있는데 실제 실습해보면 5일도 오히려 넉넉하게 시간을 준거라는 사실에 다시 한 번 놀라게 된다.

책을 좋아하여 참 많은 책을 읽고 리뷰를 작성하지만 이 책은 10년동안 만난 책 중 최고로 꼽을수 있는 책이다. 모든 책들이 이 책 같았으면 얼마나 세상이 편해질까?

이런 좋은 책은 사실 나만 알고 싶지만, 저자의 세상에 대한 기여를 생각할 때 그럴 수 없는 책이다. 이렇게 좋은 책은 세상에 널리 알려져야 한다. 이런 좋은 책이 점점 늘어나는 사회를 위해 기여하기 위해 조촐한 내 리뷰도 뭔가 기여를 했으면 좋겠다.

GPT를 이용하여 실용적인 서비스 만들고 싶거나, AI 시대에 현 시점 최신 개발 트렌드를 알고 싶은 독자, 그리고 챗봇에 관심이 많은 독자, GPT를 보다 심도있게 알고 싶은 독자라면 이 책을 꼭 추천하고 싶다. 설사 아무 관련과 목적이 없을지라도 이 책을 읽고 실습 과정을 따라하다보면 많은 것을 얻어갈 수 있을것이다.

뛰어난 양서를 출간해주신 저자, 편집자, 출판사 및 관련자 모든 분들께 감사를 표한다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
소플의 처음 만난 AWS - 기초부터 차근차근, 따라 하며 익히는 AWS 서비스 가이드 소문난 명강의
이인제 지음 / 한빛미디어 / 2024년 11월
평점 :
장바구니담기


실제 문제를 해결할 수 있도록 AWS의 여러 기능들을 꿸 수 있게 구성된 점이 마음에 든다.

꽤 괜찮은 AWS 책이 나온 것 같다.

AWS를 처음 사용할 때 황당했던 느낌은 나만의 경험일까? 분명 개발자가 할 일의 많은 부분을 편리하게 해준다고 했고 서비스 영역에 필요한 많은 인프라 부분을 클릭 몇번으로 손쉽게 제공해준다고 했는데 적어도 당시의 내겐 그렇지 않았다.

차라리 온프레미스 방식으로 우분투나 센토스부터 리눅스를 직접 깔고 그 위에 서비스들을 설치하는 것이 즉, 늘 해왔던 기존 방식이 느리고 귀찮을 지언정 디테일하게 컨트롤하며 안심할 수 있는 방법이었다.

때문에 AWS 관련 도서를 평할 때엑는 처음 만났을 때 겪었던 온갖 어려움을 기준으로 바라보게 된다. 그때 그때 느꼈던 트러블들을 이 책은 요소별로 잘 슈팅해주고 있는지 바라보게 되는데 안타깝게도 대부분의 AWS 책들은 그렇지 않다.

첫번째로 겪는 문제가 우리는 무언가를 해결하기 위해 AWS를 찾았는데 대부분의 책들은 사용법만 알려준다는 것이다. 그래, EC2라는 것이 보통 리눅스 같은거구나. 그래 ELB 너가 로드밸런서구나. RDB로 보통 EDS를 쓰네. 몽고디비 대신 다이나모 쓰면 되겠군.

각 기능들이 뭔지 대충알고 세부 설정들을 해당 메뉴에 들어가서 몇번 클릭하고 이런건 금방 배운다. 문제는 책을 덮고 나서다. 그래서 이제부터 뭘 해야하는거지? 내 문제는 어떻게 해결하지? 다시 원점으로 돌아온다.

돌이켜 보면 저자들이나 책이나 둘 다 문제였던것 같다.

어설픈 집대성은 떄려치우고 그냥 본인들이 경험했던 프로젝트에 뭘 활용했는데 어떤 문제가 있어서 이렇게 해결했고 그 과정에서 실수해서 요금이 많이 나왔는데 독자분들은 나 같은 실수하지 않으려면 이런걸 조심하세요 정도면 충분할 것 같은데 쓸데없이 AWS 매뉴얼을 만들고 조립되지도 꿰지도 못할 내용들만 가득하니 책만 두껍고 처음부터 참 읽고 싶지 않은 책을 만들고 그러다보니 독자 입장에서는 AWS가 점점 어렵게 느껴질 수 밖에.

그런 관점에서 이 책에서 가장 마음에 드는 부분도 16장 미니프로젝트 부분이다. 서버, 네트웍, 인프라, 프로그래밍을 어느정도 아시는 분은 16장 부터 바로 실습해보길 권하고 싶다. EC2가 뭔지 그 세부설정이 뭔지는 나중문제다.미니프로젝트

전체 그림이 그려지고 세부를 봐야하는 것이지 장강의 뒷물결이 앞물결을 밀어내듯 들어오는 새지식이 기존 지식을 잊혀지게 만드는 상황에서 하나하나의 요소를 공부하는 것이 뭐 그리 중요할까?미니프로젝트 요약

16장에서는 사진 공유 웹사이트를 만드는 데 그 과정에서 왠만한 필요한 실습을 전부 경험해 볼 수 있다. 프로그래밍에서 밑바닥 네트워크까지 AWS의 주요 기능 대부분을 스스로의 문제를 해결하는데 유기성있게 활용해 볼 수 있다.프로그래밍

두번째로 프로그래밍과 인프라를 동시에 경험해 본 사람이 흔치 않은데서 발생하는 문제이다. 그도 그럴것이 프로그래밍 세계만 봐도 풀스택을 모두 경험한 사람조차 흔치 않은데 그걸 넘어서는 인프라라니.

스타트업의 CTO정도 위치 되지 않고는 관련 기술 스택을 모두 경험할 기회가 주어지지도 않는다. 물론 클라우드의 등장 및 1인 기업이 트렌드화 되어가는 현실에서 점점 그런 전문가들이 늘어는 나겠지만 지금 당장에 이 모든 지식이 빠삭하지 않은 상태에서 AWS의 큰 그림을 이해하기는 결코 쉽지 않을 것이다.

그런점에서 이 책은 아래와 같이 요소마다 필요한 기본 지식들을 잘 전달하고자 애쓰고 있다는 점에 높은 점수를 주고 싶다. 가중치 기반 라우팅이 무엇인지 네트워크 관련 지식을 다룰 경험이 없던 사람들이 AWS 기능 마다 TMI하고 있는 각 기능들을 얼마나 세밀하게 조절할 수 있을까?

적어도 기본적인 내용이 뭔지는 알고 설정을 해도 해야 하는데 그런 부분을 저자가 경험을 기반으로 독자들의 가려운 구석을 긁어주는 셈이니 꽤 잘 만든 책이라 생각했다.네트워크

Node.js와 같은 프로그래밍을 다룬 경험이 없는 독자들도 문제다. 인프라는 잘 알고 있는데 프로그래밍을 다뤄 본적이 없어서 인프라와 어떻게 연결해야 하는지, 내가 아는 인프라 지식을 클라이언트 입장에서 어떻게 눈으로 보여주게 할 수 있을지 답답함이 많을텐데 이 책에서는 다행히 워드프레스나 NPM 패키지 등을 활용해서 프로그래밍을 별도로 배우지 않아도 쉽게 인프라와 연동되는 실습을 종종 진행한다. 이로써 OSI 7계층을 체감할 수 있는 셈이다.워드프레스

마지막으로 배운 기술은 있지만 전체적인 그림을 이해하기 어려운 경험 짧은 사회초년생도 이해하기 쉽게 구성된 점이 마음에 든다. 어느정도 고인물들은 온프레미스부터 클라우드까지 다양한 서비스를 구축한 경험이 있지만 당장 클라우드만 경험한 초년생이 온프레미스가 뭔지 상상이나 갈까?인프라 구조

이런 당연해 보이는 부분도 다양한 독자의 관점에서 검토해보고 책이 다각도로 풍성할 수 있도록 노력한 저자의 정성이 돋보인다.

사실 어느 정도의 경험이 쌓이고 나면 레고 조립하듯이 남들은 어떤식으로 블록들을 배치했는지에 더 관심이 많이 간다. 예를 들면 아래와 같은 사진처럼 모바일 앱 백엔드나 데이터 웨어 하우징을 구축할 때 남들은 어떤 방식으로 설계를 했는지 궁금해진다.설계

하지만 그 단계에 이르기 위해서는 반드시 스스로 원하는 서비스를 AWS로 한번 운영해보는 경험이 필요하고, 그 이전에 AWS를 목적에 맞게 기능들을 컨트롤 하는 스킬이 생겨야 하며, 그 이전에 각각의 개념들과 상호 호환성이 존재하는 종속성들을 꿰고 있어야 한다는 함정이 있다.

그런 측면에서 이 책은 각 계층이 가지는 상호 영향력이나 종속성을 설명해주고 매 순간 입문자의 시각에서 알아야하는 최소한의 개념들을 소개하고 있다는 점이 훌륭해 보인다.종속성

확실한 것은 그냥 AWS 각 element들을 설정하는 매뉴얼 식 기술을 추구한다든가 아니면 각각의 기능들을 소개하는데 그쳐 구슬을 꿰지 못하게 한다든가 프로젝트 기반의 AWS 활용법이 존재하지 않는 다른 책들에 비해서는 입문자에게 분명 큰 도움이 되는 책이다. 특히, AWS를 처음 접하는 독자에게 추천하고 싶다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
조선의 그림으로 시작하는 하루 논어 - 세상의 기준에 좌절하지 않는 어른의 생활법
양승렬 지음 / 한빛비즈 / 2024년 11월
평점 :
장바구니담기


논어에 저자의 경험과 해석을 덧칠한 책으로, 조상들의 멋진 작품 및 생각과 더불어 감상할 수 있다는 점이 매력이다.

“논어(論語)”는 한자로 “말씀을 논하다.”라는 뜻이다. 즉, 공자와 그의 제자들의 어록을 엮은 경전이다. 처음에 이 사실을 알고 공자가 직접 지은 글이 아님에 실망하기도 했던 어린 시절을 지금 떠 올리면 우습다.

하지만 아이러니하게도 수많은 짜집기로 완성된 점이 논어의 진정한 가치가 아닌가 싶다. 케이스 스터디의 기록물은 또 다른 케이스 스터디를 통해 보완되어왔고 이런 과정을 거친 “논어”라는 단어는 누가 지었는지 기가 막힌 제목을 선택한 셈이다.

문제는 논어가 삶을 살아오며 경험의 축적별로, 깨달음의 수준별로, 앎의 수준별로 매번 다르게 느껴진다는 것이다. 물론 그런 점이 묘미이기도 하지만 그만큼 일반인들에게는 장애물적인 요소로 다가오기도 한다.

이 책은 그런 논어 특성의 연장선상에 있다. 논어라는 책에 저자의 경험과 생각을 덧칠한 책이다. 저자가 큰 깨달음을 얻었던 논어의 대목들이 등장하고 경험적 측면에서 어떤 이로움을 얻었는지 기술되어있다.논어

또한, 다소 논어의 논점에는 벗어나지만 유사 주제에 해당하는 우리 조상들의 그림도 등장한다. 공자가 가무를 그리 즐겼다고 하던데 저자가 공자의 취미까지 흡수해 버린 것인지 논어의 해석 외에 그림도 등장하고 그림도 해석하고 그림을 그린 화가도 해석하고 그야말로 사유의 향연이 펼쳐진다.와운

읽는 순서나 배치는 상호간에 큰 종속성이 없으니 읽고 싶은 것을 먼저 읽어도 무방한데 기왕이면 지금 당면한 문제와 고민을 중심으로 읽기 시작하는 것이 더 이로울 것 같다.

전반부는 그림에 등장하는 소재를 중심으로 그와 관련된 논어의 가르침을 담고있고 후반부는 화가를 중심으로 담고 있어 구성이 다소 독특하다.

멋진 그림작품으로 감성을 더 할 수 있다는 점은 별도의 묘미인데 개인적으로는 허초희(난설헌)가 그린것으로 전해지는 작약도에서 숨이 멎을듯한 생동감을 느꼈다.작약도

견식이 짧기 때문일지는 모르겠지만 조선의 작품 중 이렇게 생동감이 넘치는 작품을 본 적이 없고, 잎파리 하나하나는 바람에 날리는 듯 춤을 추고 꽃은 저마다의 사연을 간직한 듯 숨을 쉬고 있는 듯한 매력에 적잖이 놀랐다.

더욱 놀란 것은 그녀가 지은 시인데 작약도에 담긴 난설헌의 한과 슬픔이 고스란히 전해진다. 가히 중국과 일본에 널리 전해진 조선의 한류가 아닐런지.동선요

아무튼 딱딱한 논어를 일상의 수준에서 즐기고 더불어 조상들의 멋진 작품 및 생각과 더불어 감상한다면 논어 또한 즐길만한 여흥이 되는 것 같다는 생각이 든다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
박태웅의 AI 강의 2025 - 인공지능의 출현부터 일상으로의 침투까지 우리와 미래를 함께할 새로운 지능의 모든 것
박태웅 지음 / 한빛비즈 / 2024년 9월
평점 :
장바구니담기


AI의 원리를 특유의 전달력으로 쉽게 이해할 수 있다는 장점은 물론, 대한민국 그리고 인간이 AI를 어떻게 마주쳐야 할지에 대한 고찰도 담겨있는 베스트셀러.

출간된지 조금 지나서 정독하게 되었지만 이 책이 왜 AI분야 베스트셀러에 등극했는지 알 것 같다. AI에 숨은 깊은 원리도 쉽게 넘기지 않고 일반인에게 이해시켜 주면서도 기술적인 설명에 그치지 않고 인류가 나아가야 할 방향을 제시하고 있다. 문과와 이과를 넘나드는 넓은 지평은 저자의 역량 덕분인 것 같다.

1강에서는 AI의 급격하고 다양한 변화를 일목요연하게 압축시켜주고 있어 현 시점 변화를 이해하기에 좋다. 특히 이 중 “맥락 인터페이스(Contextual Interface)“에 가장 큰 의의를 두고 있다.

그동안은 UI 혹은 UX의 프레임에 갇혀온 것이 사실이다. 덕분에 편리했지만 우리 인간의 사고력이나 창의성도 저해시킬만큼 강력한 프레임 속에 살아왔던 것이 사실이다.

어떤 서비스를 만들든 혹은 이용하는 입장이든 일단 스마트폰의 화면을 들여다보는 것이 UI의 시작이라고 생각하기 때문이다. 그러나 올해부터 LLM 서비스가 멀티모달을 지원하면서 이제 과거의 지식은 선무당의 지식이 되어버렸다.

아래 그림과 같이 이제 사람과 AI는 맥락을 통해 소통하는 시대가 되었다. 사람과 AI가 스마트폰과 같은 제3의 객체를 바라보는가 하면, 화면없이 음성이나 텍스트로 소통이 가능해지고 심지어 인풋이 뇌피가 될지도 모르는 인터페이스와 인간의 감각 혹은 자연현상이 거의 동일해지는 시대가 다가오고 있다.맥락 인터페이스

OS로써의 인공지능의 의미는 AI가 어느 곳에나 쓰이는 하나의 Layer를 갖게 되었음을 의미한다. 그 외에도 SLM이나 로봇의 변화 등 다양하고 복잡한 AI의 변화와 트렌드를 저자 특유의 관점으로 일목요연하게 정리하고 있는 것이 특징이다.

2강에서는 AI의 내부 원리를 들여다본다. 인공지능 역사를 빠르게 살펴보고 분류나 몬테카를로 알고리즘 같은 다소 기술적 수준이 있는 내용들이 등장한다. 그 깊숙한 원리들을 손실없이 독자에게 쉽게 전달하는 능력이 일품이다.역사

전반부에 해당하는 1~3강에서는 주로 기술적인 원리가 종종 등장하는데 이는 독자로 하여금 앎의 즐거움을 느끼게 해주는 부분들이다. 특히, “깊이 들어가기” 코너에서는 AI의 뼈대를 이루는 조금 더 복잡한 기술들을 소개한다. 하지만 이 역시 이해하기에 무리가 없을 것이다.깊이들어가기

3강에서는 조금 더 트렌드에 집중한다. GPT-4를 중심으로 들여다보며 AI의 트렌드 변화를 일목요연하게 파악할 수 있고 특히 최신 기술을 접해볼 수 있다는 것이 장점이다.트렌드

반면 4~6강의 후반부에는 대한민국이 그리고 인간이 AI를 어떻게 바라봐야 할지에 대한 저자의 통찰이 돋보이는 부분이다. 이는 되려 기술보다 깊숙한 통찰과 많은 시간을 들인 곱씹음이 필요한 대목이며 미래란 쉽게 예측하지 못하는 법이기에 리뷰에서는 자세히 다룰 수 없는 부분이다.

다만, 3년전 읽었던 저자의 전작 눈 떠보니 선진국에서 느꼈던 신선한 감동을 다시금 느낄 수 있었다.

특히, 유럽연합의 녹서(Green Paper) 제도는 다시 들어도 인상적이다. 녹서란 사회적으로 함께 답을 찾아야 할 질문들의 모음이다. 우문현답이라는 속담에서 알 수 있듯 모든 것의 시작은 똑똑한 질문에서 출발한다.녹서

세상의 문제를 바라보는 가장 훌륭한 첫 출발선이 아닐까 싶은데 특히 우리나라는 이러한 합의에 대한 공감대가 형성되지 못하는 것 같다. 아니, 그 어떤 똑똑한 선구자들도 왜 이런 훌륭한 조언을 내지 못하는 것인지 궁금할 뿐이다.

또 사람이 AI를 바라보는 관점외에도 기술 스스로의 붕괴도 생각해 볼 법한 대목이다. “오리지널의 실종, 검색의 종말”라는 몇 단어가 이 현상을 극도로 잘 표현하고 있다.검색의 종말

마치 근친간의 종의 교배에서 유전자 퇴행이 일어나는 것 처럼, AI가 세상 모든 것을 지배하며 스스로 생성해 낸 지식의 산출물을 연속적으로 학습할 때 마주칠 수 있는 위기도 생각해 봐야 한다.

그럼에도 되려 기술 분야의 R&D 예산을 줄이거나 형식적인 AI 백서를 발간하는 정부의 행태는 자칫 대한민국을 눈 떠보니 후진국으로 만들 수 있는 암적 존재이다.

이런 현실에서는 대중의 힘이 필요하다. 대중이 더 나은 사회를 만들어가기 위해 더욱 똑똑해지고 더욱 합의할 수 있는 이런 책이 더욱 필요한 시점이라 생각한다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
밑바닥부터 시작하는 딥러닝 5 - 10단계로 익히는 이미지 생성 모델의 원리 밑바닥부터 시작하는 딥러닝 5
사이토 고키 지음, 개앞맵시 옮김 / 한빛미디어 / 2024년 10월
평점 :
장바구니담기


명불허전 밑바닥 시리즈의 신작. 언제나 그렇듯 생성모델의 근본 원리는 물론 실습을 통한 이해의 시너지를 높일 수 있는 것이 특징이다.

시중에 딥러닝 입문서로 정평이 나 있는 책들이 제법 많다. 저마다 각각의 장점을 갖고 최고봉을 찍고 있는 것 또한 사실이지만 그럼에도 밑바닥 시리즈보다 뛰어나다고 확신할 수는 없을 것이다.

알파고의 등장 이후 처음 만난 밑바닥 1권은 충격 그 자체였다. 알파고 관련 논문을 읽으며 멘붕에 빠졌던 내가 그 나이에 석사에 입문하지 않고 딥러닝 계열의 논문을 읽을 수 있게 도와준 것이 밑바닥 시리즈였다.

착각하지 말아야 할 것은 다른 책들은 개정판이 등장하면 과거 버전의 책을 굳이 읽지 않아도 되지만, 이 책은 개정판이 아니라 시리즈라는 점을 잊으면 안된다. 시리즈 별로 다루는 내용은 전혀 다르며 가급적 시리즈의 순서대로 읽기를 권하고 싶다.

“밑바닥”이라는 표현을 쓰는 책은 매우 드문데 한편으로 이 용어를 쓸 수 있으려면 저자 입장에서는 대단한 자신감이 필요할 것 같다. 이 단어가 독자에게 주는 의미는 크게 두가지 의미로 나뉘는 데, 하나는 말그대로 원리부터 설명한다는 것이고 다른 하나는 그만큼 저자의 단단한 이해에서 출발함을 의미한다.

덕분에 얻을 수 있는 장점 두가지가 있다. 하나는 이론과 실전이라는 두마리 토끼를 모두 잡을 수 있다는 점, 다른 하나는 깊이있는 이해가 가능하다는 점이다. 덕분에 딥러닝 서적들이 우후죽순 쏟아져 순식간에 사라지는 트렌드의 변화에도 이 책은 꽤 오랫동안 내 서재에 버티고 있다.

기본 원리를 중심으로 설명한 책이기에 그 수명은 왠만한 교과서와 비슷하지 않을까 싶다. 7년 전에 만난 1권 또한 독자의 입장에서 치울 수가 없는 책이다. 잘 만든 책들의 전형적인 특징이다.

이번 5권은 생성모델의 근간인 확산모델을 집중적으로 다룬다. 2022년 전 세계를 뒤흔든 생성형 AI에 적잖은 충격을 받았던 기억이 떠오른다. 지금의 LLM들과 마찬가지로 세상을 지배할 것 같은 포스에 압도되었다.

다급히 생성형 AI를 이해해보려 노력했지만 분포와 확률이라는 두가지 장애물에 큰 난관을 겪었다. 당시에는 눈 먼 장님이 코끼리 다리 만지는 식으로 접근했었는데 통계학적 지식이 풍부하지 않아서인지 대강의 감을 잡는데 그쳤다.

어떤 기초 지식이 부족한 것인지 조차 진단을 내리기 어려웠는데 이 책을 처음 펴는 순간 책의 서두에 소개된 “들어가며” 챕터에서 그 비밀을 알 수 있었다.

아래 그림은 이 책의 가이던스이다. 이 책은 10장으로 구성되는데 그 각각의 단계를 일목요연하게 설명해 주는 그림으로 각각의 장에 해당하는 그림에 대한 개념이 무엇인지 간략하게 설명하고 출발한다. 몇 페이지를 읽지 않았던 당시에도 역시 밑바닥 시리즈는 다르다는 것을 다시 한 번 절감할 수 있었다.개요

또 하나의 눈에 띄는 특징은 밑바닥에서 출발한 이론을 반드시 실습으로 매듭짓는다는 점이다. 예를 들어 위 2장의 최대 가능도 추정의 개념을 명확히 이해하기 위한 아래와 같은 실습이 준비되어 있다.실습

어떤 책은 실습으로만 도배된 책이 있다. 그것에 스스로의 경험과 창의성을 더해 공학적으로 풍부한 상상의 결과를 구현할 수 있으니 그 또한 나쁘지는 않다. 다만, 그 책이 처음 전해준 프레임의 한계에 갇혀 패러다임을 뒤흔들 피봇팅은 어렵다. 원리나 근간에 대한 이해 부족 때문이다.

이 책은 원리에 대한 이해를 풍부히 넓혀 그런 한계점을 돌파할 수 있게 도와준다. 아래 분류기 없는 가이던스 원리에 대한 설명이 그러하다. 분류기를 별도로 만드는 수고 없이도 확산모델을 활용할 수 있게 만드는 기술인데 베이즈 정리를 활용한 도출과정이나 특히 이를 시각화하여 표현한 것이 일품이다. 덕분에 직관으로도 원리를 쉽게 들여다 볼 수 있다.원리

AI의 발전이 눈부신 속도로 변하고 있음에도 그 가속도는 더욱 빨라지고 있다. 인간의 수명에는 한계가 있기에 이럴수록 선택과 집중이 필요한 시점인 것 같다. 철저히 GPT와 같은 주류 플랫폼에 탑승하여 AI의 활용에만 집중할 것이 아니라면 밑바닥 시리즈는 프레임을 뒤집는 데 요긴한 마법의 도구로 적격이다.




댓글(0) 먼댓글(0) 좋아요(1)
좋아요
북마크하기찜하기 thankstoThanksTo