-
-
벡터 데이터베이스 설계와 구축 - Vector DBMS & RAG
송한림 지음 / 아이리포 / 2025년 3월
평점 :
데이터 분석 과정을 흔히 요리에 비유하고는 합니다. 실제 요리 과정 중 재료 준비와 손질에 가장 많은 시간이 소요되듯, 데이터 분석 및 활용에서도 데이터 전처리의 비중이 높다는 것을 강조하기 위해서죠.
그러한 맥락에서 보자면, DB 관리는 냉장고 관리와 비슷하다고 볼 수 있습니다. 재료를 평소 어떻게 분류해서 보관하느냐에 따라 요리의 가능 범위와 맛이 결정되듯, 데이터를 어떤 방식으로 관리하는가에 따라 분석 결과와 서비스의 품질이 달라지기 때문입니다.(쉐프 위에 재료 있고 모델 위에 데이터 있다)
LLM 성능의 핵심은 정확도에 있습니다. 챗GPT에 노가리를 집어넣으면 먹태나 명태, 수다(노가리깐다) 같은 게 나와야지, 왜가리나 대가리가 나오면 곤란합니다.
벡터DB는 데이터를 다차원 공간의 벡터값으로 표현해주기 때문에 벡터간 거리와 각도를 통해 유사도를 효율적으로 파악할 수 있게 해준다는 장점을 지니고 있습니다.
<벡터 데이터베이스 설계와 구축>은 이러한 벡터DB의 기본 개념과 장점에서부터 스키마 설계와 인덱싱, 청킹 전략, RAG까지 벡터DB 활용에 대한 폭넓은 지식을 담고 있습니다.

벡터DB에 대한 기본 배경을 깔아두고 내용이 전개되므로 새로운 개념이 등장하고 내용의 깊이가 깊어져도 맥락을 빠르게 이해할 수 있고, 입문자가 읽기에도 부담이 없습니다.

실습 자료와 파이썬 코드도 제공되므로 책에서 소개하는 다양한 실습을 따라해보기에도 용이합니다. 특히 코드마다 주석이 꼼꼼하게 달려 있어서 이해하기가 한결 편했습니다.
<벡터 데이터베이스 설계와 구축>은 IT분야 취업을 위해 배경지식을 쌓기에도, 개인 소유 문서를 바탕으로 챗봇 시스템을 만들어보고 싶은 예비 개발자들에게도 유익한 정보를 제공해줄 것이라고 생각합니다.
Vector DB는 AI(인공지능) 분야에서 떠오르는 "별"이다. - P10
|