오늘부터 회사에서 AI 합니다
이활석.업스테이지 AI 교육 부문 지음 / 아이생각(디지털북스) / 2025년 7월
평점 :
장바구니담기


* 출판사에서 보내준 책을 읽고 서평을 썼습니다.

얼마전 OpenAI 에서 GPT-5 를 공개하였습니다. 2022년 말 처음 ChatGPT 가 공개되었을때 많은 사람들이 깜짝 놀랐습니다. 마치 사람과 대화하는 것처럼 내가 궁금한 것들을 질문하면 ChatGPT 는 어떤 질문이든 명확하게 답변해 주었네요. 이후 몇 달마다 새로운 GPT 버전이 나왔고 그때마다 성능이 크게 좋아진 것을 체감할 수 있었습니다. GPT-5 의 경우 일반인공지능인 AGI 가 근접했다는 평가를 받을 정도로 또한번 충격을 주었습니다.

OpenAI 뿐만 아니라 구글, 메타, 알리바바, 딥시크 등 많은 기업들이 LLM 을 공개하고 있습니다. 우리나라 기업으로는 네이버와 LG, 업스테이지가 대표적인데 '오늘부터 회사에서 AI 합니다' 는 업스테이지에서 쓴 책으로 기업에서 AI 를 개발할때 고려해야 할 사항들을 자세하게 설명하고 있습니다.

예전에는 3D 컴퓨터 게임을 하기 위해서 그래픽 카드인 GPU 를 샀습니다. GPU 는 행렬 계산 등에 특화되어 있는데 AI 모델에서 필요한 계산을 할때 GPU 를 이용하면 빠르게 처리할 수 있다는게 증명되면서 이제 GPU 는 AI 개발에 없어서는 안될 존재가 되었습니다. AI 모델은 인공신경세포가 층층히 쌓이면서 복잡한 구조를 이루고 있는데 우리가 질문을 하면 문장을 의미 단위로 쪼개 여러 토큰으로 만들고 각 토큰에 부여된 숫자로 변환해서 이후부터는 모든 것이 수학 계산으로 이루어진다고 합니다. 마지막에 결과로 나온 숫자들을 우리가 보기 쉽게 다시 숫자에 대응하는 토큰으로 바꾸면 문장이 된다고 하니 신기하네요.

뛰어난 AI 모델을 만들기 위해서 중요한 것 중 하나가 데이터입니다. 초기에는 사람이 일일이 데이터를 준비해야 했는데 예를 들어 한국어 문장을 영어나 일본어로 번역해서 AI 가 다국어를 이해할 수 있도록 하고, 이미지에 어떤 글자나 사물이 어떤 영역에 있는지 등을 보면서 좌표와 텍스트로 만들어 AI 가 이미지를 이해할 수 있도록 하였습니다. 사람이 하는 일이다보니 실수가 있거나 같은 데이터라도 라벨을 다는 사람에 따라 다르게 처리할 수 있기 때문에 이 과정에서 잘못된 데이터가 쌓이면 AI 의 성능이 떨어질 수 있어서 양질의 데이터를 만드는게 핵심이네요.

AI 모델을 만들때 방법에 따라 전혀 다른 모델이 나올 수 있습니다. 보통 레시피(Recipe)라고 표현하는데 어떤 데이터셋을 얼마나 섞을 것인지, 그리고 어떤 순서로 학습을 할 것인지를 바꿔가면서 최적의 결과가 나오도록 반복적으로 테스트를 한다고 합니다. 한번 학습을 할때마다 많은 시간과 비용이 드는 만큼 이러한 레시피도 기업의 노하우로 볼 수 있네요. AI 모델은 GPU 를 많이 쓰기 때문에 최적으로 서비스를 제공할 수 있도록 모델을 경량화하거나 중단이 없도록 시스템을 구성하는 것도 모델을 만드는것 못지 않게 엔지니어링 측면에서 중요하다는 것을 알게 되었습니다.

그냥 웹사이트 접속하거나 앱을 열어서 질문하는 것만으로도 바로 답을 얻을 수 있어서 AI 를 편하게 쓰고 있었지만 AI 모델을 만들때 고려해야 할 요소도 많습니다. 처음 기업에서 시작해보려고 하면 무엇을 어떻게 해야할지도 잘 모를텐데 책에서는 업스테이지의 경험을 중심으로 상세하게 설명하고 있어서 이해하는데 도움이 되었습니다.







댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo