샤틀레 행복론 - 모순되는 마음들이 정리되는 놀라운 경험
에밀리 뒤 샤틀레 지음, 변희정 옮김 / 인간희극 / 2017년 9월
평점 :
품절


18세기에 나온 자기계발서이건만, 화성을 가니 마니 하는 시대를 맞으며 소셜미디어에 스마트폰으로 늘 접속하는 21세기 사람이 읽어도 곱씹을 거리가 빼곡합니다. 신기할 정도로 ‘나 때는 말이야‘ 류의 거슬림이 없기도 합니다.

댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
쿠브플로 운영 가이드 - 온프레미스 배포와 클라우드 운영
조시 패터슨.마이클 카체넬렌보겐.오스틴 해리스 지음, 김소형 옮김 / 한빛미디어 / 2022년 1월
평점 :
장바구니담기


AI기술팀의 일원으로서 MLOps는 지상과제입니다. MLOps를 구현하는 방법에는 정답이 없어도 정도 중 하나는 구글이 제안하는 길을 따르는 것입니다. 구글이 내놓은 Kubernetes는 리눅스재단에서 적극적으로 받아 들이는 등 컨테이너화된 워크로드와 서비스를 관리하기 위한 이식할 수 있고 확장 가능한 오픈소스 플랫폼으로는 대세가 되었습니다. 그러한 기조를 바탕으로 DevOps에서 쿠버네티스는 필수요소가 되다시피 했고, 자연스럽게 쿠버네티스를 기반으로 한 MLOps 플랫폼인 Kubeflow가 등장했습니다.

이 책은 Kubeflow를 다루는 한국어 자료로는 참 귀중하다 할 정도로 기술배경부터 구축을 거쳐 운영과 모델 서빙까지 전부 언급하면서도 얇습니다. 얇다는 얘기는 꽤 많은 사전지식을 요한다는 의미이기도 합니다. 그렇다고 해서 불친절하지는 않습니다. 각 장마다 도움말을 남겨 보겠습니다.

- CHAPTER 1 쿠브플로 소개
배경지식으로서 쿠버네티스를 기반으로 머신러닝을 수행하는 의의와 사례에 대해 설명합니다. 기본적인 구성요소도 설명하는데, 꽤 어려울 만한 인프라 용어가 나옵니다. MLOps에 관심을 갖게 된 데이터과학자가 읽기는 힘들려나 싶었으나 뒤에 부록 A, B, C에 용어 설명이 가능한 친절하게 나옵니다. IT 인프라가 낯선 독자는 부록을 먼저 읽어도 좋겠습니다. 그 설명만 가지고 모든 맥락을 파악하지는 못하겠지만 책 전반을 이해하기에는 충분하지 않을까 합니다.
 
- CHAPTER 2 쿠브플로 아키텍처와 모범 사례
쿠브플로 개요와 사례를 다룹니다. 특히 중요한 게 주피터 노트북 아키텍처입니다. 모델 개발자(데이터과학자)에게 맞춤형 분석환경을 용도에 따라 여러 벌 만들어 줄 수 있는 유용한 인프라를 구축할 수 있습니다. 노트북 환경만 생각하면 Jupyter Notebook on K8S 같은 오픈소스 프로젝트를 써도 좋습니다. 지금 저희 팀이 이렇게도 잘 쓰고 있습니다. 다만 pipeline과 model serving도 감안하면 Kubeflow가 좀 더 손이 덜 가는 방안이 될 수 있습니다.
 
- CHAPTER 3 쿠브플로 설치 계획
상당히 본격적인 내용입니다. 다소 폐쇄적이어도 무방한 학교, 연구소와는 달리 기업에서는 보안을 중요시해야 하는데, 이 3장에서는 보안과 더불어 GPU, Docker 컨테이너 등 이론적인 설명을 많이 합니다.
 
- CHAPTER 4 온프레미스에 쿠브플로 설치
이제 본격적으로 실습을 하는 장입니다. 쿠버네티스를 비롯해서 쿠브플로도 서버가 넉넉하지 못하면 실습하기가 참 어렵습니다. 팀원들도 서버 몇 대만으로는 한계가 있으니 라즈베리파이까지 동원해서 연습해보더군요. 온프레미스(다시 말해, PC)에 쿠브플로를 설치하여 실습하는 데에는 한계가 많긴 합니다. 그렇다 해도 팀장 입장에서는 지원자가 이 정도만 했다고 해도 엄청나게 환영할 만한 수준이라고 봅니다. 가능하다면 AWS S3 호환 object storage 솔루션인 MinIO 서버까지 구축해서 연동하여 써보는 것도 좋겠습니다.
 
- CHAPTER 5 구글 클라우드 쿠브플로 운영
- CHAPTER 6 아마존 웹 서비스 쿠브플로 운영
- CHAPTER 7 애저 쿠브플로 운영
퍼블릭 클라우드의 쿠버네티스 PaaS에 쿠브플로를 설치하고 구동해보는 실습입니다. 학생이라면 호시탐탐 기회를 노려 무료 크레디트같은 걸 많이 확보하여 실습하는 게 좋겠습니다. GCP는 써본 적이 없어도 AWS EKS, MS Azure AKS는 써봤습니다. 비용이 보통 VM 쓰는 것보다 상당히 나가는 편입니다. 조심할 필요가 있습니다.  

- CHAPTER 8 모델 서빙과 통합
MLOps라면 응당 구현해야 할 model serving을 다룹니다. 이 책에서 설명하는 KFServing 외에 Seldon core나 BentoML도 있습니다. 제 느낌에는 셀던 코어 사례가 좀 더 많습니다. 실습하기도 보통 일이 아니니 개념 익히기까지만 해도 성공적이라고 봅니다.
 
- Appendix A 인프라스트럭처 개념 
- Appendix B 쿠버네티스 개요 
- Appendix C 이스티오 운영과 쿠브플로
부록이 없었다면 이 책은 여러 독자들에게 극도로 불친절한 문서 묶음이었을 수도 있습니다. 인증, 보안 같은 주요 인프라 요소, 쿠버네티스 기본지식, Istio를 기반으로 한 네트워크 관리(카나리 배포에 필수)와 같은 배경지식을 다룹니다. 저는 웹 서버를 비롯해서 네트워크 관련해서는 전문가에게 맡기는 편입니다. 부록에서 다루는 개념을 다 잘 아는 사람은 드뭅니다. 어렵게 느껴진다 해도 그런가 보다 하고 완독하기를 권합니다. 실제 일이 될 때에 익숙해질 기술들입니다. 용어의 향연에 짓눌리지는 않길 바랍니다. 잘 해나갈 수 있습니다.

댓글(0) 먼댓글(0) 좋아요(1)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
파이토치로 배우는 자연어 처리 - 딥러닝을 이용한 자연어 처리 애플리케이션 구축
델립 라오.브라이언 맥머핸 지음, 박해선 옮김 / 한빛미디어 / 2021년 6월
평점 :
장바구니담기


인공지능, 머신러닝 입문서 저자들은 고민할 겁니다. 인공지능의 어디에서부터 시작해야 할까는 정답이 없는 주제입니다. 텐서플로나 파이토치와 같은 프레임워크를 기준으로 한 교재는 인공지능의 여러 주제인 이미지 처리, 자연어처리, 회귀 정도를 입문 수준에서도 쉬운 정도로 다룰 수밖에 없습니다. 실제로 써먹으려면 주제 중 하나를 깊이 있게 다룰 줄 알아야 하는데, 바로 이 책이 자연어처리 주제로는 입문서 다음에 읽기 좋도록 잘 기획한 중급서입니다.


중급서라고 해도 긴장할 필요는 없습니다. 입문서 내용을 많이 까먹었더라도 Python이나 Anaconda를 설치해서 쓸 줄 알거나, Google Colab에 접속해 쓸 줄 알면 이 책을 시작할 수 있습니다. 합성곱 행렬같이 중요한 요소는 이 책에서 다시 설명해 줍니다.


아쉬운 부분이 있다면 번역서이다 보니 한국어를 직접적으로 다루지 않았고, 입문서는 아니다 보니 나름 친절한 서술이 많아도 대뜸 나오는 듯한 내용도 꽤 있습니다. 다행히도 역자가 세심하게 주를 달아 놓아 당황스러움을 달래 줍니다. 중후반에는 어려운 개념이 꽤 나오는데, YouTube에서 해당 개념을 검색하여 강의 영상을 보는 것도 도움이 됩니다. 293쪽에 자연어처리 전반을 꾹꾹 눌러 담은 책이라 머신러닝에 능숙하지 않으면 어려울 수밖에 없는 설명도 좀 나옵니다. BERT/GPT와 같은 transformer 계열 언어 모델은 다루지 않기도 합니다만 책 분량을 생각하면 무방합니다.


여전히 명확한 정규식과 워드 임베딩을 많이 쓰는 실제 업무현장 사정을 감안하면 자연어처리 중급서로서 이만치 충실한 책도 드물다고 봅니다. 이 책을 떼고 한국어 자연어 처리를 다룬 책을 찾아보길 권합니다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
구글 BERT의 정석 - 인공지능, 자연어 처리를 위한 BERT의 모든 것
수다르산 라비찬디란 지음, 전희원.정승환.김형준 옮김 / 한빛미디어 / 2021년 11월
평점 :
장바구니담기


이 책을 3장까지 읽고 든 생각은 '아이고, 수학공식이 별로 없는 수학책이구나'였습니다. 어쩐지 BERT부터 허깅페이스에 BERT의 파생 모델, BERTSUM 등 세세한 내용을 다루다가, 막판에는 한국어 모델인 KoBERT, KoGPT2까지 한 권에 죄다 다룬다고 해서 덥석 클릭했습니다만, 이걸 장점으로만 여겨서는 안 되었습니다.


그렇다 해도 몹쓸 책은 아닙니다. 제가 속한 팀에서는 이런 저런 자연어 처리를 하는데 팀원들이 실제로 운영 서비스에 쓰는 기술들이 이 책에 많이 담겼습니다. 그래서 이 책을 고르기도 했던 것입니다. 다만 이 책을 잘 소화하려면 책만 읽어서는 힘들 거라고 봅니다. 책 초반에 소개하는 아래 GitHub 프로젝트를 방문하여 코드를 열어 보길 바랍니다. 

https://github.com/PacktPublishing/Getting-Started-with-Google-BERT 


코드와 같이 읽으면 훨씬 낫습니다. 그런데 코드를 잘 읽으려면 PyTorch를 먼저 알아둬야 합니다. 

https://www.aladin.co.kr/search/wsearchresult.aspx?SearchTarget=Book&SearchWord=PyTorch


이걸 알아야 실습을 해보겠지요.

물론 수학적사고가 체화된 독자라면 술술 읽힐 거라 봅니다. 그렇더라고요. 부럽습니다.


마지막으로, 본문의 연습문제 해답은 부록으로 있습니다. 참 다행입니다. 그러고 보니 학부 교재로 써도 좋을 분량이 아닐까 합니다. 자연어처리 II 정도 되는 과정에 알맞겠습니다. 다시 말해 자연어처리를 처음 공부하는 참이라면 자연어처리 입문서를 먼저 읽는 게 좋습니다. Word2Vec을 모르는 채로 이 책을 읽어서는 놓치는 부분이 많을 겁니다. 기왕이면 PyTorch를 활용하는 자연어처리 입문서가 낫겠습니다.

https://www.aladin.co.kr/search/wsearchresult.aspx?SearchTarget=Book&SearchWord=PyTorch+%EC%9E%90%EC%97%B0%EC%96%B4%EC%B2%98%EB%A6%AC&x=0&y=0


싫은 소리를 먼저 하기는 했지만, 인공지능 주제로는 입문서만 범람하는 와중에 아주 소중한 심화서입니다. 이런 책이 아니면 인터넷 바다를 정처 없이 헤매야 합니다.


댓글(0) 먼댓글(0) 좋아요(2)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
제대로 배우는 수학적 최적화 - 최적화 모델링부터 알고리즘까지
우메타니 슌지 지음, 김모세 옮김 / 한빛미디어 / 2021년 9월
평점 :
장바구니담기


인공지능 시대라 해도 최적화는 다양한 층위의 기술을 죄다 써야 현안을 해결할 만하다고 단언하는 바이다.

한빛미디어에서 출간한 책을 여러 권 읽어 오면서, 이제서야 내가 배우고 싶은 주제만 오롯이 달달달 설명한 책을 만났지만 마음이 복잡해졌다. 부끄럽게도 수학에 능숙한 편이 못 되어 제대로 배우기 힘들었기 때문이다. 이 책에 나오는 여러 개념이나 기법을 이 책을 통해 처음 접했다면 이 책을 끝까지 읽어내기도 힘들다. 고교수학에 어느 정도 자신이 있는 이는 두려움 없이 도전해도 좋겠다.

목차를 보면 전통적인 최적화 외에 머신러닝과 유관한 내용도 꽤 되었다. 알고리듬 교재 같은 면도 있다. 최적화를 익힘에 있어 확실히 도움이 될 만한 책인데 진입장벽이 결코 낮지 않다. 뒷표지에 최적의 입문서 운운했지만 그렇지 못하다. 이 책에서 소개하는 입문서는 대체로 일본에서 출판했기에 소개가 도움이 되지 않는다. 답답해졌다.

모르는 사안은 달리 알아서 찾아 봐야 하겠지만, 이 책의 의의는 분명하다. 최적화라는 주제에 나오는 방대한 사안을 빠짐 없이 언급했기 때문이다. 최적화로 도서를 검색했을 때에 전통적인 내용만 다루거나 머신러닝 얘기만 하는 식으로 갈리는 게 실태라 이런 어려운 책도 분명히 도움이 된다. 용기를 내길 바란다. 영 힘들 때에는 일단 엑셀의 '해찾기' 기능부터 도전하면 좋다. 상당히 강력한 최적화 기능이다.



댓글(0) 먼댓글(0) 좋아요(1)
좋아요
북마크하기찜하기 thankstoThanksTo