-
-
MLOps 도입 가이드 - 기업에서 머신러닝 모델을 가장 효율적으로 운영하는 방법
데이터이쿠 지음, 동동구 옮김 / 한빛미디어 / 2022년 4월
평점 :
MLOps는 DevOps와 함께 개념이 회자가 되기 시작한 시기부터 꾸준하게 구현하려고 애써왔다. 어느새 몇백만 원짜리 강의가 나오기도 해서 인공지능의 시대라는 반증 중 하나인가 같은 생각을 하기도 했다. 이 책은 독특하게도 '다타이쿠'라는 AI 플랫폼 솔루션 업체가 지었다. 그럼에도 솔루션 언급은 단 한 줄도 없다. 대단하다. 어쨌든 플랫폼을 다루는 기업이 지은 만큼 MLOps의 처음부터 끝까지 모두 꼼꼼이 언급하는 기염을 토했다. 네카라쿠배라면 모를까, 이러기가 쉽지 않다.
Part 1 MLOps 개념과 필요성
이 책은 '선진국'에서 만들었구나 싶었다. AI 윤리에 대해 생각한 적이 있기는 하지만, 이렇게 본격적으로 리스크 관리에 대해 고심했던 적은 없었다. 단순히 MLOps가 이런 거니 만들어 보자며 시작하는 게 아니라 AI가 이런 영향을 끼치니 리스크를 평가하고 경감하며 책임주체를 따져 보자는 이야기로 시작하는 게 신기했다. 그리고 MLOps를 둘러싼 이해관계자를 나열하고 설명한 후에나 머신러닝의 기능 요소를 언급하기 시작한다. 이 책은 데이터이쿠 사의 여러 사람이 글을 나눠 썼는데, Part 1의 3장은 이 책 전체를 요약한 듯한 내용이다. 머신러닝 입문부터 거버넌스까지 주욱 언급했다.
Part 2 MLOps 적용 방법
드디어 상세한 이야기가 나온다. 터미널에서 명령어 입력하는 수준의 이야기는 아니다. 그건 MLOps를 구성하는 각종 솔루션 매뉴얼에서 찾아야 할 테고, 이 책은 무슨 일을 어떻게 하기 위해 어떤 기능을 구현해야 한다는 이야기를 한다. Kubeflow나 MLflow를 언급하는 일은 없다. 물론 Dataiku도 언급하지 않는다. 그래도 MLOps 씩이나 하겠다는 엔지니어라면 각 기능을 구현하기 위해 어떤 솔루션을 도입해야 할지 어렵지 않게 유추할 수 있다. 모델 개발, 상용 서비스 배포, 모니터링과 피드백 루프에 거버넌스까지의 개념은 독학으로 파악하기가 힘드므로 이 책의 미덕은 이들 생명주기를 낱낱이 언급하는 데에 있다. 이 책의 독자는 이 책을 출발점으로 삼아 계속 정진할 수 있다. 달리 말해서는 갈 길이 멀다.
Part 3 MLOps 실제 사례
특정 조직만의 사례는 아니지만 여러 사례를 조합하여 여러 가지 도움말을 엮어 주었다. 금융, 유통, 제조 분야 실제 현장에서는 대략 이러한 어려움이 있을 것이고 이런 방향으로 헤쳐 나가보라는 이야기해 준다. 이렇게 간접적으로만 접해도 커뮤니케이션 관련한 수고가 많았겠구나 싶다. 그래도 헤쳐 나가는 데에 재미와 보람이 있었기를 앞으로도 있기를 바란다.
ML 엔지니어와 관리자에게 도움이 많이 되는 책이다. 분석가라면 입문 단계에 있는 사람에게는 저게 다 뭔가 싶은 얘기가 많을 텐데 시니어나 데이터 과학자 지망자라면 직접 할 일은 없겠지만 이해하는 게 좋은 내용이 많다. 어디까지나 도입 가이드로서 출발할 수 있게 한다는 취지이기에 책은 얇은 편이라 두려워하지 않아도 된다.