MLOps 도입 가이드 - 기업에서 머신러닝 모델을 가장 효율적으로 운영하는 방법
데이터이쿠 지음, 동동구 옮김 / 한빛미디어 / 2022년 4월
평점 :
장바구니담기


MLOps는 DevOps와 함께 개념이 회자가 되기 시작한 시기부터 꾸준하게 구현하려고 애써왔다. 어느새 몇백만 원짜리 강의가 나오기도 해서 인공지능의 시대라는 반증 중 하나인가 같은 생각을 하기도 했다. 이 책은 독특하게도 '다타이쿠'라는 AI 플랫폼 솔루션 업체가 지었다. 그럼에도 솔루션 언급은 단 한 줄도 없다. 대단하다. 어쨌든 플랫폼을 다루는 기업이 지은 만큼 MLOps의 처음부터 끝까지 모두 꼼꼼이 언급하는 기염을 토했다. 네카라쿠배라면 모를까, 이러기가 쉽지 않다.

 

Part 1 MLOps 개념과 필요성

이 책은 '선진국'에서 만들었구나 싶었다. AI 윤리에 대해 생각한 적이 있기는 하지만, 이렇게 본격적으로 리스크 관리에 대해 고심했던 적은 없었다. 단순히 MLOps가 이런 거니 만들어 보자며 시작하는 게 아니라 AI가 이런 영향을 끼치니 리스크를 평가하고 경감하며 책임주체를 따져 보자는 이야기로 시작하는 게 신기했다. 그리고 MLOps를 둘러싼 이해관계자를 나열하고 설명한 후에나 머신러닝의 기능 요소를 언급하기 시작한다. 이 책은 데이터이쿠 사의 여러 사람이 글을 나눠 썼는데, Part 1의 3장은 이 책 전체를 요약한 듯한 내용이다. 머신러닝 입문부터 거버넌스까지 주욱 언급했다.

 

Part 2 MLOps 적용 방법

드디어 상세한 이야기가 나온다. 터미널에서 명령어 입력하는 수준의 이야기는 아니다. 그건 MLOps를 구성하는 각종 솔루션 매뉴얼에서 찾아야 할 테고, 이 책은 무슨 일을 어떻게 하기 위해 어떤 기능을 구현해야 한다는 이야기를 한다. Kubeflow나 MLflow를 언급하는 일은 없다. 물론 Dataiku도 언급하지 않는다. 그래도 MLOps 씩이나 하겠다는 엔지니어라면 각 기능을 구현하기 위해 어떤 솔루션을 도입해야 할지 어렵지 않게 유추할 수 있다. 모델 개발, 상용 서비스 배포, 모니터링과 피드백 루프에 거버넌스까지의 개념은 독학으로 파악하기가 힘드므로 이 책의 미덕은 이들 생명주기를 낱낱이 언급하는 데에 있다. 이 책의 독자는 이 책을 출발점으로 삼아 계속 정진할 수 있다. 달리 말해서는 갈 길이 멀다.

 

Part 3 MLOps 실제 사례

특정 조직만의 사례는 아니지만 여러 사례를 조합하여 여러 가지 도움말을 엮어 주었다. 금융, 유통, 제조 분야 실제 현장에서는 대략 이러한 어려움이 있을 것이고 이런 방향으로 헤쳐 나가보라는 이야기해 준다. 이렇게 간접적으로만 접해도 커뮤니케이션 관련한 수고가 많았겠구나 싶다. 그래도 헤쳐 나가는 데에 재미와 보람이 있었기를 앞으로도 있기를 바란다.

 

ML 엔지니어와 관리자에게 도움이 많이 되는 책이다. 분석가라면 입문 단계에 있는 사람에게는 저게 다 뭔가 싶은 얘기가 많을 텐데 시니어나 데이터 과학자 지망자라면 직접 할 일은 없겠지만 이해하는 게 좋은 내용이 많다. 어디까지나 도입 가이드로서 출발할 수 있게 한다는 취지이기에 책은 얇은 편이라 두려워하지 않아도 된다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
서술트릭의 모든 것
니타도리 케이 지음, 김은모 옮김 / 한즈미디어(한스미디어) / 2020년 9월
평점 :
장바구니담기


이 책은 저자가 일부러 서술트릭을 극한까지 활용하며 독자와 게임을 벌이느라 서술트릭을 써야 할 맥락이 없다시피 하다. 반면 서술트릭이 가치가 있는 상황은 분명히 있다. 사회적인 편견과 주류감성에 독자가 경도되도록 작가가 의도한 서술트릭은 현실을 반영한 장치이기에 참신할 수 있다.

댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
시맨틱 데이터 모형화 - 데이터의 유용성과 가치를 높이는 방법
파노스 알렉소풀로스 지음, 박해선 옮김 / 한빛미디어 / 2022년 3월
평점 :
장바구니담기


이 책은 "그걸 하려면 시스템을 새로 구축해야 합니다." 라는 최악의 상황을 막기 위해 현실에 최대한 가깝게 모형(model)을 설계하려는 이에게 유용합니다. 이때 모형은 각종 데이터베이스, 객체지향개발의 클래스, 통계와 머신러닝 기반 예측/최적화 모형을 말합니다.

 

단, 초심자는 나중에 읽는 게 좋겠습니다. 세상을 MECE(Mutually Exclusive Collectively Exhaustive, 상호배제와 전체포괄)적인 관점을 준수하여 IT로 구현하지 못한다는 깨달음을 머리가 아니라 손발과 가슴으로 절감한 후에야 이 책을 읽을 만합니다. ERD(Entity Relationship Diagram)를 그리며 테이블을 그렸다 지웠다 해보고, 클래스 상속을 고민해본 경험이 없으면 이 책을 끝까지 읽을 의욕을 유지하지 못하지 않을까 합니다.

 


시맨틱 데이터 모델 semantic data model: 1980년대 중반 이후 관계 데이터 모형의 한계를 극복하여 현실 세계의 정보를 풍부하게 컴퓨터에 표현할 수 있도록 제안된 여러 가지 데이터 모형을 통틀어 이르는 말. 1980년대 후반 이후 객체 지향 데이터 모형으로 흡수ㆍ통합되었다.
(출처: https://wordrow.kr/의미/시맨틱%20데이터%20모델/)

 

책 두께는 얇은 편인데 읽기는 쉽지 않았습니다. '시맨틱 데이터 모형'과 자신이 겪었던 어려움 간 관계를 잊지 않아야만 시종일관 시맨틱 데이터 모형을 설계하기 어려운 이유와 대안을 이야기하는 와중에 길을 잃지 않을 수 있습니다. 

 

  • [PART I 기초]
    • CHAPTER 1 시맨틱 격차에 유념하기
    • CHAPTER 2 시맨틱 모형화 요소
    • CHAPTER 3 시맨틱 현상과 언어적 현상
    • CHAPTER 4 시맨틱 모형 품질
    • CHAPTER 5 시맨틱 모형 개발
  • [PART II 함정]
    • CHAPTER 6 나쁜 설명
    • CHAPTER 7 잘못된 의미
    • CHAPTER 8 잘못된 모형 규격 및 지식 습득
    • CHAPTER 9 나쁜 품질 관리
    • CHAPTER 10 잘못된 애플리케이션
    • CHAPTER 11 나쁜 전략과 나쁜 조직
  • [PART III 딜레마]
    • CHAPTER 12 표현성 딜레마
    • CHAPTER 13 표현성과 내용 간의 딜레마
    • CHAPTER 14 진화와 거버넌스 딜레마
    • CHAPTER 15 미래 전망


저자가 절절하게 겪은 경험을 기반으로 한 조언이 1장부터 15장까지 빼곡합니다. 비슷한 분량의 다른 책에 비해 읽다 지친다 싶을 정도로 조언이 많습니다. 주제가 주제이다 보니 어쩔 수 없겠습니다. 퍼지 같은 부분은 맥락만 이해해도 좋겠습니다. 시맨틱 데이터 모형 운영을 자동화하기에는 현실적으로 부족한 점이 있지만, 자동화를 배제하지 말고 수작업을 병행하라는 충고는 몇 차례 나옵니다. 어플리케이션 개발자 입장에서는 생소하게 느껴질 수도 있겠습니다. 그래야만 시맨틱 데이터 모형 관리가 지속가능 하겠기에 그런가 보다 했습니다.

 


시맨틱 데이터 모형을 관리해야 하는 취지를 내외부 고객에게 이해하게 하는 일은 보통 어려운 일이 아닐 겁니다. 업무실적으로 인정받기 위해서 기술적인 이해보다는 신뢰관계를 바탕으로 할 수밖에 없을지도 모릅니다. 더구나 위 표를 보면 각종 편향에 휩쓸리지 않을 정도로 성숙해야 할 주제인가 싶기도 합니다. IT 업계에서 시니어로 성장하면서 필연적으로 극복해야 할 사안을 나열한 셈입니다. 저자는 이 끝이 없어 보이는 여행에 나서라고 독자를 격려하며 책을 끝맺습니다. IT 일을 하며 꺼림칙한 기분이 들 때에 이 책을 다시 펼쳐 보아도 좋겠습니다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
데이터 천재들은 어떻게 기획하고 분석할까? - 직관을 넘어 핵심을 꿰뚫는 데이터 분석의 절대 법칙
조성준 외 지음 / 21세기북스 / 2022년 3월
평점 :
장바구니담기


특히 중견기업, 대기업의 관리자에게 이 책을 권합니다. 간간이 원리를 설명하는 기술적인 내용이 나옵니다만, 내용을 이해하는 데에는 무관하며 빅데이터와 인공지능 기술을 어떻게 활용해 나갈지에 대해 집중하기 때문입니다. 실무자에게는 잘 정리한 자료로서 가치가 있겠습니다.

댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
고객을 끌어오는 구글 애널리틱스 4 - 입문부터 최신 고급 기법까지 실무에 필요한 웹 로그 분석 완벽 설명&실습 가이드
문준영 지음 / 한빛미디어 / 2022년 3월
평점 :
장바구니담기


구글 애널리틱스(GA)와 애드센스를 초창기부터 써왔는데, 어느 순간 보니 기능들이 어마어마하게 많아졌습니다. 내 블로그에 누가 들어오나 궁금해서 시작했던 구글 애널리틱스가 어느새 디지털 마케팅의 주류 솔루션으로 쓰이고 있는 게 대단하다 생각하던 차에, 이 책이 나와 얼른 보았습니다.


512쪽이나 되어 GA가 이 정도로 복잡한 도구가 되었구나 언제 다 읽나 했으나, 스크린샷이 풍부하여 잘 따라 할 수 있게 한 구성일 뿐이지 글만 빼곡하지는 않아 다행이었습니다. GA를 대충 알던 저를, 이 책은 여러모로 경탄하게 했습니다.

  1. 가장 큰 미덕은 실습 홈페이지 제공입니다. 제가 GA를 10년은 썼어도 그다지 잘 알지 못하는 수준에 머무른 건 제 블로그 방문자 데이터로 할 수 있는 게 많지 않아서입니다. 이 책은 개인으로서는 학습 데이터 부족이라는 뻔한 상황을 맞을 수밖에 없음을 잘 알고 실습을 할 수 있는 홈페이지를 마련했습니다. 독자는 계정 생성부터 잘 따라 하기만 하면 됩니다.
  2. 통계 등 선수학습에 부담을 가지지 않아도 됩니다. 이 책 안에서 필요한 것만 언급이 되어 있습니다.
  3. GA의 디지털 마케팅 요소(캠페인, 통계, 잠재고객, 전자상거래 이벤트 처리, 푸시/인앱 메시지)를 빠짐없이 다뤘습니다. 후반쯤 가면 GA로만 하지 못하는 요소들이 나옵니다만, 그건 회사에서도 개발자와 협업할 업무입니다. 취업준비생이라면 이 책이 나온 정도만 익혀도 충분합니다.
  4. GA와 실습 홈페이지를 오가며 실습해야 하기에 계정도 이거 쓰다 저거 쓰다 혼동이 될 만하지만, 아래 그림과 같이 최대한 안내해 줍니다. 저자가 참 세심합니다.

실습용 계정, 조건 안내


실습하지 않으면 오래 기억하기 힘든 내용들입니다. 다소 번잡하더라도 책 초반에 나온 대로 준비해서 시간이 들여서 할 수 있는 한은 다 해 보면, GA가 아니라 다른 digital marketing platform을 만나도 잘 적응하여 활용할 수 있겠습니다. 



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo