사례 분석으로 배우는 데이터 시각화 - 막대 차트부터 대시보드까지 태블로로 실습하며 배우는 인사이트 도출법
황재진.윤영진 지음 / 한빛미디어 / 2022년 6월
평점 :
장바구니담기


회사에서 중요하게 쓰는 대시보드 솔루션이 태블로라 골라 보았습니다. 다행스럽게도 단순한 태블로 사용법이 아니라 기본적인 대시보드 기능과 차트 종류 별 쓰임부터 스토리 텔링까지 다루어서 기대 이상으로 유익했습니다. 스토리 텔링은 SAP Lumira 솔루션이 강조하면서 관심을 가진 주제였는데 한국 BI 솔루션에서는 주류라 할 만한 태블로가 기능으로서 제공하니, 드디어 국내에서 스토리 텔링 사례가 많아지게 되겠지요. 그랬으면 좋겠습니다.


책 내용은 태블로를 기반으로 작성했으나, 태블로를 꽤 벤치마킹한 MS Power BI로도 쫓아서 할 수 있습니다. 초보자라면 메뉴 구조가 달라 생경하겠습니다만, 기능과 메뉴 위치를 대략 파악했다면 어렵지 않을 겁니다. MS 오피스 2013 이상 버전을 쓰거나 Office 365 사용자라면 엑셀의 Power View 기능으로 얼추 따라 할 수 있습니다. 하기 나름입니다.


신입사원이나 인턴이 만든 차트를 보면 예쁘긴 한데, 어떤 의의를 두고 왜 이 차트를 선택했는지는 이야기하지 못하는 때가 있었습니다. 물론 그런 차트라도 화려해서 좋아하는 사람이 있긴 했으나 여러 모로 곤란한 일이죠. 도리어 숫자가 담은 의미를 가리거나 곡해를 유발하면 큰일입니다. 도나 M. 웡이 지은 '월스트리트저널 인포그래픽 가이드'가 이런 면에서 아주 유용해도 상세수준이나 방향성에서 아쉬운 부분이 있었는데, 이 책은 그러한 아쉬움을 채우고도 남습니다. BI(Business Intelligence) 업계, 데이터 과학 업계에 들어온 입문자들에게는 일독과 함께 실습을 꼭 따라 해 보기를 권합니다. 피가 되고 살이 될 겁니다.


댓글(0) 먼댓글(0) 좋아요(1)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
MLOps 도입 가이드 - 기업에서 머신러닝 모델을 가장 효율적으로 운영하는 방법
데이터이쿠 지음, 동동구 옮김 / 한빛미디어 / 2022년 4월
평점 :
장바구니담기


MLOps는 DevOps와 함께 개념이 회자가 되기 시작한 시기부터 꾸준하게 구현하려고 애써왔다. 어느새 몇백만 원짜리 강의가 나오기도 해서 인공지능의 시대라는 반증 중 하나인가 같은 생각을 하기도 했다. 이 책은 독특하게도 '다타이쿠'라는 AI 플랫폼 솔루션 업체가 지었다. 그럼에도 솔루션 언급은 단 한 줄도 없다. 대단하다. 어쨌든 플랫폼을 다루는 기업이 지은 만큼 MLOps의 처음부터 끝까지 모두 꼼꼼이 언급하는 기염을 토했다. 네카라쿠배라면 모를까, 이러기가 쉽지 않다.

 

Part 1 MLOps 개념과 필요성

이 책은 '선진국'에서 만들었구나 싶었다. AI 윤리에 대해 생각한 적이 있기는 하지만, 이렇게 본격적으로 리스크 관리에 대해 고심했던 적은 없었다. 단순히 MLOps가 이런 거니 만들어 보자며 시작하는 게 아니라 AI가 이런 영향을 끼치니 리스크를 평가하고 경감하며 책임주체를 따져 보자는 이야기로 시작하는 게 신기했다. 그리고 MLOps를 둘러싼 이해관계자를 나열하고 설명한 후에나 머신러닝의 기능 요소를 언급하기 시작한다. 이 책은 데이터이쿠 사의 여러 사람이 글을 나눠 썼는데, Part 1의 3장은 이 책 전체를 요약한 듯한 내용이다. 머신러닝 입문부터 거버넌스까지 주욱 언급했다.

 

Part 2 MLOps 적용 방법

드디어 상세한 이야기가 나온다. 터미널에서 명령어 입력하는 수준의 이야기는 아니다. 그건 MLOps를 구성하는 각종 솔루션 매뉴얼에서 찾아야 할 테고, 이 책은 무슨 일을 어떻게 하기 위해 어떤 기능을 구현해야 한다는 이야기를 한다. Kubeflow나 MLflow를 언급하는 일은 없다. 물론 Dataiku도 언급하지 않는다. 그래도 MLOps 씩이나 하겠다는 엔지니어라면 각 기능을 구현하기 위해 어떤 솔루션을 도입해야 할지 어렵지 않게 유추할 수 있다. 모델 개발, 상용 서비스 배포, 모니터링과 피드백 루프에 거버넌스까지의 개념은 독학으로 파악하기가 힘드므로 이 책의 미덕은 이들 생명주기를 낱낱이 언급하는 데에 있다. 이 책의 독자는 이 책을 출발점으로 삼아 계속 정진할 수 있다. 달리 말해서는 갈 길이 멀다.

 

Part 3 MLOps 실제 사례

특정 조직만의 사례는 아니지만 여러 사례를 조합하여 여러 가지 도움말을 엮어 주었다. 금융, 유통, 제조 분야 실제 현장에서는 대략 이러한 어려움이 있을 것이고 이런 방향으로 헤쳐 나가보라는 이야기해 준다. 이렇게 간접적으로만 접해도 커뮤니케이션 관련한 수고가 많았겠구나 싶다. 그래도 헤쳐 나가는 데에 재미와 보람이 있었기를 앞으로도 있기를 바란다.

 

ML 엔지니어와 관리자에게 도움이 많이 되는 책이다. 분석가라면 입문 단계에 있는 사람에게는 저게 다 뭔가 싶은 얘기가 많을 텐데 시니어나 데이터 과학자 지망자라면 직접 할 일은 없겠지만 이해하는 게 좋은 내용이 많다. 어디까지나 도입 가이드로서 출발할 수 있게 한다는 취지이기에 책은 얇은 편이라 두려워하지 않아도 된다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
서술트릭의 모든 것
니타도리 케이 지음, 김은모 옮김 / 한즈미디어(한스미디어) / 2020년 9월
평점 :
장바구니담기


이 책은 저자가 일부러 서술트릭을 극한까지 활용하며 독자와 게임을 벌이느라 서술트릭을 써야 할 맥락이 없다시피 하다. 반면 서술트릭이 가치가 있는 상황은 분명히 있다. 사회적인 편견과 주류감성에 독자가 경도되도록 작가가 의도한 서술트릭은 현실을 반영한 장치이기에 참신할 수 있다.

댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
시맨틱 데이터 모형화 - 데이터의 유용성과 가치를 높이는 방법
파노스 알렉소풀로스 지음, 박해선 옮김 / 한빛미디어 / 2022년 3월
평점 :
장바구니담기


이 책은 "그걸 하려면 시스템을 새로 구축해야 합니다." 라는 최악의 상황을 막기 위해 현실에 최대한 가깝게 모형(model)을 설계하려는 이에게 유용합니다. 이때 모형은 각종 데이터베이스, 객체지향개발의 클래스, 통계와 머신러닝 기반 예측/최적화 모형을 말합니다.

 

단, 초심자는 나중에 읽는 게 좋겠습니다. 세상을 MECE(Mutually Exclusive Collectively Exhaustive, 상호배제와 전체포괄)적인 관점을 준수하여 IT로 구현하지 못한다는 깨달음을 머리가 아니라 손발과 가슴으로 절감한 후에야 이 책을 읽을 만합니다. ERD(Entity Relationship Diagram)를 그리며 테이블을 그렸다 지웠다 해보고, 클래스 상속을 고민해본 경험이 없으면 이 책을 끝까지 읽을 의욕을 유지하지 못하지 않을까 합니다.

 


시맨틱 데이터 모델 semantic data model: 1980년대 중반 이후 관계 데이터 모형의 한계를 극복하여 현실 세계의 정보를 풍부하게 컴퓨터에 표현할 수 있도록 제안된 여러 가지 데이터 모형을 통틀어 이르는 말. 1980년대 후반 이후 객체 지향 데이터 모형으로 흡수ㆍ통합되었다.
(출처: https://wordrow.kr/의미/시맨틱%20데이터%20모델/)

 

책 두께는 얇은 편인데 읽기는 쉽지 않았습니다. '시맨틱 데이터 모형'과 자신이 겪었던 어려움 간 관계를 잊지 않아야만 시종일관 시맨틱 데이터 모형을 설계하기 어려운 이유와 대안을 이야기하는 와중에 길을 잃지 않을 수 있습니다. 

 

  • [PART I 기초]
    • CHAPTER 1 시맨틱 격차에 유념하기
    • CHAPTER 2 시맨틱 모형화 요소
    • CHAPTER 3 시맨틱 현상과 언어적 현상
    • CHAPTER 4 시맨틱 모형 품질
    • CHAPTER 5 시맨틱 모형 개발
  • [PART II 함정]
    • CHAPTER 6 나쁜 설명
    • CHAPTER 7 잘못된 의미
    • CHAPTER 8 잘못된 모형 규격 및 지식 습득
    • CHAPTER 9 나쁜 품질 관리
    • CHAPTER 10 잘못된 애플리케이션
    • CHAPTER 11 나쁜 전략과 나쁜 조직
  • [PART III 딜레마]
    • CHAPTER 12 표현성 딜레마
    • CHAPTER 13 표현성과 내용 간의 딜레마
    • CHAPTER 14 진화와 거버넌스 딜레마
    • CHAPTER 15 미래 전망


저자가 절절하게 겪은 경험을 기반으로 한 조언이 1장부터 15장까지 빼곡합니다. 비슷한 분량의 다른 책에 비해 읽다 지친다 싶을 정도로 조언이 많습니다. 주제가 주제이다 보니 어쩔 수 없겠습니다. 퍼지 같은 부분은 맥락만 이해해도 좋겠습니다. 시맨틱 데이터 모형 운영을 자동화하기에는 현실적으로 부족한 점이 있지만, 자동화를 배제하지 말고 수작업을 병행하라는 충고는 몇 차례 나옵니다. 어플리케이션 개발자 입장에서는 생소하게 느껴질 수도 있겠습니다. 그래야만 시맨틱 데이터 모형 관리가 지속가능 하겠기에 그런가 보다 했습니다.

 


시맨틱 데이터 모형을 관리해야 하는 취지를 내외부 고객에게 이해하게 하는 일은 보통 어려운 일이 아닐 겁니다. 업무실적으로 인정받기 위해서 기술적인 이해보다는 신뢰관계를 바탕으로 할 수밖에 없을지도 모릅니다. 더구나 위 표를 보면 각종 편향에 휩쓸리지 않을 정도로 성숙해야 할 주제인가 싶기도 합니다. IT 업계에서 시니어로 성장하면서 필연적으로 극복해야 할 사안을 나열한 셈입니다. 저자는 이 끝이 없어 보이는 여행에 나서라고 독자를 격려하며 책을 끝맺습니다. IT 일을 하며 꺼림칙한 기분이 들 때에 이 책을 다시 펼쳐 보아도 좋겠습니다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
데이터 천재들은 어떻게 기획하고 분석할까? - 직관을 넘어 핵심을 꿰뚫는 데이터 분석의 절대 법칙
조성준 외 지음 / 21세기북스 / 2022년 3월
평점 :
장바구니담기


특히 중견기업, 대기업의 관리자에게 이 책을 권합니다. 간간이 원리를 설명하는 기술적인 내용이 나옵니다만, 내용을 이해하는 데에는 무관하며 빅데이터와 인공지능 기술을 어떻게 활용해 나갈지에 대해 집중하기 때문입니다. 실무자에게는 잘 정리한 자료로서 가치가 있겠습니다.

댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo