머신러닝 디자인 패턴 - 효율적인 머신러닝 파이프라인과 MLOps를 구축하는 30가지 디자인 패턴
발리아파 락쉬마난.세라 로빈슨.마이클 먼 지음, 맹윤호 외 옮김 / 한빛미디어 / 2021년 11월
평점 :
장바구니담기


머신러닝 솔루션 구축을 위한 설계, 학습, 배포, 파이프라인, 서빙 등 워크플로 단계별 머신러닝 디자인 패턴을 30가지 유형으로 정리한 책이다.

프로그래밍 세계의 디자인 패턴과 마찬가지로 머신러닝의 제품화 또한 분야별 다양한 전문가들이 애용하는 디자인 패턴을 잘 숙지하여 활용한다면 잘못된 설계 및 구현으로 인한 시행착오를 줄일 수 있는 것은 물론 잘 고민된 패턴 덕분에 추후 유연한 확장성을 가질 수 있다.

문제는 머신러닝 솔루션이 출시된 역사가 매우 짧아 고수마다 개발하는 패턴이 제 각각이고 쉽게 공유되지 않아 나같은 초보자들이 참고할 만한 책을 찾기가 어려웠는데 구글 클라우드 플랫폼을 운영하는 저자들이 분야별 전문가들의 노하우를 30개 유형의 패턴으로 정리하여 드디어 참고할만한 서적이 생겼다는 점을 가장 큰 장점으로 소개할 수 있을듯 하다.

책에 소개된 30개의 패턴은 머신러닝 솔루션 구축에 필요한 거의 전 과정의 고민이 담겨있다. 데이터, 문제, 학습 등 모델 중심의 패턴부터 서빙, 평가, 워크플로, 파이프라인 등 인프라 중심의 패턴 그리고 의사결정을 위한 업무 운영을 위한 패턴까지 소개되어 있다.

책에 소개된 워크플로 단계별 30가지 패턴은 아래 그림에 잘 정리되어 있다.전체정리

8장 말미에는 데이터 유형에 따라 흔히 사용되는 일반적인 패턴이 소개되기에 이미 실무에서 진행 중인 프로젝트가 있다면 해당 내용을 먼저 참조하는 것이 책의 빠른 이해를 위해 도움이 될 것 같다. 30가지의 패턴이 다루는 범위가 워낙 방대하기에 처음부터 읽어도 당장 필요로 하지 않는 것들은 망각되기 쉬워 학습 효율이 떨어질 수 있다.

예를 들면 컴퓨터 비전의 경우 책에 소개된 패턴 중 일반적으로 사용되는 유형은 리프레이밍, 중립 클래스, 멀티모달, 전이 학습, 임베딩, 멀티라벨, 캐스케이드, 2단계 예측으로 소개하고 있다.

이 중 개인적으로는 실무에서 고민했던 문제의 해결책인 멀티모달 패턴이 반가웠다. 깊이 있는 내용은 아니지만 머신러닝 업무를 진행한 적이 있는 이라면 누구나 한 번쯤은 고민해 볼만한 문제 중 하나이다.

예를 들어 책의 아래 이미지 예시와 같이 이미지와 tablular 데이터가 함께 입력으로 들어와 특정 값을 예측해야 하는 경우 이를 어떤 방식으로 결합하여야 하는지에 대해 고민하는 문제일 경우 멀티모달이 제시하는 패턴을 활용하면 절반 이상의 고민은 해결되는 셈이다.멀티모달

각각의 소개된 패턴은 먼저 상황별 문제가 소개된다. 머신러닝 솔루션화에 있어 어떤 문제가 있는지 먼저 소개한 후 이를 해결하기 위한 방법으로 각 패턴을 소개한다.

이어서 패턴의 상세한 원리가 소개되고 그럼에도 발생할 수 밖에 없는 트레이드 오프는 무엇인지 소개하며 제시된 패턴의 개선을 위한 사용상의 유의점과 여지를 남겨둔다.

패턴 소개 마지막 부분에는 실질적으로 구현을 위한 Tensorflow, Keras의 API의 핵심 코드가 소개되며 빅쿼리 예시문도 자주 소개된다.

예를 들면 임베딩의 경우 텐서플로는 layers.Embedding 코드를 활용하고 특징 교차 생성 시 빅쿼리의 경우 ML.FEATURE_CROSS 코드를 활용한다는 식으로 예제 코드가 등장한다.

각각의 패턴을 특정 상황마다 그대로 따라 하는 것만으로도 훌륭한 지침서이지만 역으로 설계 단계에서 놓치는 부분이 없는지 고민을 위한 체크리스트 용도로도 제 격이라는 생각이 든다.

축적된 노하우의 역사가 다른 분야에 비해 비교적 짧은 머신러닝 솔루션 프로젝트는 아는 만큼만 보이는 함정에서 벗어나는 것이 매우 중요하다고 생각한다.

예를 들면 나 같은 경우 다양한 입력값에 유연하게 대비하기 위한 스테이트리스 서빙이나 트랜스폼 패턴의 존재 조차 몰랐다. 아마도 이런 패턴을 숙지하지 않고 아는 수준 정도로 개발하였다면 각 패턴마다 소개된 문제 혹은 트레이트 오프 부분에 영락없이 걸려 세월만 낭비하고 있었을 것이다.

그 외에도 워크플로 파이프라인, TPU Strategy 등의 분산 전략, 체크포인트 저장 전략 등의 패턴은 어렴풋이는 알고 있었지만 이 책 덕분에 보다 확실히 알 수 있게 되어 앞으로의 업무에 많은 도움이 될 것 같다.

특히 책 한 권으로 비즈니스 및 의사 결정까지 커버해 보려는 저자들의 꼼꼼함이 돋보였다. 7장에는 주로 책임과 관련된 패턴들이 등장하는데 이 영역은 개발 자체보다는 의사결정에 보다 초점을 맞춘 듯 하다.

물론 29 유형의 XAI 패턴의 경우 설명 가능한 AI를 위한 코드나 API들이 소개되긴 하지만 이는 궁극적으로 의사 결정을 위한 중요한 수단이 된다. 또한 30 유형의 공정성 렌즈 패턴의 경우도 편향으로 발생하는 차별적인 부분의 위험 회피를 위해 노력한다.

8장에서 개발을 위한 파이프라인과 완전 자동화된 프로세스가 분리되어 소개된 점도 많은 참고가 되었다. 은근히 헷갈렸던 부분인데 알기 쉽게 잘 정리되어 있다.개발
자동화

지금까지 30가지 유형의 패턴을 일일이 다 정리하기에는 무리가 있어 개인적으로 필요로 했던 내용들을 중심으로 리뷰를 진행해보았다.

머신러닝을 입문부터 공부했던 독자라면 아마도 2 ~ 4장에 등장하는 패턴은 비교적 익숙할 것이다. 앞서 언급한 대로 모델이나 학습 중심의 패턴이 모여 있기 떄문이다. 임베딩, 앙상블, 전이학습, 하이퍼파라미터튜닝 파트는 따로 패턴을 읽지 않아도 대부분의 독자분들이 잘 숙지하고 있을 거라 생각한다.

그렇지만 그 중에서도 유용한 과대적합, 특징해시, 멀티모달, 특징교차 등 겪어본 적 없는 신선한 패턴도 상당수 등장하고 있다.

5 ~ 7장에 등장하는 패턴은 그간 입문서에 잘 소개되지 않은 부분으로 아마도 이 책을 표지나 제목만으로 구매하려 했던 독자라면 원하는 내용이 대부분 이 파트에 실려있을거라 생각한다.

스테이트서 서빙, 배치 서빙, 2단계 예측(모바일 등 엣지를 위한 버전 별도 운영), 키 기반 예측, 워크플로 파이프라인, 특징 저장소, 모델 버전 관리 등의 패턴은 특히 데이터 및 머신러닝 엔지니어 혹은 솔루션 개발자에게 매우 큰 도움이 될 것이다.

책의 수준은 다소 높다. 적어도 Python 프로그래밍, 자료구조 및 알고리즘, 머신러닝의 입문지식 및 기본 알고리즘 정도는 알고 있어야 이해에 큰 무리가 없을듯 하다.

엔지니어 분들은 물론 프로젝트를 총괄자나 의사결정권자도 전체 흐름을 파악하기에 매우 좋은 책이라는 생각이 든다.

앞서 언급했듯 머신러닝 패턴을 다루는 책은 워낙 희귀함에도 불구하고 이 책은 알기 쉽게 잘 정리되어 있고 비교적 짧은 용량 대비 실전에 적용하는데 무리가 없는 파급력을 갖고 있다고 본다. 머신러닝의 제품화를 꿈꾸는 모든 이에게 추천하고 싶다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
돈의 정체 - 금, 달러, 비트코인 - 돈과 금융, 2022년 세종도서 교양부문 선정도서
이병욱 지음 / 에이콘출판 / 2021년 11월
평점 :
장바구니담기


조개 껍데기에서 비트코인에 이르기까지 돈의 역사를 추적하며 속성을 파악하고 그 과정에서 사람들의 마음과 욕심이 어떤 매개체로 작용하였는지 알아보며 거시 경제의 상식을 쌓을 수 있는 양서이다.

저자가 서문에서 밝힌 바와 같이 돈을 벌고 싶다면 돈과 사람에 대해 알고 있어야 한다. 물론 이것만으로 돈을 벌기 위한 충분조건이 될 수는 없지만 중요한 필요조건이 된다.

10년 전으로 돌아가면 비트코인을 사겠다고 주위에 떠드는 사람들이 많아지고 있는데 이런 이벤트는 돈의 속성을 읽고 기회를 기다린 사람들이 알아보는 법이다.

마찬가지로 금본위제가 폐지된 1970년대 돈의 속성을 잘 공부해 온 사람이 있었다면 양적완화를 점치고 주식이나 부동산 등의 자산 시장에 투자를 했을 것이다.

일론머스크같은 희대의 사기꾼 - 테슬라 주식으로 막대한 이득을 얻은 이들에게는 영웅이겠지만 내게는 사기꾼 그 이상도 이하도 아니다 - 이 트위터로 키보드 워리어 짓거리를 하는 것도 그가 돈의 속성을 잘 이해하고 있기 때문이라고 생각한다.

키보드질 몇 번으로 그는 천문학적인 돈을 손에 쥐었고 며칠 전 미국 민주당에서 억만장자 세금이 거론되자 트위터에 자신의 주식을 매도하길 바라는지 설문조사를 실시하여 그 결과대로 열심히 최고점에서 매도하고 있는 꼬락서니를 보자면 똑똑한 머리를 인정해야 할 진 몰라도 사기꾼이 아니라 생각하기엔 어려움이 있다.

이 책은 돈과 경제라는 어려운 속성을 재미있는 일화와 역사로 깔끔하게 정리하여 내용적인 측면에서도 마음에 들지만 사상적인 측면에서도 깊이 공감하는 바가 많다.

이 사회에 공정성이 화두로 작용하고 있고 사실 초등학교 이후의 교육과정이나 교과서에서도 우리는 돈 밝히는 것을 더러운 것으로 교육받아왔다. 한 술 더 떠 땀 흘리며 벌지 않는 사행성을 내포한 수단이나 불로소득으로 돈을 버는 행위는 경멸시 되어왔다.

그렇게 교과서대로 산 사람들은 건강이 악화되거나 벼락거지로 강제 신분 하락되고 그 반대로 산 사람들은 커다란 자산가가 되어가는 오늘날의 현실에 당시의 교육에 대한 책임을 져 주는 사람은 없다.

정치 꼬락서니도 신물이 난다. 열심히 일한 자가, 땀 흘린 자가 부자가 되고 놀며 노력하지 않는 자가 거지가 되는 세상은 개미와 배짱이 일화에서만 진실인 이야기이다. 보수가 가진놈만 배불리해줘서 신물나서 민주당을 뽑았더니 민주당은 서민을 거지로 만들지를 않나 배급제 유사한 정책으로 땀흘리지 않은 자가 배 두들길 수 있게 도와준다.

자본주의는 금본위제 폐지이래 양극화를 심화시키고 학교는 교과서를 빌미로 학생들을 상대로 사기쳐 부자들이, 기득권 층이 편안한 세상을 살 수 있도록 희생되도록 세뇌 당해온 바 나는 더이상 땀의 가치를 인정하지 않는다.

지금이라도 정신차리고 서민이 적은 노력으로 돈을 벌어들일 수 있는 부동산, 주식 등에 눈을 돌려서 그나마 세월이 깍아 온 내 땀의 가치를 메꿔나가고 있다.

이 책은 그런점에서 많은 도움을 주는 매우 가치있는 책이다. 이 책에 나온 역사적인 사건들을 보며 사람들의 욕심을 읽을 줄만 알아도 부의 기회가 다가왔을때 놓치는 일은 거의 없을 것이다.

어쩌면 그 어려운 돈과 경제 이야기를 이처럼 재미있고 쉽게 풀어낼 수 있는지 저자의 전달력에 감탄한다. 돈의 형태가 변화되며 속성이 바뀐 과정도 흥미롭기 그지없다.

필리핀 근처 얍 섬에서 아래 사진과 같은 돌이 화폐로 활용되고 있다는 사실만 봐도 그렇다. 조개껍데기는 들어봤지만 돌이 돈이라니 놀라운 일이다.돌화폐

그동안 경제 관련 서적을 수 백 권을 읽어왔음에도 처음 접하는 일화도 많았다. IMF와 관련하여 모라토리엄을 선포하지 않았던 행정 관료의 무능함 이야기는 처음 들었고 당시 외환위기의 장본인이 조지소르스 등의 투기꾼인줄도 몰랐다.

한은이 금리 인하를 단행 시 7인의 동의를 얻는 등의 절차도 늘 궁금했던 부분인데 상세히 설명되어 있었고 마이너스의 금리가 정확히 어떤 개념인건지 속시원히 알 수 있어 즐거웠다.

세계 경제사에 있어서 금과 은의 교환 비율의 변화를 추적하는 과정은 흥미롭기 그지 없었고 그런 과정 하나하나가 진행되어 오늘날의 금융이 탄생하였으니 그간 영문 모른채 당연시 여기며 살아왔던 금융 활동들의 퍼즐 조각이 하나씩 맞춰져 가는 느낌이 들었다.

화폐는 현 상태 그대로 변하지 않는 것이 아니다. 때로는 돌의 모습을 하고 있었고, 때로는 금이나 은의 모습을, 현재는 내재가치를 상실한 지폐로 남아있다. 미래는 아무도 모른다.

내일 화폐의 모습이 어떻게 변할지 닉슨 쇼크와 같이 어떤 신뢰나 계약이 손상될지 하루 아침에 어떤 일이 생길지 모른다. 다만 이 책을 읽어둔다면 변화하는 경우의 수를 미리 산정해보고 역사적인 금융 거래의 변화가 일어날 때마다 사람들의 행동을 복기해보며 미래를 위한 대비수를 마련할 수 있을 것이다.

읽는 내내 즐거웠던 것은 즐거운 일화나 가독성을 높여주는 삽화의 역할도 컸지만 어려운 금융 용어들을 명확히 해설해주고 넘어가는 저자의 친절함이 있어서 가능했다.

내가 전공한 컴퓨터 공학 분야나 최근 통계학을 공부할 때도 비슷한 느낌이 들지만 금융 분야도 못지 않게 이상하고 어려운 단어 투성이다.

예를 들면 예대마진이라는 용어처럼 돌아서면 잊어먹기 쉬운 용어도 없다. 일상에서 쓸 일이 거의 없을 뿐더러 어떤 뜻인지 알았음에도 자주 잊곤 했는데 예금금리와 대출금리의 차이(영어로 margin)이라는 뜻으로 은행의 주 수익원이 된다.

이를 예, 대, 마진 하나하나 단어를 한자와 영어로 병기하며 설명해주니 이해가 안갈 수가 없다. 시간이 지나도 잊지 않는 것은 덤이다. 예와 대는 한자어이고 마진은 영어이니 뭐 이런 변태같은 용어가 다 있나 싶다.

서문에서 저자가 우리나라에 근대화를 거치며 국한문체가 혼용된 것이 오늘날 실질 문맹률을 높이는 부작용을 낳았다고 지적했는데 실제 저자의 설명을 하나씩 읽을 때마다 이런 사실을 통감하게 되었다.

또한 책에는 돈을 벌기 위한 감을 잡을 수 있는 인사이트도 숨어있다. 버블만 해도 그동안 튤립 버블 정도만 알고 있었는데 존로릐 서방회사 주식 사건도 흥미로운 일화였고 사우스씨의 버블이 있다는 것도 처음 알았다.

지배자들이 주화를 발행하며 원석을 떼먹는 시뇨리지 차익을 갈취하는 것이나 최근 100달러 지폐를 발행하며 꽁돈을 번 미국의 11만원은 타국의 노동자들의 노력으로 메꿔진다는 사실이 한탄스럽지만 이를 이용할 줄 아는 지혜가 필요하겠다는 생각이 들었다.양적완화

비트코인과 NFT의 허상을 통렬히 꿰뚫을 수 있었고 이런 사행성 도박같은 것이 부를 증식시킬 수 있는 수단이 될 수 있다는 점에도 깊이 생각해볼만한 부분이 있었다. 비트코인이야 말로 법의 느림, 모순, 사각을 전부 보여주는 증거라는 생각이 든다.

한편 고대 아프리카 서부로 조개껍데기를 채취하여 5배의 이문을 남기는 거래자나, 근세 시대에 금을 중요시하는 서양과 은을 중시하는 동양 사이에 재정거래를 통한 차익을 남기는 이들을 보며 본받고 싶진 않지만 돈 버는 냄새와 감각을 느낄 수 있었다.

존로 주식의 예로 배당금이나 특정한 보상이 원금에 관한 사기를 감춰주는 좋은 가림막 역할을 할 수 있다는 것에 놀라웠고 정치권의 실적 압박과 집권을 위한 인간의 욕망 앞에 양적완화가 필연이 된 것을 보며 사람의 마음을 잘 읽는 것이 돈을 버는데 얼마나 중요한지 다시금 깨닫기도 했다.

부동산 불패가 미국의 서브프라임 금융 위기를 어떻게 가속시켰는지, 일본의 읽어버린 30년을 어떻게 일궈냈는지 등 거시 경제의 상식을 익히며 과거의 위기를 분석하는 일도 흥미로웠다.

마지막 8장 통화량 지표는 그동안 너무 알고 싶었던 주제였는데 이 책처럼 쉽고 상세하게 설명해주는 책을 본 적이 없다. 전반적으로 거시 경제의 기초를 쉽게 익히는데도 많은 도움이 된다.통화량

일단 첫 장을 펴면 시간가는 줄 모르고 읽다 정신 차리면 어느새 마지막 장에 다다르게 된다. 이렇게 재미있는 경제 교양서가 또 있을까?

경제 상식과 거시 경제 그리고 금융위기와 돈의 역사를 전반적으로 훑는 지적 호기심 외에도 부의 증식에 관심이 있다면 놓치지 말아야 할 필독서로 사회 초년생에게 특히 추천하고 싶다.




댓글(0) 먼댓글(0) 좋아요(3)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
세계미래보고서 2022 : 메타 사피엔스가 온다 - 세계적인 미래연구기구 ‘밀레니엄 프로젝트’의 2022 대전망!
박영숙.제롬 글렌 지음 / 비즈니스북스 / 2021년 10월
평점 :
장바구니담기


메타버스, 우주, 로봇, 노화, ESG 등 미래에 등장할 최신 기술이 우리 삶을 어떤 방식으로 변화시킬지 기술과 비즈니스 측면에서 분석한 책이다.

이 책이 우리에게 주는 가치는 다양하지만 그 중에서도 특히 2가지의 장점을 눈여겨 볼만하다. 첫 번째는 미래에 대한 호기심을 충족시켜 준다는 것이고 두 번쨰는 이를 비즈니스 측면에서 살펴봄으로써 더 풍요로운 삶을 영위할 수 있는 힌트를 준다는 점이다.

본 도서 시리즈의 2021년 버전 포스트 코로나 특별판을 읽고 올 한해 살면서 얼마나 유익했는지 모른다. 왠만한 기술 트렌드의 변화는 쉽게 이해할 수 있었고 나아가 투자에도 많은 도움을 줬다.

늘 그랬듯이 2022년 새해도 어느새 목전에 다가와 있다. 한 해를 시작하는 시점에 반드시 읽어야 할 한 권의 책을 꼽으라면 나는 주저없이 이 책을 꼽고 싶다. 최신 테크가 경제와 비즈니스를 선도하는 요즘 최신 기술의 동향을 살피는 일은 내 미래 거취를 결정하는데 많은 도움이 되기 때문이다.

책의 전반적인 수준은 테크분야에 종사하는 내가 따라가기 벅찰 정도로 먼 미래를 바라보는 기술들이 등장하여 마치 책에 등장하는 아시모프의 SF 소설을 읽는 듯한 두근거림과 재미가 있는 반면 이러한 사실과 주장들이 허상으로 끝나지 않도록 현재의 연구 수준 및 기업들의 성과를 객관적으로 제공하고 있어 테크 분야에 대한 메타 지식을 쌓을 수 있다.

최근 페이스북이 사명을 메타로 변경한다고 공표했는데 이 책은 그러한 사실을 이미 언급하고 있었다. 또한 투자를 눈여겨 보고 있던 특정 로봇 관련 기업의 최근 발표된 뉴스 내용 또한 담겨 있었다. 마치 미래를 예견이라도 했다는 듯이 관련 내용들이 속속 등장하고 있어 저자의 정보력에 크게 감탄했다.

뿐만 아니라 내가 가장 관심이 많은 우주 분야의 비즈니스를 속속들이 분석하고 있는데 그간 우주에 관심이 많이 이런 저런 책들을 많이 읽어봤지만 보통 발사체 및 탑재체 등 로켓 관련 기술적 내용에 국한되어 있거나 비트코인의 초기 느낌을 받게 하는 루나 엠버시 혹은 Earth2 같은 위험해보이는 회사를 소개된 책들 뿐인지라 답답함이 많았다.

반면 이 책은 우주와 관련된 기술, 비즈니스와 기업들의 성과현황을 일목 요연하게 잘 정리하고 있어 큰 도움이 되었다. 세간에 널리 알려진 버진 갤럭틱, 스페이스X, 블루오리진 등의 기업은 말할 것도 없고 중국의 랜드 스페이스 같은 기업이나 오비탈 어셈블리같은 스타트업까지 각 회사들이 우주에서 돈이 될 만한 것들에 어떻게 접근하고 있는지 상세히 알 수 있었다.

조만장자들의 시선이 어느떄보다 우주를 강렬히 향하고 있다. 한정된 자원과 모든 것을 가진 인간들이 결국 눈을 돌릴 곳은 우주밖에 남지 않았다는 것은 순리상 당연한 일일지도 모른다.

단순히 로켓 관련 기술의 경쟁을 넘어서서 스페이스X의 스타링크 프로젝트로 초고속 통신망 서비스가 눈 앞에 다가왔다는 점이나 심지어 화성과 목성 사이의 소행성에서 지구에 희귀하거나 존재하지 않는 자원을 채굴하는 비즈니스가 존재한다는 사실이 놀라웠다.

만약 그것이 가능해지면 기존 비즈니스 판도가 달라진다. 희소성이라는 가치로 명목을 유지하던 금이나 다이아몬드의 가격 변화는 기존 경제 판도를 뒤흔들 수 있으며 우주 호텔은 그동안의 도심지 위주 부동산의 급상승을 저지하게 될 수도 있다.

하늘은 어느덧 상업적 공간이 되어 밤하늘에 광고가 둥둥 떠다녀 기존의 낭만은 사라지고 눈부심으로 잠들기 어려워 질지도 모른다.

하늘에서 불시착하는 위성에 개죽음을 조심해야 하는 각별히 신경써야 할 공간으로 탈바꿈할지도 모르고 하이퍼루프나 에어택시로 가득 차 조망권 침해에 대한 걱정을 고려해야 하는 시기가 다가올 수도 있다.

또 달과 화성에 부동산이 늘어나 지구의 부동산은 똥 값이 되는건 아닐런지? 스타링크 프로젝트만 해도 아직 6만개의 위성을 상공에 더 발사할 계획이라고 하고 중국의 경쟁사도 비슷한 수준의 목표를 갖고 있는 바 인공위성에서 마찰열로 발생하는 알루미늄이 태양빛을 반사시켜 지구가 급냉하게 될 수도 있다.

공상과학같은 이야기 혹은 먼 미래의 일이라 생각하면 한 껏 재미만 느끼고 끝날 문제이고 과학 기술에만 초점을 맞춰 호기심 충족 정도로 만족할 이야기 정도로 치부하면 책의 가치를 온전히 살릴 수 없다.

당장 내 주위에 내가 항상 신경쓰는 것들이 어떻게 변화할지 생각해보며 읽는 것이 이 책을 온전히 흡수하는 방법이다. 미래는 아무도 예측할 수 없으나 대비는 할 수 있다. Min ~ Max에 이르기까지 다양한 경우의 수가 어떤 것들이 존재하는지 추측해보고 각각의 변화에 대비할 수 있는 방안을 세워 놓는 것이 좋다.

주식 투자를 하고 있다면 자신이 투자한 회사나 섹터의 변화에 따른 대비를 하는 것이고, 부동산 투자를 하는 이라면 향후 부동산 전망의 시나리오별 대응책을 세워보는 것이다.

또, 현재 다니고 있는 직장 혹은 유관업체, 협력업체의 판도가 어떻게 변할 것이고 그런 변화가 내 직장, 내 업무에는 어떤 바람을 불게 할 것인지 미리 생각해 본 이와 관심도 없는 이가 취할 수 있는 카드의 차이는 어마어마할 것이다.

내가 특별히 관심 많았던 우주를 중심으로 리뷰하고 있지만 다른 분야의 변화또한 만만치 않다. 우리 나라만 해도 10년 후 노인 인구가 1/3 이상으로 늘어난다고 한다.

어릴 적 지하철을 타면 노인분들은 3칸짜리 경로석이 남을 정도로 적었던 기억이 난다. 그런데 요즘은 어떠한가? 지하철 절반 가까이 노인분들로 변해버렸다. 그리고 아직 고령화는 시작도 하지 않았다. 결국 실버테크 산업이 각광을 받을 수 밖에 없는 시대가 다가올 것이다. 그리고 그 중심에는 로봇이 있다.

뿐만이랴. 사람들은 상호간의 신뢰를 잃고 있고 점차 모든 영역에서 집단 보다는 개인주의의 성향이 짙어지고 있다. 결혼과 출산율이 줄어들고 있고 혼밥, 혼술을 즐기는 1인 가구가 증가하고 있으며 정치는 특히 환멸의 대상이 되어간다.

로봇은 이제 단순히 애완견의 지위를 넘어서 정치나 섹스테크의 영역에 이르고 있다. 이 책은 일반인이 이해할 수 있는 수준에서의 상세한 기술 변화가 어떻게 이뤄지고 있는지 서술함은 물론 현 시점 어떤 기업들이 관련 비즈니스에 접근하고 있는지 현 주소를 낱낱히 분석한다.

이 책의 메인 주제인 메타버스 또한 그러하다. 메타버스는 이미 전 사업 분야에 널리 퍼져 있어 특정 분야만 살펴보는 것이 어려울 지경에 이르렀다.

AI, 바이오와 결합되어 아인슈타인이나 레오나르도 다빈치 같은 천재들이 살아 돌아오는 세상이 된다면 현 교육 판도도 뒤집힌다. 소크라테스가 가르쳐 준다는 데 다른 대학에서 철학 수업 듣겠다고 시간 낭비하는 이가 얼마나 될까?

로블록스와 재페토가 제공하는 플랫폼에서 게임을 만들고 아이템을 만들어 소득을 창출하거나 BTS나 블랙핑크가 온라인 콘서트를 개최하는 일은 이 분야의 지극히 초기 단계일 뿐이다.

이 변화가 어디까지 이어질지 유연한 사고로 대처하는 것은 개인의 일상 뿐만 아니라 경제적인 가치에 있어서도 가치있는 일이 될 것이다. 그리고 이 책이 주어진 시간대비 가장 효율적인 정보를 제공할 것이라 생각한다.

한편 지구는 점차 병들어가고 2021년을 기점으로 ESG를 준수하는 기업은 주가가 폭등했다. 파리기후협약의 기한인 2030년이 다가오고 유럽을 중심으로 탄소배출권 관련 움직임이 본격화 되고 있다. 가급적 단기간 내에 이 움직임은 어떤 방식으로든간에 우리가 다니고 있는 직장에 영향을 미칠 것이다.

이 책은 이렇게 방대한 분야의 최신 기술과 비즈니스를 한 눈에 조망해볼 수 있다는 것이 가장 큰 장점이다. 손자의 지피지기 백전백승은 언제나 진리이다.

미래라는 남을 피하기만 할 것이 아니라 어떤 모습으로 다가올지 직시하고 내가 어떻게 변화하게 될지 몇가지 경우의 수만이라도 예측해볼 수 있다면 백전백승의 확률은 높아질 것이다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
쉽게 시작하는 캐글 데이터 분석 - 캐글 대회 참여 방법부터 캐글 그랜드마스터 인터뷰까지!
시노다 히로유키 지음, 조태호 옮김 / 길벗 / 2021년 9월
평점 :
장바구니담기


캐글 마스터가 집필한 캐글과 데이터분석을 처음으로 도전하는 초보자에게 도움되는 책이다.

책의 눈에 띄는 장점은 두가지를 들 수 있다.

먼저 초보자가 캐글 플랫폼을 빠르게 활용할 수 있도록 그대로 따라하기만 하면 될 정도로 버튼 하나까지 놓치지 않고 상세히 안내되고 있다는 점이 장점이다.

생각 외로 캐글 플랫폼을 처음 접하면 알아둬야 할 것이 많아 데이터 분석이라는 본 게임을 시작하기도 전에 입구에서 헤매이기 쉬운데 이 책이 최소한의 지식으로 진입장벽을 뛰어넘을 수 있도록 이정표를 제시해 줄 것이다.

초보자에게는 어려운 그레이디언트 부스팅 같은 모델도 직관적으로 잘 이해할 수 있도록 시각 도구를 적절히 잘 활용하고 있으며 필요 이상으로 상세한 설명을 한다는 느낌을 받을 정도로 논리적 비약 과정에서 이해하지 못하는 경우가 없도록 꼼꼼하게 저술했다는 생각이 든다.GBM

또 하나는 캐글 실전 기초 예제 2가지를 매우 깊숙히 들여다 본다는 점이다. 일반적인 데이터 분석 도서의 초입에 자주 활용되는 캐글 예제인 타이타닉 생존자 예측(분류), 주택가격 예측(회귀)을 2가지를 중점적으로 다룬다.

이미 머신러닝 도서를 많이 접한 독자는 너무 쉬운 예제라 굳이 읽을 필요가 없다고 생각할지 모르지만 그렇지 않다. 생각보다 2가지 예제에 대해 깊숙히 다루고 있기 때문이다.

두 예제 모두 말미에 추가 분석이라는 코너가 등장한다. 보통 다른 도서에서 비슷한 수준의 예제를 최소한의 전처리만 거친 후 기본적인 분류, 회귀를 시도하는 반면 본 도서에서는 통계 기법으로 자주 활용되는 클러스터 분석, PCA 분석 등을 활용하거나 실전에서 비롯된 저자의 인사이트를 가미하여 추가적인 분석을 시도한다.PCA

사실 누구에게나 공개된 확실한 법칙이나 모델들을 다루는 책들은 널려있지만 캐글 점수를 높이는 방법이나 몸값을 높여주는 자신만의 데이터 분석 필살 기법은 잘 공개를 하지 않는다. 자신의 몸값과 관련되어있거나 연구적 측면으로 항상 옳다고 검증받지 못했기 때문이다.

책에서 다루는 두 예제는 매우 기초적이고 쉬운 예제이지만 저자는 이 예제를 자신만의 통찰을 녹여 분석한다. 타이타닉의 경우도 사실 더 깊숙히 파고 들 가치가 있음에도 잘해야 교차검증이나 LightGBM 정도 적용해보고 더 이상의 고득점을 위한 시도는 하지 않고 다음 내용으로 넘어가는 편이다.

예를 들어 타이타닉에는 어떤 사람들이 타고 있었는지 티켓 등급별로 인원수나 남녀비율을 확인해보고 승선 항구별로 어떤 차이가 있는지 등 정확도 외의 심도 있는 추가 분석을 거친다. 이 과정에서 일반적으로 공개되지 않은 저자만의 노하우를 어깨너머 배우기 좋다.요금분포

또 Optuna와 같은 라이브러리를 이용하여 하이퍼파라미터 튜닝을 시도하는 등 하나의 예제를 할 수 있는 한 깊이 있게 분석한다.

머신러닝을 처음 학습하다보면 책에서 예제를 상당수 읽고 접했음에도 막상 새로운 문제가 주어지면 어디서부터 감을 잡아야 할지 막막한 경우가 많다.

예제 하나를 깊이있게 분석하고 확실히 내것으로 만들고 다른 이의 공개된 코드를 확실하게 분석하고 이해할 줄 알아야 새로운 문제에 적합할만한 능력을 갖출 수 있는데 본 도서의 그런 점이 매우 마음에 들었다.

또 다른 차별화된 부분은 부록이다. 부록에는 또 한명의 일본 캐글마스터의 인터뷰와 국내 캐글 코리아 커뮤니티 운영자이자 캐글 그랜드마스터로 유명한 이유한님의 인터뷰가 수록되어 있다.

일본 분의 경우 1년 반에 걸쳐 공무원을 때려치고 전업 캐글러로 살았던 기록을 남기고 있는데 아주 흥미롭게 읽었다. 아내 분이 꽤 자상하게도 허락해주신 덕분에 전업 종사를 할 수 있었던 것인데 24시간 동안 캐글만하고 싶다는 생각을 가진 이가 나만은 아닐 것이기에 그의 경험이 독자들의 앞날을 향한 결정과 미래 예측에 꽤 도움이 될 것이다.

특히 일본 캐글마스터 분이 LANL 지진 예측 대회에서 3위로 입상한 비법이 공개되어 많은 도움을 받았다. 유관분야의 논문을 찾아내고 그 논문과 캐글 실전 데이터를 맞춰나가는 노하우는 앞으로 큰 도움이 될 것 같다.지진예측

그 외 개발 환경을 구축히는 과정이 매우 상세하기에 데이터 분석이나 캐글에 관한 지식이 전무한 입문자도 쉽게 따라할 수 있을거라 생각하며 GCP와 같은 클라우드 환경에서 AI 애플리케이션을 구축하는 부분도 수록되어 있어 어떤 형태로든 무리없이 실습할 수 있도록 구성된 점이 장점이다.

결론적으로 캐글이나 데이터 분석 둘 중 어느 하나 이상 관심이 있는 독자가 처음 선택할만한 책으로 매우 좋은 선택지가 될 것 같다는 생각이 든다. 수박 겉핥기 수준이 아닌 쉬운 예제 2가지를 심도있게 분석하기에 앞으로 어떤 방향으로 추가 학습을 진행해야 할지 자연스럽게 힌트를 얻을 수 있을 것이다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
의사 생리학 인간 생리학
루이 후아르트 지음, 홍서연 옮김 / 페이퍼로드 / 2021년 10월
평점 :
장바구니담기


19세기 중엽 비과학적인 의술을 기반으로 대중들을 속여 사기에 가까운 이문을 남기는 의사들의 행태를 고발한 불문학 작품이다.

당시 시대상에 비추어 의료 행태가 어떠했는지는 물론이고 당시의 프랑스 사회상을 생생하게 느낄 수 있다는 점이 책의 가장 큰 장점이며 당시 풍자와 해학의 문학적 미를 음미해 볼 수 있다는 점도 재미를 돋구는 요소이다.

제목에 사용된 생리학이라는 단어는 일상적으로 거의 쓰이지 않아 생소하게 느껴진다. 위키백과에 따르면 생리학은 “생물체의 기능을 연구하는 과학의 한 분야”로 정의되어있는데 분명 이 책이 담고 있는 의사에 대한 풍자나 문학이라는 색깔과는 어울리지 않는다.

제대로 된 생리학의 의미는 책 첫 페이지에 저자 루이 후아르트에 대한 소개와 프랑스 근대 문학에 정통한 역자의 해설을 통해 바로 잡을 수 있었는데 일종의 문학적 은유로 활용된 느낌이다.

1840년 대 초반 프랑스에는 생리학 시리즈가 큰 인기를 얻었는데 이 작품은 시리즈의 초창기에 등장한 작품이다. 생리학 시리즈는 당시 도덕적이지 못한 특정 계층을 풍자하고 사회적으로 고발하는 역할을 담당했다.

그 중 이 책은 의료 분야에 종사하는 의사나 약사를 풍자한 책이다. 일전에 같은 시리즈 중 하나인 부르주아 생리학도 감명깊게 읽어 리뷰를 남겼으니 필요시 참고하면 도움이 될 것이다.

책의 주를 이루는 내용은 의사의 부도덕한 행태이다. 당시 프랑스 의학 수준은 실험적 성격이 강했으며 고대 그리스 시대의 의술이 여전히 행해지거나 민간 요법으로 내려온 과학적으로 입증되지 않은 위험한 치료법이 행해지던 시기였다.

처음 등장하는 치료법은 동종요법이다. 동종요법은 병세를 일으킨 원인 물질과 유사한 물질로 병을 키워 치료하는 방법으로 오늘날 상식적으로도 이해하기 어려운 치료법임에도 널리 행해졌다는 것이 놀라울 뿐이다.

그 결과의 해석 또한 흥미롭다. 완치되면 모두 의사의 전문성으로 공이 돌아가고, 죽음에 이를 경우 애초에 병세가 심각하여 갖은 노력을 취했으나 사망한 것으로 간주 되었기에 이성적인 사고를 가진 사람이라면 이에 대한 비판을 중단하기 어려울 것이다.

해석에 대한 견해는 갖다 붙이기 나름이다. 만약 병세에 차도가 없다면 환자가 무언가를 잘못한 것이다. 용법에 따르지 않고 약을 한 스푼 덜 먹었다거나 조금이라도 더 먹었거나 심지어는 처방전에 명시한 약사에게서 약을 제조하지 않았기 때문에 발생한 문제이다.

이는 오늘날에도 일부 몰지각하고 비양심적인 의료인들로부터 발생하는 문제이기도 하다. 신이 존재하지 않는 이유를 찾을 수 없다고 신이 존재한다고 말하는 것과 같이 명제, 역, 이, 대우 사이에 존재하는 온갖 것들이 의사가 핑계로 삼을 수 있는 무기가 되어버린다.

문맹률이 현저히 줄어들고 의무교육과 고등교육으로 과학적 상식이 풍부해진 오늘날의 대중에게도 의료에 대한 지식은 요원한데 당시 대중들은 오죽했을까?

다른 교양서를 통해 히포크라테스 이후 1000년이 넘는 세월동안 서양 의학은 제자리도 지키지 못한 것으로 알고 있다. 오히려 퇴보했다고 평가를 받고 있으니 이제 막 중세를 벗어나 산업혁명의 태동기였던 이 시절은 고대에서 현대에 이르는 모든 의학이 시장에 판치는 과도기가 아니었을까 싶다.

동종요법 외에도 사혈 요법도 등장한다. 이는 5리터의 피(Nine Pints)라는 책에서 만났던 흥미로운 주제이다. 피를 놔두면 4개의 색을 가진 층으로 분리되는 것 처럼 보이는데 각각의 층이 4원소와 대응되어 원소설을 기반으로한 터무니 없는 의료 논리가 펼쳐진다.

심지어 심각한 병에는 강한 치료가 제격이라며 실신에 이를 정도로 피를 뽑는 비 이성적인 행태가 벌어지기도 했으니 당시 의사는 사람을 살리는 사람인지 죽음을 가속시키는 사람인지 분간하기 어려워 보이는 것도 사실이다.

자본주의의 맹점은 오늘날까지 부의 양극화를 비롯한 많은 부작용을 이어어고 있지만 당시에도 자본주의의 마수가 의학 분야에 적지 않은 영향을 미친듯하다.

오늘날 가장 공부잘하는 아이들이 의사, 판검사의 이른바 엘리트코스를 밟는 현상이 이미 프랑스에는 200년 전 부터 시작되었음을 이 책을 통해 알 수 있다. 이른바 노력 대비 가장 많은 돈을 벌 수 있는 직업으로 의사는 엘리트라 통칭하는 직업군 중 하나였다.

돈이 제1의 목적이 된 이상 사람의 목숨이나 건강은 뒷전이다. 아래 그림은 어떤 환자의 치료가 어려워지자 유관 분야의 의사 4명이 모여 회의하는 내용을 풍자하는 장면이다.팀

한명은 서서 그림 얘기나 하고 있고 나머지는 채권의 가격 혹은 자신이 사용하는 숙박권의 교환 등 돈과 관련된 이야기를 늘어놓는데 전념한다. 4명 의사의 선발 기준은 오로지 인맥이다. 최초로 진료를 본 의사와 친한 친구이거나 상부 상조하는 관계에 있는 의사들이 팀으로 꾸려진셈이다.

환자의 치료를 위한 논의는 온데간데 없고 사설만 늘어놓다 뻔한 진료 결과를 내놓는다. “당신의 병은 위중하며, 우리는 실력이 넘치고, 사혈요법으로 합의를 보았으며, 진료비는 80프랑이다.”

이어지는 서로 모르는 의사 3명의 풍자도 재미있다. 서로 다른 방식의 치료법만 내세우다 의자를 던지고 싸우느라 정신이 없다. 저자가 당시 행태를 어느정도로 강력히 풍자했는지는 모르겠으나 당시 의료 행태가 상당히 심각했음을 알 수 있는 대목이었다.

이러한 풍자에는 저자 특유의 날카로운 비판적이고 분석인 안목이 곁들여 있는데 그 중 일부 시각은 오늘날까지도 유효해 보인다. 살면서 돌팔이 의사 한 명쯤은 누구나 만난 기억이 있을텐데 그 때 그들의 의견을 매의 눈으로 시시비비를 가리는데 유용한 스킬도 있었다.

손자병법에 이르는 바아 같이 상대를 알아야 하는데 우리는 대부분 의사의 입장에서 생각해 본적은 없다. 저자는 완전히 반대편 의사가 되어 적을 꿰뚫고 있는데 이런 안목과 접근법은 꼭 의학을 떠나 비판적인 안목을 키우는데 큰 도움이 될 것이다.

그 외에도 자연이 내려주신 물로 치료를 한다는 수치료사나 외국의 진귀한 한약재를 첨가하여 약의 가격을 높이는 약사의 행태 등 당시의 치열했던 사기의 현장이 흥미진진하게 담겨있다.

이런 생생한 시대상과 날카로운 풍자 외에도 저자의 신랄한 프랑스식 고전 위트를 즐겨보는 것도 책을 재미있게 읽는 한가지 방법이다.

다양한 풍자와 일화가 소개되고 있지만 특히 44p를 중심으로 펼쳐지는 위트는 꽤 논리정연하다. 의사가 약 냄새를 코에 2번 맡게 해 두통을 치료했다고 하며 집에 돌아가면 다 나아있을거라 사기를 치는 장면에 금융업계에 종사하는 환자는 책에서 아래와 같이 대응한다.위트

돈 냄새를 2번 맡게하고 집에 돌아가면 지갑에 진료비가 들어있을거라는 거짓말은 분명한데도 의료 행위의 같은 논리는 어째서 진실로 통용되고 있는지 저자의 논리적인 위트가 정곡을 찌른다.

당시 프랑스의 시대상이나 의료 행태라는 지식없이는 이 책의 진가를 반도 느끼기 어렵다. 다행히 생리학 시리즈 책이 여러 권 출간되어있어 각 권을 읽으며 비교 대조한다면 당시 프랑스와 유럽의 새로운 느낌을 전달받을 수 있을 것이다.

또 책의 말미에 역자의 해설이 담겨 있으니 이를 꼭 참고한 후 다시 음미한다면 처음 읽을때에는 보이지 않았던 새로운 세계가 그림같은 풍경으로 되 살아나는 신기한 경험이 가능할 것이다. 당시 프랑스의 정취와 해학을 느끼고 싶다면 본 도서를 권하고 싶다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo