미래의 부 - 인공지능 시대, 돈은 어떤 모습으로 다가오는가
이지성 지음 / 차이정원 / 2021년 7월
평점 :
장바구니담기


앞으로 다가올 인구감소 및 노령화 문제 등 대한민국의 위기를 냉철하게 분석하고 소신있게 부의 방향을 제시한 책이다. 더불어 4차 산업혁명의 여파가 우리 삶에 미칠 영향을 실감있게 풀어내며 큰 격변속에도 살아남을 역량을 갖추기 위해 미국 우량 주식을 돌파구로 제시한다.

저자는 이미 에이트, 리딩으로 리드하라 등으로 유명해진 베스트셀러 작가이다. 개인적으로는 에이트라는 책에서 쉬운 문체로 강한 설득력을 가진 저자 특유의 필력을 느낄 수 있었고 읽기 쉽게 정리된 정보도 얻을 수 있었기에 이번 책도 기대를 했는데 전작 이상으로 마음에 들었다.

책은 크게 3개의 파트로 나뉜다. 첫 번째 파트에서는 출산율 및 인구감소, 고령화 시대가 몰고 올 우리나라의 위기를 입체적으로 잘 설명하고 있다. 은퇴 후 노후 준비는 결코 국가가 마련한 연금 혹은 기업이 서비스하는 연금 상품으로 버틸 수 없음을 강조하며 새로운 돌파구의 필요성을 강조한다.

두번째 파트에서는 세계 최고의 투자 고수라 불리는 워렌 버핏의 원칙을 정리해 본다. 우량주식을 선정하여 장시간 묻어두되 배당금으로 재투자하여 복리효과를 누리며 투자 원칙을 고수하는 것에 대한 중요성을 강조한다.

세번째 파트는 본격적으로 앞으로 세계 돈의 향방이 어디로 갈지 예견해 본다. 미국 우량 주식에 투자하는 것이 저자가 말하는 솔루션이다.

이 파트는 다양한 내용을 담고 있다. 비메모리 반도체, 데이터 경제, 클라우드, 6G, 자율주행, OTT, 헬스케어 등 AI 시대가 몰고 올 산업의 변화를 심도 있게 분석해 낸 것이 특징이다.

그러한 산업의 변화가 우리 일상에 미칠 영향도 예측한다. 특히 해당 산업 분야에서 선두를 주도하는 기업들을 냉철하게 분석하고 있으며 이에 그치지 않고 유관 기업과 유관 산업의 대표 주자들 간의 관계까지 살펴보며 미래 성장 가능성까지 점쳐본다.

AI를 연구하고 있어 4차 산업혁명이 주도하는 산업에 관심이 많고 어느 정도의 지식을 갖춘 나로써는 저자의 기술적 이해도 정도와 깊이에 매우 놀랐다. BCI와 같은 첨단 과학 기술을 제외하고는 4차 산업혁명으로 대표되는 기술이 폭넓게 등장하고 깊이 또한 예사롭지 않다.

이미 알파고 이후 어느 정도 대중에 알려진 AI 기술은 그렇다 치더라도 양자컴퓨터에 대한 기술적인 설명 또한 부족함이 없어 놀랐다. IBM의 Q-Experiance나 구글의 TFQ와 같은 솔루션 명만 언급되었다면 적어도 비즈니스 차원에서 필요한 기술적 설명은 전부 언급하고 있다고 봐도 무방할 것이다.

책의 대략적인 소개는 이만 줄이고 인상적인 문구나 정보들을 아래와 같이 간추려 본다.


  • 4차 산업혁명은 1970년대 허허벌판 강남과도 같다. 의식주 문화, 가치관, 철학까지 모든 것이 바뀔 것이다. 위기와 변화를 인지하지 않는다면 어느 날 정신을 차려보니 벼락거지가 되어 있음을 후회하게 될지도 모른다.

  • 코로나 이후 실물경제가 회복되는 데는 최소 3 ~ 5년의 시간이 걸릴 것이다. 이 기간이 끝나면 어떻게 될까?

  • 코로나로 인한 비대면의 지속, 자율주행 기술 발전 등으로 입지가 최고였던 부동산 시장에 격변이 예상된다. 헤지 수단으로 유용할 뿐 미래의 부는 부동산이 아니다.

  • 부모자녀 가구 수는 2028년 감소세로 들어서며, 2014년에는 2015년의 절반 수준으로 줄어든다. 대신 1인 가구가 늘어나며 이는 출산 감소, 교육 시스템의 붕괴, GDP감소로 이어진다. 2019년 현재 1인 가구는 600만을 돌파했다. 그 중 40%가 무직자이다.

  • 2019년 기준 노인은 약 765만명 전체 인구의 15%에 육박한다. 2023년이 되면 베이비붐 세대들이 노인이 되고 2배로 늘어난다. 2047년에는 3배로 늘어난다. 국민연금을 담보로 대출을 받는 실버론 이용자는 2배로 늘었다. 노인 중 절반이 극빈층이다.

    노인들의 평균 병치레 기간은 17 ~ 20년이다. 건강수명은 남자 71세, 여자 74세이다. 72세가 넘어가면 치매, 당뇨, 뇌졸중, 심장병의 위험도가 높아지며 그에 따른 병원비, 요양비, 간병비, 약값은 상상을 초월한다. 20년간 노인 부부 요양비용은 6.6억원으로 추산된다.

  • 2028년 이후에는 강남과 주요 지역 외 전국 부동산도 하락할 가능성이 크다. 일본의 경우 1/10 ~ 1/30까지 집값이 폭락하는 바람에 노인들이 극빈층으로 전락했다.

  • 국민연금의 운용 실적은 뛰어나지만 인구 감소에 따라 2042년 적자 예상, 2057년엔 기금 고갈이 예측되고 있으며 이는 더 빠른 시일내에 도달할 가능성이 크다. (각각 2032년, 2035년) 사적 연금또한 원금보장이 되지 않거나 수익률이 마이너스에 가까워 신뢰하기 어렵다.

  • 의료비를 포함하여 평범한 수준의 생활을 위해 부부에게 필요한 노후 자금은 약 13억원으로 예상된다. 이 자금을 마련하기 위해 주택담보가 아닌 불량 대출을 정리, 지속적인 수입의 보장, 저축, 투자 및 절세 등이 해답이며 그 중 저자는 20 ~ 30년 가량의 미국 우량주식 복리투자를 강조한다.


이 외에도 저자는 3번째 파트에서 우량주로 평가할 만한 회사를 몇군데 추천한다. 미래를 예측하는 것은 누구도 할 수 없는 일이기에 종목을 추천하는 것은 쉽지 않은 일임에도 소신 있게 분석하고 결론을 공개한 저자의 시원함이 마음에 든다.

개인적으로 모두 일리있는 조심스러운 분석이라 생각하며 스스로 눈 여겨본 기업도 등장했고 추천 이유 또한 내가 조사한 바와 일치하는 부분이 많아 상당히 신뢰가 갔다. 다만 투자는 언제나 개인 선택의 몫이기에 주위를 기울이는 것이 좋다.

한 가지 우려되는 점은 일각에서 4차 산업혁명을 농업 혁명, 산업혁명과 같이 진정한 산업혁명으로 보지 않는다는 연구도 있다.

GDP나 폭발적인 경제 성장이 오지 않았다는 것이 그 이유인데 아직 오지 않은 것인지 4차 산업혁명 자체가 혁명 수준이 아닌 것인지는 미래에 판단 가능한 요소인 듯 하다.

반면 공유 경제나 온라인 강의와 같이 1:N의 생산-소득 관계의 경제 규모를 추산하기 어려운 GDP 산정 방식의 변화가 검토되기도 하기에 무엇이 정확한지는 모르겠지만 4차 산업혁명이라는 대전제를 냉철하게 생각해 볼 문제이긴 하다.

아무튼 꼭 투자 요소를 제외하더라도 이 책은 최신 기술과 미래 산업의 동향을 왠만한 미래 보고서 이상으로 폭넓고 실속있게 정리하고 있다.

풍부한 논거를 가지고 소신도 뚜렷하게 밝히고 있으며 특유의 필력으로 한 번 펼치면 읽기를 중단하기 힘들 정도로 재미있다. 미국 주식의 투자와 미래 산업의 동향에 관심이 있는 분이라면 일독을 권한다.




댓글(0) 먼댓글(0) 좋아요(1)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
편집자의 세계
고정기 지음 / 페이퍼로드 / 2021년 7월
평점 :
장바구니담기


미국 근대의 출판 문화를 이끈 15명의 명편집자의 이야기를 한국 출판의 1세대 편집자가 간추리고 해석한 책이다.

편집자의 일상에서부터 위대한 편집자의 행보를 엿볼 수 있는 것은 물론 훌륭한 위인이라 할 만한 이들의 뛰어난 안목이나 습관도 엿볼 수 있다.

나아가 리더스 다이제스트, 에스콰이어, 뉴요커, 마드모아젤과 같은 유명 잡지가 탄생하기까지 그들의 창업 아이디어와 시대의 니즈를 읽는 감각을 배울 수 있으며 1900년대의 미국의 역사에서 오늘날 배울 만한 요소들도 담겨있어 인상적인 책이다.

먼저 15인의 편집자 소개 중 책 제목에 걸맞는 편집자의 세계를 가장 잘 엿볼 수 있는 부분은 퍼트넘의 편집국장인 윌리엄 타그를 다룬 파트이다.

책의 마지막에 수록된 이권우 독서평론가의 해설을 먼저 읽은 덕분에 이 파트를 먼저 읽을 수 있었다. 윌리엄이 저술한 “발칙한 갖가지 기쁨들(Indecent Pleasures)”에 인용된 편집자의 24시간은 책에 미치지 않은 사람이라면 견디기 힘들만큼 고된 여정이다.

출근하여 우편물을 정리 및 답신하고, 원고 개요를 읽고, 타 평론가의 리뷰를 검토하고, 작가를 만났을 때 할 이야기를 메모하고, 출간을 앞 둔 도서에서 수정할 부분을 찾아내고, 원고 피드백에 대한 일정을 계획하고, 선전용 문안과 약력 등을 구술하고, 저자들과의 저녁 약속 시간을 보내며, 잠들기 전 원고의 가치를 선별한 후 하루를 반성하며 내일 있을 편집 회의를 계획하며 잠든다.

그 외에도 루틴하지 않은 갑작스러운 지저분한 일들 - 저자로부터의 매상 부수 및 광고 등의 항의, 타 출판사와의 교섭 요청, 토론 참석 여부에 대한 요청, 긴급 제안 기획 회의 등 - 이 예기치 않게 찾아오는데 오늘날의 힘든 직장 생활이 100년 전에도 존재했음을 짐작하게 한다.

어느 직업이나 열정없이 쉬운 일은 없는 듯 하다. 정말 좋아하는 일을 찾아 주도적으로 즐기는 일만이 노동의 괴로움 속에서 해방될 수 있는 개인적 차원의 해법임을 여기에서도 느낄 수 있었다.

편집자의 꿈을 가진 이라면 이 책은 너무 훌륭한 책이다. 위에서 언급했듯 편집자의 일상을 엿볼 수도 있고 고정기 저자의 한국 실정으로 이관한 해석도 맛볼 수 있으며 명편집자들이 성공하기까지 그들이 가진 가치관과 행동 양식을 배울 수 있기 때문이다.

맥스웰 퍼킨스는 헤밍웨이와 같은 유명 작가의 재능을 간파하는 눈을 가졌고 마찬가지로 파스칼 코비치는 노벨 문학상 수상자인 존 스타인벡을 발굴했다. 이들의 재능은 단순히 좋은 작가를 알아보고 좋은 작품을 선별하는 능력에 그치지 않는다.

존 스타인벡의 무명 시절에 그가 앞날을 헤쳐나갈 만한 용기와 신뢰를 주었고, 사후 그로부터 “나의 유일한 편집자, 아버지, 교사, 악마, 합작자, 양심”이라는 평을 듣기도 했으며, 퍼킨스의 경우 헤밍웨이와 낚시를 즐기며 다른 출판사로부터 그를 영입하는 하였다. 이처럼 그들의 재능을 알아보는 것 외에도 작과와 평생을 함께하는 동반자로써의 삶을 살았다.

어느 직업이나 마찬가지겠지만 편집자라는 직업 또한 작가와 관련된 일에만 국한되지는 않는다. 때로는 경영인이 되어야 하기에 시대의 흐름, 고객의 니즈를 통찰하는 일도 중요한 요소이다.

특히 에스콰이어의 창간자인 아놀드 깅리치, 리더스 다이제스트의 창간자인 드윗 엘레스 등의 일대기에선 창업에 관한 인사이트도 얻을 수 있다. 그 중에서도 깅리치의 행보는 매우 인상적이었다.

설탕 선물거래로 70만 달러를 벌었던 것이 가격 폭락으로 5만 달러의 수익으로 종결된 것은 오늘날 주식 투자나 비트코인을 연상케 한다.

잠깐 번외로 새자면 이 책의 출판사인 페이퍼 로드 책은 역사를 다루는 도서가 많아 가끔 옛 현인들의 발 자취에서 배울 것이 많아 즐겨 읽는데 이 대목도 그런 부분의 하나이다.

나는 책을 읽으며 역사 - 그 중에서도 한 개인이 살았던 시대에 집중된 미세한 역사 - 를 즐겨 찾는 편이다. 누구나 학창시절 과학 시간의 열효율을 배운다.

석탄이나 기름을 떼 발생한 열이 에너지 자원이 가진 만큼의 열로 변환되지 않고 어디론가 새어나간다. 지붕으로 창문으로 문을 열고 닫는 행위로 빠져나간다. 단열재가 필요한 이유이기도 하다.

우리 인간사도 유사하다. 한 개인이 전력투구하여 일생을 바친 지혜가 새어 나간다. 죽음이라는 섭리에 의해 단절된다. 여기에도 단열재가 필요하다. 한 개인의 지혜를 오롯이 담은, 더 상세히 이런 책과 같이 미세한 역사의 지혜를 담은 책이 그러한 단열재라고 생각한다.

다시 원점으로 돌아가 깅리치가 최신 스타일을 대리점과 계약한 의상점에 사진 전송하는 기법에서 배울 것이 많았다. 그의 접근법이 오늘날 인스타그램의 흥망성쇠와 무엇이 다를까? 역사속에는 늘 해답이 숨어 있는데 왜 이 해답을 찾아보려 하지 않을까?

페어차일드 출판사의 패션 출판에 관한 독점권 타파 방식을 에스콰이어 잡지 지면을 통해 타파하는 방식이나, “Arnold Gingrich Esquire(아놀드 깅리치 귀하)”의 편지에서 잡지 제목을 Esquire로 정한 발상력이나, 잡지의 1/3이 원색판으로 출간되는 배경 등은 굳이 편집자를 지망하지 않는 일반인들도 배울만한 점들이 많다.

그 중에서도 특히 어니스트 헤밍웨이를 영입함으로써 신생 작가들이 그와 나란히 작품을 실을 수 있다는 니즈를 충족시킨 점, 소설가들이 가난한 시대라는 점을 꿰뚫어 헤밍웨이와의 원고료와 비교하며 스스로의 원고료를 납득하게 한 점, 일류 만화가를 돕던 보조 만화가를 발굴하여 그를 주인공으로 만들어 그의 재능과 영혼을 에스콰이어에 쏠리게 한 점, 그로부터 그 유명한 에스키라는 캐릭터를 만들어 낸 점, 시장 및 구독자를 조사하여 당시 주 5일 근무제의 변화 속에 “여유”라는 트렌드와 독자 니즈를 파악해 관련 기사를 실었던 일련의 과정엔 감탄이 절로 나왔다.에스키

사람을 중심으로, 니즈를 중심으로, 또 그 결합속에서 파생하는 시너지까지 비즈니스 효율의 끝판왕이자 편집자를 넘어선 경영자의 면모는 오늘날에도 배울 것이 많다.

리더스 다이제스트의 드윗 엘레스 또한 일류 잡지에서 읽을 거리를 엄선, 요약하여 언제나 들고 다닐 수 있게 포켓 사이즈로 만들어 미국의 군인들이 세계 각국의 전도사이자 광고자로 무보수로 활약하게한 그의 안목도 만만치 않다.리더스

보그, 하퍼스 비자와 같은 잡지에서 소개된 패션은 너무 비싸 젊은 여성들에겐 그림의 떡에 불과했다. 이런 틈새 시장을 알아챈 마드모아젤의 전략에서도 배울 것이 많다.

편집자 마다 나름의 특유의 재능, 안목, 경영 전략도 일품이지만 개인적으로 가장 마음에 들었던 사람은 순수 열정 그 자체 “캐스 캔필드”였다. 그는 출판사의 회장 자리도 스스로 물러나 선임 편집자의 임무를 맡을 정도로 편집자로써의 삶이 행복 그 자체였던 사람이다.캐스 캔필드

스탈린이라는 책의 흥행 가능성과 무관하게 과감히 소신을 가지고 실패를 인정하며 출간을 중지하는가 하면, 1차 세계대전에서 독일과의 전쟁을 승리로 이끈 프랑스의 수상 조르주 클레망소의 출간을 거절한 일까지 편집자의 인생이 그의 일생 전부라고 해도 틀림이 없을 열정의 편집자에게서 정명정신을 느낄 수 있었다. 어느 직업이나 해당 분야와 물아일체된 모습은 늘 매력을 느끼게 한다.

편집자들의 위대한 일대기 외에도 책에는 읽을 거리가 참 많다.

오늘날 컴퓨터와 프로그램을 활용하여 자동화 도구로 업무를 줄이는 노력이 당시 대리인, 비서의 도움으로 대체되는 것을 보며 형태는 다르지만 100년 전이나 오늘날이나 사람의 생각과 대처법은 비슷하다는 것에 흥미가 끌리기도 했다.

대공황 때 현금의 부족을 방지하고자 루즈벨트가 은행을 강제로 문닫게 해 시중에 돈이 돌지 않던 현상, 은행 자체가 파산하여 사업에 커다란 차질을 빚는 사례 등 당시 미국 사회상을 엿볼 수 있다는 것도 이 책에서 얻을 수 있는 흥미로운 소재들이다.

대공황 같은 위기가 언제 닥칠지 모르니 국가와 은행을 믿지말고 어느 정도의 현금은 수중에 넣어둬야 하는 건 아닐까와 같은 나름의 소소한 전략을 생각해보는 재미가 있다.

이처럼 이 책은 편집자, 작가, 출판 업계 종사자들에게는 직접적으로 큰 의미가 있다. 하지만 그 외의 독자에게도 만만치 않은 흥미로운 요소들이 있다.

책을 사랑하는 나로써는 읽는 내내 책의 향기를 느낄 수 있어 편안했으며 앞서 언급한 바와 같이 위대한 편집가들의 개인 가치관, 전략, 통찰 등을 배울 수 있었다. 각자의 재능이 어떻게 출판업계라는 그림을 예쁘고 고귀하게 수놓는지 그 행보와 시간의 흐름을 엿보다 보면 배울 수 있는 점들이 차고 넘친다.

미국의 근현대사의 시대적 배경은 자체로도 삶의 지혜로 다가오기도 하지만 마치 당시 미국의 영화를 감상하듯 추억에 젖게 하는 아늑함과 아련함이 그려진다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
실전에서 바로 쓰는 시계열 데이터 처리와 분석 in R - 교육, 고용, 코로나 데이터를 활용한 시계열 프로젝트, 2022 세종도서 학술부문
이기준 지음 / 제이펍 / 2021년 7월
평점 :
장바구니담기


R과 통계 중심의 시계열 분석 입문서이다. R의 패키지 및 시계열 모델들을 실전에서 활용하기 용이하게 잘 정리되어 있으며 각 특징들을 한 눈에 비교하기 좋다는 장점이 있다.

각 장마다 다루는 책의 내용을 간략히 요약해보겠다.

1장은 시계열 데이터가 무엇인지 소개한다. 시계열 데이터에는 동일한 간격으로 측정된 시간이 독립변수 존재한다. 시계열 분석은 이러한 데이터를 시계열 패턴과 백색잡음으로 탈곡하는 과정으로 비유한다.

과거가 현재에 영향을 주는 자기상관, 장기적으로 점차 증감하는 경향성, 고정된 기간에 주기적으로 반복하는 계절성, 변동적 기간에 주기적으로 반복하는 순환성, 확률분포나 신뢰구간 등 확률의 성질을 갖는 불확실성 등 시계열 데이터가 가지는 특성을 소개한다.

2장은 날짜, 시간을 다루는데 용이한 클래스 등 R에서 제공하는 도구를 살펴본다. date, POSIXct, POSIXlt, yearmon, yearqt 등의 클래스부터 ts, xts, tsibble 등 데이터프레임과 유사한 기능의 시계열에 특화된 데이터 객체를 소개한다.

그 외 xls, csv 등 외부 파일을 읽어들이고 변환하는 방법도 간단히 살펴본다. R이 제공하는 기능들을 체계적으로 정리하여 한 번에 장단점들을 비교해 볼 수 있다는 점이 책의 장점인데 이런 기조는 책이 끝날때까지 지속된다.

3장은 시계열 데이터를 시각화하는 방법을 다룬다. 개인적으로 시계열 분석은 다른 분석에 비해 시각화에 더욱 의존하게 되는 경향이 있다. 시계열에 숨은 패턴을 찾는데 시각자료를 활용한 직관보다 빠르고 쉬운 방법이 없기 때문이다.

data.frame은 ggplot2 혹은 timetk, xts은 자체 패키지, ts는 forecast, tsibble은 feasts 등 데이터가 담긴 객체에 따라 어떤 시각화 패키지를 활용해야 하는지 2장에서 언급한 바와 같이 일목요연하게 정리되어 있다. 덕분에 프로젝트 성격에 따라 유리한 객체와 문법을 골라쓰기 좋다.

4장에는 데이터를 가공하고 처리하는 다양한 유형을 다룬다. 개인적으로 가장 도움이 되었던 장이기도 하다. 시계열 데이터를 가공하다보면 주간, 월간, 분기, 연간 등 특정 기간별로 그루핑, 증감량, 백분율, 비중, 누적합을 구하는 것은 기본이다.

조금 더 나아가면 롤링 윈도우를 활용하거나 동기별 비교, 연산이 필요하기도 하다. 주말이라는 특성도 존재하기에 반올림이나 시간 연산도 필요한데 코로나 확진자 수 등의 데이터를 활용하여 가공해보고 시각해본다.

5장은 시계열 분석에 필요한 핵심 개념들을 코드로 통해 느끼고 데이터를 통해 만지고 그려보도록 구성되어 있다.

ACF, PACF 등 통계 분야에서 전통적으로 자주 활용하는 자기상관, 부분 자기상관 관계를 분석하는 기법에서부터 lag 함수를 이용하여 지연, 차분을 처리하는 방법을 다룬다.

분석에서 가장 자주 활용하는 시계열 분해도 다룬다. 개인적으로는 정상성 테스트나 계절설 검정같은 시계열 분야의 검정에 약했는데 덕분에 자신감을 얻을 수 있었다.

6장에는 현존하는 거의 모든 시계열 모델을 총체적으로 정리한다. 통계학 전공자가 아니다보니 딥러닝의 RNN, LSTM, GRU 등으로 시계열을 먼저 접했고 때문에 통계 관련 모델이 등장하면 해메기 일수 였는데 이 참에 궁금증을 많이 해소할 수 있었다.

특히 컴퓨터 공학에 디자인 패턴이 파생되는 것처럼 모델 간 특징이 결합되어 새로운 시계열 모델이 등장한 배경을 알고나니 생소한 모델도 쉽게 이해가 된다.

예를 들면 계절성 단순 모델은 단순 모델에 계절성을 추가한 모델이며, 홀트 윈터 모델의 경우 단순 지수 평활 모델을 확장하여 추세와 계절성을 추가한 모델이다.

ETS, ARIMA 정도만 다뤄본 나로써는 시계열에 이렇게 많은 모델이 존재하는지 몰랐는데 이번 기회에 쉽게 잘 정리할 수 있었다. 또 그동안 다뤄보지 못한 페이스북에서 만든 prophet 모델이나 TBATS과 같은 모델도 활용하도록 구성되어 있어 만족스러웠다.

7장은 시계열 분석 프레임워크를 다룬다. 개인적으로 가장 마음에 든 장이며 실전에서 많은 도움이 될 것 같다는 생각이 들었다.

fable 프레임워크를 활용하면 아래 그림에서와 같이 다양한 모델들이 예측한 결과를 한 눈에 확인해 볼 수 있다. 모델별 예측 결과를 시각화 비교해 볼 수 있음은 물론 수치를 통한 성능 지표도 확인할 수 있다. fable은 tidy 기반이기에 다중 시계열을 동시에 여러 모델에 적용해볼 수 있으며 앙상블 기법도 가능하다.fable

이와 유사한 modeltime 프레임워크도 소개한다. 머신러닝 진영에서 주로 활용하는 워크플로를 활용할 수 있다는 장점이 있다.workflow

마찬가지로 모델별 예측 결과를 비교해 볼 수 있다.modeltime


이처럼 시계열 분석을 위해 주로 활용하는 R의 패키지, 객체, 모델 등이 활용하기 좋게 잘 정리되어 있다는 점이 책의 가장 큰 장점이다.

또, 코드와 시각화를 통해 직접 데이터와 모델을 만져볼 수 있어 실전 중심으로 쉽게 개념을 익힐 수 있다는 점도 장점이다.

반면 아쉬운 점도 두가지 있다. 하나는 직접 만든 데이터 혹은 잘 정리된 예제 데이터로 모델과 전처리를 수행했다는 점이다. 현업에 살아있는 거친 데이터로 시작했다면 보다 실전에 많은 도움이 되었을 것이다.

다른 하나는 실전 프로젝트 분석 과정이 하나 정도 담겨 있었다면 더 좋았겠다는 생각이 들었다. 부분 부분 체계적으로 잘 정리되어 있는 장점이 유기적으로 연결되지 않는 느낌이 들어 아쉬웠다.

하지만 책의 분량이나 타깃 독자층을 생각했을 때 두마리 토끼를 모두 잡는 일이 쉽지 않음을 알기에 전체적으로 이 책은 입문서라는 목적에 충실하게 잘 만들어진 책이라는 생각이 든다.

시계열이 너무 어려워 기초를 다지고 싶은 입문자라면 이 책을 처음으로 접해보는 것도 좋은 선택이 될 것 같다.




댓글(0) 먼댓글(0) 좋아요(1)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
머신러닝을 활용한 웹 최적화 - A/B 테스트, 메타휴리스틱, 슬롯머신 알고리즘에서 베이즈 최적화까지
이쓰카 슈헤이 지음, 김연수 옮김 / 한빛미디어 / 2021년 6월
평점 :
장바구니담기


A/B 테스트를 중심으로 통계 및 머신러닝을 활용하여 웹사이트 최적화 기법을 다루는 책이다. 연구 성과를 일목요연하게 잘 정리하고 있고, 실전에 적용하는데 필요한 고민과 해법이 같이 담겨 있다.

읽다보면 매우 간단한 예제 2개만으로 통계가 실전에서 어떻게 활용되는지 생생하게 접할 수 있다. 통계, 베이즈 추론 등에 숨겨진 개념을 실용적으로 끌어내는 방법을 비롯해 해당 분야의 연구 성과가 잘 정리되어 있어 실전에 적용할 만한 연결고리를 찾을 수 있다는 점도 장점이다.

책은 크게 2개의 예제를 중심으로 살이 붙어나가는 방식이기에 이를 중심으로 책의 내용과 배운점 및 장점을 요약해 본다.


  • 예제1 : 앨리스와 밥의 A/B 테스트
    아래 그림은 앨리스와 밥이 상품 소개 페이지의 자료 요청 버튼의 클릭율을 높이기 위하여, 두 가지 디자인 A, B안을 준비한 후 노출 횟수 및 클릭 횟수를 측정한 결과이다. 클릭률이 우연히 동일하게 나왔지만 각 횟수가 다르기에 B안을 선택해야 한다고 결론을 내릴 수 있을까?예제1

    저자는 이 예제를 활용하여 웹사이트 최적화에 필요한 기본 지식을 정리한다. 확률 변수, 베르누이 시행, 확률 분포, 확률 분포의 파라미터, 정규화, 확률의 덧셈정리를 활용한 주변화(marginalization), 베이즈 업데이트를 활용한 사후 분포 시각화 등이 그것이다.사후분포

    그 중 사후 분포를 정량적으로 평가하기 위한 방법 2가지가 소개되는데 이 부분부터 웹사이트 최적화에 유용한 기법들이 본격적으로 소개되기 시작한다. 하나는 시행 반복을 통한 통계 모델링을 활용하여 분포를 추정하는 방법이고, 다른 하나는 사후 분포에 나타난 베타 분포를 활용한 방식인데 후자가 중요한 방식이다.

    먼저 후자 방식의 기초 통계량을 활용하는 방법이 소개되고 그 중 클릭율 사후 분포의 HDI - 확률 변수의 값이 높은 확률로 나타나는 구간 - 를 구하여 확률 질량이 큰 순서대로 상윗값을 반환하는 hmv 메서드를 만들어 “디자인 B안의 클릭율은 5%보다 높다.”와 같은 가설을 만든다. 그 과정을 도식화하면 아래 그림과 같다.HDI 가설

    이어서 A안의 클릭율과 B안의 클릭율의 차이인 파생 변수를 생성해보는 등 추가 시도를 거치는데 큰 확률이라는 값이 95%면 충분할 지, ROPE 폭과 같이 검증하고자 하는 가설을 정량적 평가로 변환하는 과정 등 실무에서 공유되어야 할 도메인 측면에 대한 고민도 담겨 있어 유용했다.

    여기까지가 통계와 웹최적화의 기본이었다면 2장 부터는 MCMC(마르코프 연쇄 몬테카를로 알고리즘)을 활용한다. 초기값은 최적의 파라미터 주위에 근접하도록 상태를 전이시키지만 이런 부분이 영향을 미치지 않도록 어느 정도 탐색이 진행된 뒤의 샘플을 얻는다. PyMC3 모듈을 활용하여 MCMC를 시각화하여 볼 수 있어 이해에 도움이 된다.

    특히 개인적으로는 가능도 함수의 분포인 베르누리 분포, 카테고리컬 분포, 이항 분포, 다항 분포와 신념(믿음)의 분포인 베타 분포, 디리클레 분포의 총체적인 관계를 정리해 볼 수 있어 만족스러웠다. 그동안 통계학에서 다루는 분포 대부분의 개념은 잘 숙지하고 있었지만 분포 간의 변화와 관계가 늘 궁금했는데 앨리스와 밥의 문제로 변수를 최소화 한 접근법 덕분에 비교적 명쾌하게 이해할 수 있었다.

    여기서 끝났어도 충분히 만족스러웠는데 하나 더 저자에게 고마움을 느낀 부분이 있다. 2장의 마무리 단계에서 NHST(귀무가설 유의성 검증)과 베이즈 추론 간 통계적 가설 검증을 비교해본다. 통계학 비전공자라 볼 때 마다 헷갈린 부분인데 이 책을 통해 감을 잡을 수 있었다.두가지통계가설검증

    두 검증의 차이는 일단 기본적으로 자유도에 차이가 있다. NHST는 잘 알려진 분포만 활용한다는 한계가 있지만 검정 통계량을 신뢰할만하다. 반면 베이즈 접근 방식의 경우 앞서 예제와 같이 HDI를 비교 평가 할 수 있어 유연한 가설 검증이 가능했다. 하지만 적절한 사전 분포를 설계해야 한다는 제약 조건이 따르며 적응 데이터 분석 및 과적합 문제를 안고 있다는 사실로 정리해 볼 수 있었다.

    사실 딥러닝을 먼저 시작한 나로써는 데이터가 많은 요즘 같은 시대에 검정, 추정을 실전에서 어떻게 활용하는지 늘 궁금했었고, 나아가 베이즈 추론과 사후 분포의 위력을 체감하기 어려웠는데 앨리스와 밥의 A/B 테스트와 같이 심플한 예제 덕분에 통계에 숨은 개념을 현실로 끌어내는데 큰 도움이 되었다. 이어질 두 번째 예제는 보다 어렵지만 나 같은 통계 하수는 1 ~ 2장만으로도 충분히 만족스러운 책이라고 평하고 싶다.


  • 예제2 : 조합형 4가지 디지안 시안 테스트
    제목은 어려워 보여도 이 역시 너무 간단한 예제이다. 아래 그림과 같이 시안 A,B,C,D 중 어떤 시안이 가장 뛰어날지 판단하는 문제이다. 위 예제1과 다른 점이 있다면 A,B는 그림이 같고, C,D는 버튼 문구가 다르다. 즉, 그림과 문구 간 조합이라는 요소가 존재하는 예제이다. 예제1은 개념을 익히기에는 좋은 예제이지만 실전에서 바로 활용하기는 어렵기에 예제2릍 통해 실전에 한 걸음 다가갈 수 있는 셈이다.예제2

    이 예제에서는 무엇보다 통계 모델링을 구체적으로 진행하는 방법이 소개되어 있어 유익했다. 예제1에서 배웠던 분포를 활용하여 이미지 변경에 따른 클릭율, 버튼 변경에 따른 클릭율, 베이스라인 클릭율 등 새로운 파생 변수를 도입한 후 로짓 함수 및 정규 분포를 활용하여 아래와 같이 최종 클릭율을 예측하는 모델을 만든다.통계모델링

    이어서 요소의 조합에 의해 발생하는 교호 작용을 파악하고 모델에 교호 작용항을 추가한다. 이는 통계 기본에 해당하는 다중 공선성의 문제인데 교호작용을 어디까지 고려해야 할 지 생각해 볼 수 있는 좋은 기회였다. 4장에서는 해결책 중의 하나로 메타휴리스틱을 접목해본다.메타휴리스틱

    오른쪽 그림과 같이 접근하면 교호작용을 고려하거나 최적 변수 선택의 고만이 필요없다. A*알고리즘과 같이 목적지와 현 위치 사이의 추정거리를 휴리스틱으로 도입하는 셈이다. 이를 책에서는 언덕 오르기 알고리즘(Hill Climbing)이라고 정리하고 있다.

    생긴 것이 딥러닝의 손실함수 경사하강법 문제와 비슷해 보인다 싶었는데 역시나 여기에서도 국소 최적문제가 등장했다. 이를 해결하고자 마치 SGD처럼 확률적 언덕 오르기 알고리즘, 온도 파라미터를 도입한 시뮬레이티드 어닐링, 교차율을 도입한 유전 알고리즘 등이 소개되는데 하나 하나 괜찮은 아이디어였다. 딥러닝이 통계와 얼마나 밀접한지 실감할 수 있었다.

    5장에서는 보다 실전에서 고민할 만한 사항이 등장한다. 테스트 중에 발생하는 손실, 기간 등에 대한 문제도 다룬다. 즉, 강화학습에서 흔히 볼 수 있는 다중 슬롯머신 탐색과 활용 딜레마가 웹페이지 최적화에도 등장하는 문제임을 알 수 있다. 이를 해결하기 위한 방법으로 Epsilon-Greedy, 시뮬레이티드 어닐링 Epsilon-Greedy, Softmax, 톰슨 샘플링, UCB 등의 아이디어가 소개된다.

    5장이 다소 연구적인 느낌의 정리였다면 6장은 5장에서 배운 연구 성과를 실전에 접목해보는 형태를 띈다. 즉, 눈 앞의 슬롯머신이 변하듯 개인화 구현의 문제로 넘어간다. MCMC를 베이즈 선형회귀에 접목하는 방법에서 연구 성과를 실전에 적용하는 방법론을 배울 수 있었다. 5장에서 배운 UCB를 응용해서 LinUCB를 구현해내는 과정은 머리속에 떠오른 아이디어를 어떻게 기존 연구에 연결할 수 있는지 그 경계선을 느끼게 해줬다.


그 외에도 7장에서 배운 가우스 과정을 톰슨 샘플링에 적용한 GP-TS 알고리즘은 UCB에 아이디어를 살을 붙여 가는 방법을 알게 해줬다. 덕분에 읽으며 개인적으로 괜찮은 아이디어가 떠올랐는데 이를 접목해보고 논문을 써봐야겠다는 생각이 들었다. 이처럼 생소한 분야에 연구적 커넥팅을 가능하게 해준 다는 점은 이 책의 큰 장점 중 하나이다.

8장에는 웹 최적화 분야에 앞으로 필요한 기술들이 소개되는데 오토인코더가 등장해서 신선했다. 다양한 AI 분야가 존재하지만 상호 영역을 잘 알아두고 조합한다면 어떤 분야에서든 멋진 아이디어가 파생될 수 있겠다는 생각이 들었다.

적어도 내 수준에서는 이 책에서 너무도 많은 것을 배울 수 있었다. 위에서 언급했듯 통계가 실전에 어떻게 적용되는지 너무 심플한 예제로 통계학에 숨어있는 지식을 생생하게 느낄 수 있게 해준 점, 저자 특유의 웹 최적화 분야 연구 성과 전달력 덕분에 아이디어를 연구 혹은 실전에 적용하는 연결고리를 얻게 해준 점 등 큰 도움을 받았다.

리뷰를 통해 저자, 역자, 편집자 분들께 진심으로 감사의 말씀을 전하고 싶다. 웹최적화 뿐만 아니라 통계나 머신러닝에 관심있는 독자에게 꼭 추천하고 싶은 책이다.


한빛미디어 “나는 리뷰어다” 활동을 위해서 책을 제공받아 작성된 서평입니다.



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
저는 인문학이 처음인데요 - 교양인이 되기 위한 내 생애 첫 인문학 처음인데요 시리즈 (경제)
박홍순 지음 / 한빛비즈 / 2021년 3월
평점 :
장바구니담기


인문학이 무엇인지, 왜 피하게 되는지, 그럼에도 왜 필요한지 등의 질문을 살펴보며 보통 사람 수준의 눈높이에서 인문학을 소개하는 책으로 상상력, 나 자신의 내면, 행복, 관계, 일이라는 주제를 중심으로 현실의 우리 문제를 깊이 있게 들여다 보는 책이다.

지극히 추천하고 싶은 이 책에 유일한 단점이 있다면 제목일 것이다. 인문학이 처음이라는 설명은 자칫 인문학을 자주 접한 사람이 비하고 싶게 생긴 제목이다. 인문학을 매우 쉽게 설명하고 있으나 수준은 높지 않아 얻을 것은 많지 않다는 뉘앙스가 걸린다.

나름대로 정정하자면 이 책은 인문학의 거의 모든 것을 다룬다. 깊이가 얕지도 않다. 주제가 협소하지도 않다. 인문학의 대가는 아니지만 평소 즐겨 읽는 나로써는 책이 다루는 방대한 스케일에서 심오하고 깊이 있는 해석에 적잖이 놀랐다.

내게 새로이 제목을 지을 권한이 주어진다면 다음과 같은 제목들 중 하나로 표현했을 것이다.

  • 우리 모두의 문제를 해결하는 방법
  • 하룻밤에 저절로 읽게되는 인문학
  • 인문학 좀 읽어본 사람이 깊이있고 폭넓게 정리할 수 있는 인문학

다시 원점으로 돌아가서 인문학은 말 그대로 인간과 인간이 남긴 문화에 대해 연구하는 학문이라 할 수 있다. 본 도서에서는 인문학이 다양한 측면에서 매우 유용한 학문임을 여러 사례로 강조하고 있지만 결국 인간의 행복으로 귀결된다고 할 수 있다.

행복하기 위해선 우리 자신을 잘 알아야 함에도 우리 자신이 스스로에 대해 너무도 모르기 때문에 인문학이 중요하다고 할 수 있겠는데 인류 역사를 통떨어 이 문제를 대표하는 가장 큰 질문이 소크라테스의 “너 자신을 알라!“라는 철학 명제일 것이다.소크라테스

이 명제는 학교 다닐 때 수도 없이 들었는데 저자가 언급한 바와 같이 처음 들었을 때 쌩뚱맞기 그지 없는 말이라는 것은 모두가 공감했을 것이다. 나 역시 처음 듣고는 이게 무슨 인류 최대의 명제인가 라는 생각부터 우둔해 보이기 까지 하는 필요성이 전혀 느껴지지 않는 허황된 질문이라는 생각을 했다.

나이가 들며 삶에 애환이 생기고 고민이 늘어나며 깊이 있는 생각을 하게 되고 그 안에 답을 찾고자 발버둥 치다보니 인문학도 접하게 되고 그러다보니 인간을 잘 아는 것이 중요하다는 것을 알고 나서야 소크라테스의 이 명제가 비로소 대단하게 보이기 시작했다.

소크라테스의 명제가 어떤 의미를 지니고 있는지 이 책에서는 일반인들의 눈높이에서 출발하여 단계별로 해석하며 추론해가며 그 수준을 높여준다. 저자의 결론이 다다르면 우리는 그동안 우리가 보지 못했던 진리의 깊이를 마주하게 되는데 이런 구성 방식이 책의 최고 백미라 칭할만 하다.

예를 들어 책에 소개된 아래 그림은 라파엘로의 아테네 학당이라는 명화로 플라톤과 아리스토텔레스가 중심에 있다. 소크라테스를 계승한 이 둘의 손 위치는 많은 의미를 함축하고 있다. 왼쪽 플라톤의 손가락은 형이상학적 이데아를 칭한다.아테네학당

이데아란 실제로 존재하지만 시공간에 존재하지 않는 진리와 유사한 개념이다. 마치 2+2=4라는 것도 이데아 중 일부이다.

플라톤은 이데아가 마치 닿을 수 없는 곳에 있다는 듯 하늘 위를 가리킨다. 손가락으로 “그 자체”라는 말을 붙여 이데아를 만든다. 책상에다 “책상 그 자체”라고 하면 책상의 이데아가 되는 것이다.

반면 오른쪽의 아리스토텔레스는 손바닥을 땅 방향으로 향한다. 분노, 용기 등의 감각은 신체없이는 존재할 수 없으며 영혼도 마찬가지이기에 자연과 현실을 중요하게 여기는 것이다.

명화 하나만으로도 당시 그리스 시대에 숨은 철학의 진리를 엿볼 수 있게 된 것은 모두 저자 덕분이다. 고대의 명화나 철학서에 어떤 어려운 문구가 인용되더라도 두려워 할 필요가 없다.

처음 읽을 때는 이해되지 않겠지만 저자의 해석을 따라가다보면 결국 알게 될 것이다. 어려운 문장을 곱씹어 내재화 할 수 있는 독해력을 얻을 수 있다는 것은 옵션이다.

IT를 전공한 나로써는 저 이데아에서 객체지향프로그래밍이 파생된 것을 알기에 곱씹을 수록 놀라웠다. 인문학 속에 숨은 옛 현인들의 고민이 오늘날의 현실에서 패러다임을 뒤 흔들고 공학과 기술에 큰 영감을 불어넣는다는 것을 다른 이들도 직접 보고 듣고 느낀다면 인문학이 얼마나 중요한지 알게 될 것이다. 스티브잡스의 인문학이 애플 아이폰을 만든다는 뻔한 말이 아니라 스스로 직접 구현해보며 손으로 눈으로 느낄 수 있다면 좋겠다.

어쨌든 저자 덕분에 물고기와의 이심전심으로 장자의 철학을 들여다 볼 수 있는가 하면 예로부터 유명한 명화에 담겨있는 작가의 사상과 시대적 배경을 엿볼 수도 있고 심지어는 이 시대 가장 많은 이들이 즐겨보는 영화 속에 숨어있는 철학도 엿볼 수 있다.

이러한 해석은 우리가 필요로 하는 현실의 문제에 맞닿아 있다. 우리가 잠들기 전에 이불킥하거나 살아가는데 너무 힘들어 누군가를 잡고 지혜를 얻고 싶은 그런 문제에서 벗어나지 않는다. 이 책이 우리에게 주는 뛰어난 가치다.

일상에서 우리가 마주하는 스케일이 큰 질문중에 AI 시대에 인간이 나아가야 할 방향에 대한 문제가 있다. 나는 인문학에서 많은 힌트를 얻었다. AI는 사람의 행동에 의해 수집된 데이터에 의존하는 경향이 강하기에 사람만이 해낼 수 있는 길에 주목했다.

가보지 않은 길, 새로운 프레임, 생각지도 못한 길이 인간이 가야할 방향이다. 인간의 데이터에 의존하는 AI는 가보지 않은 길을 아직까지는 갈 수 없다.

물론 이 또한 약 인공지능이 주류를 이루는 오늘날의 해법일 것이고 사람과 거의 유사한 강 인공지능이 출현하면 무용지물이 될 수 있는 전략일지도 모르겠다. 강 인공지능으로 나아가는 핵심에 오늘날 강화학습이라는 기술이 숨어 있다. 강화학습은 인간이라면 선입견 때문에 내놓지 못하는 해결책을 내어준다.

프로기사들이 주저했던 알파고의 수 - 예를 들면, 3*3 착점 -, 새로운 단백질 분자구조, 새로운 암호 조합 기술 등이 강화학습 덕분에 출현하고 있다. 앞으로 모든 분야의 사람들은 강화학습을 보조도구 삼아 창의성을 높히고 생존 전략을 찾아나가야 할 것이다.

한 발 더 나아가 강화학습 또한 한계가 있음에 주목할 필요도 있다. 아직까지는 유한 확정 완전 정보 세계에서만 강점을 드러내고 있기 때문이다.

즉, 바둑과 같은 게임 세계에는 완전한 규칙이 있고 이로 인해 보상과 벌칙으로 AI를 학습시키는데 인간 세상같이 무엇이 득인지 실인지 판단하기 어려운 세계에는 한계점도 존재한다.

이런 AI의 맹점을 보완할 수 있는 것이 인간이다. 그리고 그 원천은 다양성에 있으며 예로부터 뛰어난 질문과 고민으로 축적된 인문학에 있다 생각한다.

책에서도 소개되었듯 때로는 광기의 역사에 억압받는 광기 속에서 그 답을 찾을 수 있을 것이고 러셀의 생각처럼 주 4시간의 노동으로 확보된 시간의 자유에서 찾을 수도 있을 것이다.노동시간

때로는 죽음을 남의 것이 아닌 자신의 문제로 받아들이고 버킷리스트를 만들며 삶의 의미와 행복에 대해 고민하며 얻게 될 수 있고, 죽음을 표현한 아래 명화에서 영감을 얻을 수도 있을 것이다.죽음과삶

책이 다루는 인문학의 범위가 상당하고 약 500p에 육박할 정도로 많은 양을 다루고 있기에 이를 압축해서 내가 최근에 고민했던 AI 시대의 생존 전략이라는 화두에 한정하여 책에서 배운 것들을 접목하며 리뷰를 줄여나갔다.

하지만 책에는 그 외에도 나 자신의 내면을 들여다보거나, 알 수 없는 불안과 심리학에 대해 생각해 볼 기회도 주어진다. 더불어 사람과의 관계, 돈과 노동의 의미, 행복해 지기 위한 길 등 너무도 많은 우리의 문제를 인문학이라는 안경으로 살펴본다.

독자의 고민 중 최소 1개는 이 그물망에 걸릴 것이라 장담한다. 굳이 책장에 고이 모시지 말고 당장의 문제를 해결하고 생각의 프레임을 전환하는데 이 책을 통해 도움받을 것을 강력히 추천하는 바이다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo