편집자의 세계
고정기 지음 / 페이퍼로드 / 2021년 7월
평점 :
장바구니담기


미국 근대의 출판 문화를 이끈 15명의 명편집자의 이야기를 한국 출판의 1세대 편집자가 간추리고 해석한 책이다.

편집자의 일상에서부터 위대한 편집자의 행보를 엿볼 수 있는 것은 물론 훌륭한 위인이라 할 만한 이들의 뛰어난 안목이나 습관도 엿볼 수 있다.

나아가 리더스 다이제스트, 에스콰이어, 뉴요커, 마드모아젤과 같은 유명 잡지가 탄생하기까지 그들의 창업 아이디어와 시대의 니즈를 읽는 감각을 배울 수 있으며 1900년대의 미국의 역사에서 오늘날 배울 만한 요소들도 담겨있어 인상적인 책이다.

먼저 15인의 편집자 소개 중 책 제목에 걸맞는 편집자의 세계를 가장 잘 엿볼 수 있는 부분은 퍼트넘의 편집국장인 윌리엄 타그를 다룬 파트이다.

책의 마지막에 수록된 이권우 독서평론가의 해설을 먼저 읽은 덕분에 이 파트를 먼저 읽을 수 있었다. 윌리엄이 저술한 “발칙한 갖가지 기쁨들(Indecent Pleasures)”에 인용된 편집자의 24시간은 책에 미치지 않은 사람이라면 견디기 힘들만큼 고된 여정이다.

출근하여 우편물을 정리 및 답신하고, 원고 개요를 읽고, 타 평론가의 리뷰를 검토하고, 작가를 만났을 때 할 이야기를 메모하고, 출간을 앞 둔 도서에서 수정할 부분을 찾아내고, 원고 피드백에 대한 일정을 계획하고, 선전용 문안과 약력 등을 구술하고, 저자들과의 저녁 약속 시간을 보내며, 잠들기 전 원고의 가치를 선별한 후 하루를 반성하며 내일 있을 편집 회의를 계획하며 잠든다.

그 외에도 루틴하지 않은 갑작스러운 지저분한 일들 - 저자로부터의 매상 부수 및 광고 등의 항의, 타 출판사와의 교섭 요청, 토론 참석 여부에 대한 요청, 긴급 제안 기획 회의 등 - 이 예기치 않게 찾아오는데 오늘날의 힘든 직장 생활이 100년 전에도 존재했음을 짐작하게 한다.

어느 직업이나 열정없이 쉬운 일은 없는 듯 하다. 정말 좋아하는 일을 찾아 주도적으로 즐기는 일만이 노동의 괴로움 속에서 해방될 수 있는 개인적 차원의 해법임을 여기에서도 느낄 수 있었다.

편집자의 꿈을 가진 이라면 이 책은 너무 훌륭한 책이다. 위에서 언급했듯 편집자의 일상을 엿볼 수도 있고 고정기 저자의 한국 실정으로 이관한 해석도 맛볼 수 있으며 명편집자들이 성공하기까지 그들이 가진 가치관과 행동 양식을 배울 수 있기 때문이다.

맥스웰 퍼킨스는 헤밍웨이와 같은 유명 작가의 재능을 간파하는 눈을 가졌고 마찬가지로 파스칼 코비치는 노벨 문학상 수상자인 존 스타인벡을 발굴했다. 이들의 재능은 단순히 좋은 작가를 알아보고 좋은 작품을 선별하는 능력에 그치지 않는다.

존 스타인벡의 무명 시절에 그가 앞날을 헤쳐나갈 만한 용기와 신뢰를 주었고, 사후 그로부터 “나의 유일한 편집자, 아버지, 교사, 악마, 합작자, 양심”이라는 평을 듣기도 했으며, 퍼킨스의 경우 헤밍웨이와 낚시를 즐기며 다른 출판사로부터 그를 영입하는 하였다. 이처럼 그들의 재능을 알아보는 것 외에도 작과와 평생을 함께하는 동반자로써의 삶을 살았다.

어느 직업이나 마찬가지겠지만 편집자라는 직업 또한 작가와 관련된 일에만 국한되지는 않는다. 때로는 경영인이 되어야 하기에 시대의 흐름, 고객의 니즈를 통찰하는 일도 중요한 요소이다.

특히 에스콰이어의 창간자인 아놀드 깅리치, 리더스 다이제스트의 창간자인 드윗 엘레스 등의 일대기에선 창업에 관한 인사이트도 얻을 수 있다. 그 중에서도 깅리치의 행보는 매우 인상적이었다.

설탕 선물거래로 70만 달러를 벌었던 것이 가격 폭락으로 5만 달러의 수익으로 종결된 것은 오늘날 주식 투자나 비트코인을 연상케 한다.

잠깐 번외로 새자면 이 책의 출판사인 페이퍼 로드 책은 역사를 다루는 도서가 많아 가끔 옛 현인들의 발 자취에서 배울 것이 많아 즐겨 읽는데 이 대목도 그런 부분의 하나이다.

나는 책을 읽으며 역사 - 그 중에서도 한 개인이 살았던 시대에 집중된 미세한 역사 - 를 즐겨 찾는 편이다. 누구나 학창시절 과학 시간의 열효율을 배운다.

석탄이나 기름을 떼 발생한 열이 에너지 자원이 가진 만큼의 열로 변환되지 않고 어디론가 새어나간다. 지붕으로 창문으로 문을 열고 닫는 행위로 빠져나간다. 단열재가 필요한 이유이기도 하다.

우리 인간사도 유사하다. 한 개인이 전력투구하여 일생을 바친 지혜가 새어 나간다. 죽음이라는 섭리에 의해 단절된다. 여기에도 단열재가 필요하다. 한 개인의 지혜를 오롯이 담은, 더 상세히 이런 책과 같이 미세한 역사의 지혜를 담은 책이 그러한 단열재라고 생각한다.

다시 원점으로 돌아가 깅리치가 최신 스타일을 대리점과 계약한 의상점에 사진 전송하는 기법에서 배울 것이 많았다. 그의 접근법이 오늘날 인스타그램의 흥망성쇠와 무엇이 다를까? 역사속에는 늘 해답이 숨어 있는데 왜 이 해답을 찾아보려 하지 않을까?

페어차일드 출판사의 패션 출판에 관한 독점권 타파 방식을 에스콰이어 잡지 지면을 통해 타파하는 방식이나, “Arnold Gingrich Esquire(아놀드 깅리치 귀하)”의 편지에서 잡지 제목을 Esquire로 정한 발상력이나, 잡지의 1/3이 원색판으로 출간되는 배경 등은 굳이 편집자를 지망하지 않는 일반인들도 배울만한 점들이 많다.

그 중에서도 특히 어니스트 헤밍웨이를 영입함으로써 신생 작가들이 그와 나란히 작품을 실을 수 있다는 니즈를 충족시킨 점, 소설가들이 가난한 시대라는 점을 꿰뚫어 헤밍웨이와의 원고료와 비교하며 스스로의 원고료를 납득하게 한 점, 일류 만화가를 돕던 보조 만화가를 발굴하여 그를 주인공으로 만들어 그의 재능과 영혼을 에스콰이어에 쏠리게 한 점, 그로부터 그 유명한 에스키라는 캐릭터를 만들어 낸 점, 시장 및 구독자를 조사하여 당시 주 5일 근무제의 변화 속에 “여유”라는 트렌드와 독자 니즈를 파악해 관련 기사를 실었던 일련의 과정엔 감탄이 절로 나왔다.에스키

사람을 중심으로, 니즈를 중심으로, 또 그 결합속에서 파생하는 시너지까지 비즈니스 효율의 끝판왕이자 편집자를 넘어선 경영자의 면모는 오늘날에도 배울 것이 많다.

리더스 다이제스트의 드윗 엘레스 또한 일류 잡지에서 읽을 거리를 엄선, 요약하여 언제나 들고 다닐 수 있게 포켓 사이즈로 만들어 미국의 군인들이 세계 각국의 전도사이자 광고자로 무보수로 활약하게한 그의 안목도 만만치 않다.리더스

보그, 하퍼스 비자와 같은 잡지에서 소개된 패션은 너무 비싸 젊은 여성들에겐 그림의 떡에 불과했다. 이런 틈새 시장을 알아챈 마드모아젤의 전략에서도 배울 것이 많다.

편집자 마다 나름의 특유의 재능, 안목, 경영 전략도 일품이지만 개인적으로 가장 마음에 들었던 사람은 순수 열정 그 자체 “캐스 캔필드”였다. 그는 출판사의 회장 자리도 스스로 물러나 선임 편집자의 임무를 맡을 정도로 편집자로써의 삶이 행복 그 자체였던 사람이다.캐스 캔필드

스탈린이라는 책의 흥행 가능성과 무관하게 과감히 소신을 가지고 실패를 인정하며 출간을 중지하는가 하면, 1차 세계대전에서 독일과의 전쟁을 승리로 이끈 프랑스의 수상 조르주 클레망소의 출간을 거절한 일까지 편집자의 인생이 그의 일생 전부라고 해도 틀림이 없을 열정의 편집자에게서 정명정신을 느낄 수 있었다. 어느 직업이나 해당 분야와 물아일체된 모습은 늘 매력을 느끼게 한다.

편집자들의 위대한 일대기 외에도 책에는 읽을 거리가 참 많다.

오늘날 컴퓨터와 프로그램을 활용하여 자동화 도구로 업무를 줄이는 노력이 당시 대리인, 비서의 도움으로 대체되는 것을 보며 형태는 다르지만 100년 전이나 오늘날이나 사람의 생각과 대처법은 비슷하다는 것에 흥미가 끌리기도 했다.

대공황 때 현금의 부족을 방지하고자 루즈벨트가 은행을 강제로 문닫게 해 시중에 돈이 돌지 않던 현상, 은행 자체가 파산하여 사업에 커다란 차질을 빚는 사례 등 당시 미국 사회상을 엿볼 수 있다는 것도 이 책에서 얻을 수 있는 흥미로운 소재들이다.

대공황 같은 위기가 언제 닥칠지 모르니 국가와 은행을 믿지말고 어느 정도의 현금은 수중에 넣어둬야 하는 건 아닐까와 같은 나름의 소소한 전략을 생각해보는 재미가 있다.

이처럼 이 책은 편집자, 작가, 출판 업계 종사자들에게는 직접적으로 큰 의미가 있다. 하지만 그 외의 독자에게도 만만치 않은 흥미로운 요소들이 있다.

책을 사랑하는 나로써는 읽는 내내 책의 향기를 느낄 수 있어 편안했으며 앞서 언급한 바와 같이 위대한 편집가들의 개인 가치관, 전략, 통찰 등을 배울 수 있었다. 각자의 재능이 어떻게 출판업계라는 그림을 예쁘고 고귀하게 수놓는지 그 행보와 시간의 흐름을 엿보다 보면 배울 수 있는 점들이 차고 넘친다.

미국의 근현대사의 시대적 배경은 자체로도 삶의 지혜로 다가오기도 하지만 마치 당시 미국의 영화를 감상하듯 추억에 젖게 하는 아늑함과 아련함이 그려진다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
실전에서 바로 쓰는 시계열 데이터 처리와 분석 in R - 교육, 고용, 코로나 데이터를 활용한 시계열 프로젝트, 2022 세종도서 학술부문
이기준 지음 / 제이펍 / 2021년 7월
평점 :
장바구니담기


R과 통계 중심의 시계열 분석 입문서이다. R의 패키지 및 시계열 모델들을 실전에서 활용하기 용이하게 잘 정리되어 있으며 각 특징들을 한 눈에 비교하기 좋다는 장점이 있다.

각 장마다 다루는 책의 내용을 간략히 요약해보겠다.

1장은 시계열 데이터가 무엇인지 소개한다. 시계열 데이터에는 동일한 간격으로 측정된 시간이 독립변수 존재한다. 시계열 분석은 이러한 데이터를 시계열 패턴과 백색잡음으로 탈곡하는 과정으로 비유한다.

과거가 현재에 영향을 주는 자기상관, 장기적으로 점차 증감하는 경향성, 고정된 기간에 주기적으로 반복하는 계절성, 변동적 기간에 주기적으로 반복하는 순환성, 확률분포나 신뢰구간 등 확률의 성질을 갖는 불확실성 등 시계열 데이터가 가지는 특성을 소개한다.

2장은 날짜, 시간을 다루는데 용이한 클래스 등 R에서 제공하는 도구를 살펴본다. date, POSIXct, POSIXlt, yearmon, yearqt 등의 클래스부터 ts, xts, tsibble 등 데이터프레임과 유사한 기능의 시계열에 특화된 데이터 객체를 소개한다.

그 외 xls, csv 등 외부 파일을 읽어들이고 변환하는 방법도 간단히 살펴본다. R이 제공하는 기능들을 체계적으로 정리하여 한 번에 장단점들을 비교해 볼 수 있다는 점이 책의 장점인데 이런 기조는 책이 끝날때까지 지속된다.

3장은 시계열 데이터를 시각화하는 방법을 다룬다. 개인적으로 시계열 분석은 다른 분석에 비해 시각화에 더욱 의존하게 되는 경향이 있다. 시계열에 숨은 패턴을 찾는데 시각자료를 활용한 직관보다 빠르고 쉬운 방법이 없기 때문이다.

data.frame은 ggplot2 혹은 timetk, xts은 자체 패키지, ts는 forecast, tsibble은 feasts 등 데이터가 담긴 객체에 따라 어떤 시각화 패키지를 활용해야 하는지 2장에서 언급한 바와 같이 일목요연하게 정리되어 있다. 덕분에 프로젝트 성격에 따라 유리한 객체와 문법을 골라쓰기 좋다.

4장에는 데이터를 가공하고 처리하는 다양한 유형을 다룬다. 개인적으로 가장 도움이 되었던 장이기도 하다. 시계열 데이터를 가공하다보면 주간, 월간, 분기, 연간 등 특정 기간별로 그루핑, 증감량, 백분율, 비중, 누적합을 구하는 것은 기본이다.

조금 더 나아가면 롤링 윈도우를 활용하거나 동기별 비교, 연산이 필요하기도 하다. 주말이라는 특성도 존재하기에 반올림이나 시간 연산도 필요한데 코로나 확진자 수 등의 데이터를 활용하여 가공해보고 시각해본다.

5장은 시계열 분석에 필요한 핵심 개념들을 코드로 통해 느끼고 데이터를 통해 만지고 그려보도록 구성되어 있다.

ACF, PACF 등 통계 분야에서 전통적으로 자주 활용하는 자기상관, 부분 자기상관 관계를 분석하는 기법에서부터 lag 함수를 이용하여 지연, 차분을 처리하는 방법을 다룬다.

분석에서 가장 자주 활용하는 시계열 분해도 다룬다. 개인적으로는 정상성 테스트나 계절설 검정같은 시계열 분야의 검정에 약했는데 덕분에 자신감을 얻을 수 있었다.

6장에는 현존하는 거의 모든 시계열 모델을 총체적으로 정리한다. 통계학 전공자가 아니다보니 딥러닝의 RNN, LSTM, GRU 등으로 시계열을 먼저 접했고 때문에 통계 관련 모델이 등장하면 해메기 일수 였는데 이 참에 궁금증을 많이 해소할 수 있었다.

특히 컴퓨터 공학에 디자인 패턴이 파생되는 것처럼 모델 간 특징이 결합되어 새로운 시계열 모델이 등장한 배경을 알고나니 생소한 모델도 쉽게 이해가 된다.

예를 들면 계절성 단순 모델은 단순 모델에 계절성을 추가한 모델이며, 홀트 윈터 모델의 경우 단순 지수 평활 모델을 확장하여 추세와 계절성을 추가한 모델이다.

ETS, ARIMA 정도만 다뤄본 나로써는 시계열에 이렇게 많은 모델이 존재하는지 몰랐는데 이번 기회에 쉽게 잘 정리할 수 있었다. 또 그동안 다뤄보지 못한 페이스북에서 만든 prophet 모델이나 TBATS과 같은 모델도 활용하도록 구성되어 있어 만족스러웠다.

7장은 시계열 분석 프레임워크를 다룬다. 개인적으로 가장 마음에 든 장이며 실전에서 많은 도움이 될 것 같다는 생각이 들었다.

fable 프레임워크를 활용하면 아래 그림에서와 같이 다양한 모델들이 예측한 결과를 한 눈에 확인해 볼 수 있다. 모델별 예측 결과를 시각화 비교해 볼 수 있음은 물론 수치를 통한 성능 지표도 확인할 수 있다. fable은 tidy 기반이기에 다중 시계열을 동시에 여러 모델에 적용해볼 수 있으며 앙상블 기법도 가능하다.fable

이와 유사한 modeltime 프레임워크도 소개한다. 머신러닝 진영에서 주로 활용하는 워크플로를 활용할 수 있다는 장점이 있다.workflow

마찬가지로 모델별 예측 결과를 비교해 볼 수 있다.modeltime


이처럼 시계열 분석을 위해 주로 활용하는 R의 패키지, 객체, 모델 등이 활용하기 좋게 잘 정리되어 있다는 점이 책의 가장 큰 장점이다.

또, 코드와 시각화를 통해 직접 데이터와 모델을 만져볼 수 있어 실전 중심으로 쉽게 개념을 익힐 수 있다는 점도 장점이다.

반면 아쉬운 점도 두가지 있다. 하나는 직접 만든 데이터 혹은 잘 정리된 예제 데이터로 모델과 전처리를 수행했다는 점이다. 현업에 살아있는 거친 데이터로 시작했다면 보다 실전에 많은 도움이 되었을 것이다.

다른 하나는 실전 프로젝트 분석 과정이 하나 정도 담겨 있었다면 더 좋았겠다는 생각이 들었다. 부분 부분 체계적으로 잘 정리되어 있는 장점이 유기적으로 연결되지 않는 느낌이 들어 아쉬웠다.

하지만 책의 분량이나 타깃 독자층을 생각했을 때 두마리 토끼를 모두 잡는 일이 쉽지 않음을 알기에 전체적으로 이 책은 입문서라는 목적에 충실하게 잘 만들어진 책이라는 생각이 든다.

시계열이 너무 어려워 기초를 다지고 싶은 입문자라면 이 책을 처음으로 접해보는 것도 좋은 선택이 될 것 같다.




댓글(0) 먼댓글(0) 좋아요(1)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
머신러닝을 활용한 웹 최적화 - A/B 테스트, 메타휴리스틱, 슬롯머신 알고리즘에서 베이즈 최적화까지
이쓰카 슈헤이 지음, 김연수 옮김 / 한빛미디어 / 2021년 6월
평점 :
장바구니담기


A/B 테스트를 중심으로 통계 및 머신러닝을 활용하여 웹사이트 최적화 기법을 다루는 책이다. 연구 성과를 일목요연하게 잘 정리하고 있고, 실전에 적용하는데 필요한 고민과 해법이 같이 담겨 있다.

읽다보면 매우 간단한 예제 2개만으로 통계가 실전에서 어떻게 활용되는지 생생하게 접할 수 있다. 통계, 베이즈 추론 등에 숨겨진 개념을 실용적으로 끌어내는 방법을 비롯해 해당 분야의 연구 성과가 잘 정리되어 있어 실전에 적용할 만한 연결고리를 찾을 수 있다는 점도 장점이다.

책은 크게 2개의 예제를 중심으로 살이 붙어나가는 방식이기에 이를 중심으로 책의 내용과 배운점 및 장점을 요약해 본다.


  • 예제1 : 앨리스와 밥의 A/B 테스트
    아래 그림은 앨리스와 밥이 상품 소개 페이지의 자료 요청 버튼의 클릭율을 높이기 위하여, 두 가지 디자인 A, B안을 준비한 후 노출 횟수 및 클릭 횟수를 측정한 결과이다. 클릭률이 우연히 동일하게 나왔지만 각 횟수가 다르기에 B안을 선택해야 한다고 결론을 내릴 수 있을까?예제1

    저자는 이 예제를 활용하여 웹사이트 최적화에 필요한 기본 지식을 정리한다. 확률 변수, 베르누이 시행, 확률 분포, 확률 분포의 파라미터, 정규화, 확률의 덧셈정리를 활용한 주변화(marginalization), 베이즈 업데이트를 활용한 사후 분포 시각화 등이 그것이다.사후분포

    그 중 사후 분포를 정량적으로 평가하기 위한 방법 2가지가 소개되는데 이 부분부터 웹사이트 최적화에 유용한 기법들이 본격적으로 소개되기 시작한다. 하나는 시행 반복을 통한 통계 모델링을 활용하여 분포를 추정하는 방법이고, 다른 하나는 사후 분포에 나타난 베타 분포를 활용한 방식인데 후자가 중요한 방식이다.

    먼저 후자 방식의 기초 통계량을 활용하는 방법이 소개되고 그 중 클릭율 사후 분포의 HDI - 확률 변수의 값이 높은 확률로 나타나는 구간 - 를 구하여 확률 질량이 큰 순서대로 상윗값을 반환하는 hmv 메서드를 만들어 “디자인 B안의 클릭율은 5%보다 높다.”와 같은 가설을 만든다. 그 과정을 도식화하면 아래 그림과 같다.HDI 가설

    이어서 A안의 클릭율과 B안의 클릭율의 차이인 파생 변수를 생성해보는 등 추가 시도를 거치는데 큰 확률이라는 값이 95%면 충분할 지, ROPE 폭과 같이 검증하고자 하는 가설을 정량적 평가로 변환하는 과정 등 실무에서 공유되어야 할 도메인 측면에 대한 고민도 담겨 있어 유용했다.

    여기까지가 통계와 웹최적화의 기본이었다면 2장 부터는 MCMC(마르코프 연쇄 몬테카를로 알고리즘)을 활용한다. 초기값은 최적의 파라미터 주위에 근접하도록 상태를 전이시키지만 이런 부분이 영향을 미치지 않도록 어느 정도 탐색이 진행된 뒤의 샘플을 얻는다. PyMC3 모듈을 활용하여 MCMC를 시각화하여 볼 수 있어 이해에 도움이 된다.

    특히 개인적으로는 가능도 함수의 분포인 베르누리 분포, 카테고리컬 분포, 이항 분포, 다항 분포와 신념(믿음)의 분포인 베타 분포, 디리클레 분포의 총체적인 관계를 정리해 볼 수 있어 만족스러웠다. 그동안 통계학에서 다루는 분포 대부분의 개념은 잘 숙지하고 있었지만 분포 간의 변화와 관계가 늘 궁금했는데 앨리스와 밥의 문제로 변수를 최소화 한 접근법 덕분에 비교적 명쾌하게 이해할 수 있었다.

    여기서 끝났어도 충분히 만족스러웠는데 하나 더 저자에게 고마움을 느낀 부분이 있다. 2장의 마무리 단계에서 NHST(귀무가설 유의성 검증)과 베이즈 추론 간 통계적 가설 검증을 비교해본다. 통계학 비전공자라 볼 때 마다 헷갈린 부분인데 이 책을 통해 감을 잡을 수 있었다.두가지통계가설검증

    두 검증의 차이는 일단 기본적으로 자유도에 차이가 있다. NHST는 잘 알려진 분포만 활용한다는 한계가 있지만 검정 통계량을 신뢰할만하다. 반면 베이즈 접근 방식의 경우 앞서 예제와 같이 HDI를 비교 평가 할 수 있어 유연한 가설 검증이 가능했다. 하지만 적절한 사전 분포를 설계해야 한다는 제약 조건이 따르며 적응 데이터 분석 및 과적합 문제를 안고 있다는 사실로 정리해 볼 수 있었다.

    사실 딥러닝을 먼저 시작한 나로써는 데이터가 많은 요즘 같은 시대에 검정, 추정을 실전에서 어떻게 활용하는지 늘 궁금했었고, 나아가 베이즈 추론과 사후 분포의 위력을 체감하기 어려웠는데 앨리스와 밥의 A/B 테스트와 같이 심플한 예제 덕분에 통계에 숨은 개념을 현실로 끌어내는데 큰 도움이 되었다. 이어질 두 번째 예제는 보다 어렵지만 나 같은 통계 하수는 1 ~ 2장만으로도 충분히 만족스러운 책이라고 평하고 싶다.


  • 예제2 : 조합형 4가지 디지안 시안 테스트
    제목은 어려워 보여도 이 역시 너무 간단한 예제이다. 아래 그림과 같이 시안 A,B,C,D 중 어떤 시안이 가장 뛰어날지 판단하는 문제이다. 위 예제1과 다른 점이 있다면 A,B는 그림이 같고, C,D는 버튼 문구가 다르다. 즉, 그림과 문구 간 조합이라는 요소가 존재하는 예제이다. 예제1은 개념을 익히기에는 좋은 예제이지만 실전에서 바로 활용하기는 어렵기에 예제2릍 통해 실전에 한 걸음 다가갈 수 있는 셈이다.예제2

    이 예제에서는 무엇보다 통계 모델링을 구체적으로 진행하는 방법이 소개되어 있어 유익했다. 예제1에서 배웠던 분포를 활용하여 이미지 변경에 따른 클릭율, 버튼 변경에 따른 클릭율, 베이스라인 클릭율 등 새로운 파생 변수를 도입한 후 로짓 함수 및 정규 분포를 활용하여 아래와 같이 최종 클릭율을 예측하는 모델을 만든다.통계모델링

    이어서 요소의 조합에 의해 발생하는 교호 작용을 파악하고 모델에 교호 작용항을 추가한다. 이는 통계 기본에 해당하는 다중 공선성의 문제인데 교호작용을 어디까지 고려해야 할 지 생각해 볼 수 있는 좋은 기회였다. 4장에서는 해결책 중의 하나로 메타휴리스틱을 접목해본다.메타휴리스틱

    오른쪽 그림과 같이 접근하면 교호작용을 고려하거나 최적 변수 선택의 고만이 필요없다. A*알고리즘과 같이 목적지와 현 위치 사이의 추정거리를 휴리스틱으로 도입하는 셈이다. 이를 책에서는 언덕 오르기 알고리즘(Hill Climbing)이라고 정리하고 있다.

    생긴 것이 딥러닝의 손실함수 경사하강법 문제와 비슷해 보인다 싶었는데 역시나 여기에서도 국소 최적문제가 등장했다. 이를 해결하고자 마치 SGD처럼 확률적 언덕 오르기 알고리즘, 온도 파라미터를 도입한 시뮬레이티드 어닐링, 교차율을 도입한 유전 알고리즘 등이 소개되는데 하나 하나 괜찮은 아이디어였다. 딥러닝이 통계와 얼마나 밀접한지 실감할 수 있었다.

    5장에서는 보다 실전에서 고민할 만한 사항이 등장한다. 테스트 중에 발생하는 손실, 기간 등에 대한 문제도 다룬다. 즉, 강화학습에서 흔히 볼 수 있는 다중 슬롯머신 탐색과 활용 딜레마가 웹페이지 최적화에도 등장하는 문제임을 알 수 있다. 이를 해결하기 위한 방법으로 Epsilon-Greedy, 시뮬레이티드 어닐링 Epsilon-Greedy, Softmax, 톰슨 샘플링, UCB 등의 아이디어가 소개된다.

    5장이 다소 연구적인 느낌의 정리였다면 6장은 5장에서 배운 연구 성과를 실전에 접목해보는 형태를 띈다. 즉, 눈 앞의 슬롯머신이 변하듯 개인화 구현의 문제로 넘어간다. MCMC를 베이즈 선형회귀에 접목하는 방법에서 연구 성과를 실전에 적용하는 방법론을 배울 수 있었다. 5장에서 배운 UCB를 응용해서 LinUCB를 구현해내는 과정은 머리속에 떠오른 아이디어를 어떻게 기존 연구에 연결할 수 있는지 그 경계선을 느끼게 해줬다.


그 외에도 7장에서 배운 가우스 과정을 톰슨 샘플링에 적용한 GP-TS 알고리즘은 UCB에 아이디어를 살을 붙여 가는 방법을 알게 해줬다. 덕분에 읽으며 개인적으로 괜찮은 아이디어가 떠올랐는데 이를 접목해보고 논문을 써봐야겠다는 생각이 들었다. 이처럼 생소한 분야에 연구적 커넥팅을 가능하게 해준 다는 점은 이 책의 큰 장점 중 하나이다.

8장에는 웹 최적화 분야에 앞으로 필요한 기술들이 소개되는데 오토인코더가 등장해서 신선했다. 다양한 AI 분야가 존재하지만 상호 영역을 잘 알아두고 조합한다면 어떤 분야에서든 멋진 아이디어가 파생될 수 있겠다는 생각이 들었다.

적어도 내 수준에서는 이 책에서 너무도 많은 것을 배울 수 있었다. 위에서 언급했듯 통계가 실전에 어떻게 적용되는지 너무 심플한 예제로 통계학에 숨어있는 지식을 생생하게 느낄 수 있게 해준 점, 저자 특유의 웹 최적화 분야 연구 성과 전달력 덕분에 아이디어를 연구 혹은 실전에 적용하는 연결고리를 얻게 해준 점 등 큰 도움을 받았다.

리뷰를 통해 저자, 역자, 편집자 분들께 진심으로 감사의 말씀을 전하고 싶다. 웹최적화 뿐만 아니라 통계나 머신러닝에 관심있는 독자에게 꼭 추천하고 싶은 책이다.


한빛미디어 “나는 리뷰어다” 활동을 위해서 책을 제공받아 작성된 서평입니다.



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
저는 인문학이 처음인데요 - 교양인이 되기 위한 내 생애 첫 인문학 처음인데요 시리즈 (경제)
박홍순 지음 / 한빛비즈 / 2021년 3월
평점 :
장바구니담기


인문학이 무엇인지, 왜 피하게 되는지, 그럼에도 왜 필요한지 등의 질문을 살펴보며 보통 사람 수준의 눈높이에서 인문학을 소개하는 책으로 상상력, 나 자신의 내면, 행복, 관계, 일이라는 주제를 중심으로 현실의 우리 문제를 깊이 있게 들여다 보는 책이다.

지극히 추천하고 싶은 이 책에 유일한 단점이 있다면 제목일 것이다. 인문학이 처음이라는 설명은 자칫 인문학을 자주 접한 사람이 비하고 싶게 생긴 제목이다. 인문학을 매우 쉽게 설명하고 있으나 수준은 높지 않아 얻을 것은 많지 않다는 뉘앙스가 걸린다.

나름대로 정정하자면 이 책은 인문학의 거의 모든 것을 다룬다. 깊이가 얕지도 않다. 주제가 협소하지도 않다. 인문학의 대가는 아니지만 평소 즐겨 읽는 나로써는 책이 다루는 방대한 스케일에서 심오하고 깊이 있는 해석에 적잖이 놀랐다.

내게 새로이 제목을 지을 권한이 주어진다면 다음과 같은 제목들 중 하나로 표현했을 것이다.

  • 우리 모두의 문제를 해결하는 방법
  • 하룻밤에 저절로 읽게되는 인문학
  • 인문학 좀 읽어본 사람이 깊이있고 폭넓게 정리할 수 있는 인문학

다시 원점으로 돌아가서 인문학은 말 그대로 인간과 인간이 남긴 문화에 대해 연구하는 학문이라 할 수 있다. 본 도서에서는 인문학이 다양한 측면에서 매우 유용한 학문임을 여러 사례로 강조하고 있지만 결국 인간의 행복으로 귀결된다고 할 수 있다.

행복하기 위해선 우리 자신을 잘 알아야 함에도 우리 자신이 스스로에 대해 너무도 모르기 때문에 인문학이 중요하다고 할 수 있겠는데 인류 역사를 통떨어 이 문제를 대표하는 가장 큰 질문이 소크라테스의 “너 자신을 알라!“라는 철학 명제일 것이다.소크라테스

이 명제는 학교 다닐 때 수도 없이 들었는데 저자가 언급한 바와 같이 처음 들었을 때 쌩뚱맞기 그지 없는 말이라는 것은 모두가 공감했을 것이다. 나 역시 처음 듣고는 이게 무슨 인류 최대의 명제인가 라는 생각부터 우둔해 보이기 까지 하는 필요성이 전혀 느껴지지 않는 허황된 질문이라는 생각을 했다.

나이가 들며 삶에 애환이 생기고 고민이 늘어나며 깊이 있는 생각을 하게 되고 그 안에 답을 찾고자 발버둥 치다보니 인문학도 접하게 되고 그러다보니 인간을 잘 아는 것이 중요하다는 것을 알고 나서야 소크라테스의 이 명제가 비로소 대단하게 보이기 시작했다.

소크라테스의 명제가 어떤 의미를 지니고 있는지 이 책에서는 일반인들의 눈높이에서 출발하여 단계별로 해석하며 추론해가며 그 수준을 높여준다. 저자의 결론이 다다르면 우리는 그동안 우리가 보지 못했던 진리의 깊이를 마주하게 되는데 이런 구성 방식이 책의 최고 백미라 칭할만 하다.

예를 들어 책에 소개된 아래 그림은 라파엘로의 아테네 학당이라는 명화로 플라톤과 아리스토텔레스가 중심에 있다. 소크라테스를 계승한 이 둘의 손 위치는 많은 의미를 함축하고 있다. 왼쪽 플라톤의 손가락은 형이상학적 이데아를 칭한다.아테네학당

이데아란 실제로 존재하지만 시공간에 존재하지 않는 진리와 유사한 개념이다. 마치 2+2=4라는 것도 이데아 중 일부이다.

플라톤은 이데아가 마치 닿을 수 없는 곳에 있다는 듯 하늘 위를 가리킨다. 손가락으로 “그 자체”라는 말을 붙여 이데아를 만든다. 책상에다 “책상 그 자체”라고 하면 책상의 이데아가 되는 것이다.

반면 오른쪽의 아리스토텔레스는 손바닥을 땅 방향으로 향한다. 분노, 용기 등의 감각은 신체없이는 존재할 수 없으며 영혼도 마찬가지이기에 자연과 현실을 중요하게 여기는 것이다.

명화 하나만으로도 당시 그리스 시대에 숨은 철학의 진리를 엿볼 수 있게 된 것은 모두 저자 덕분이다. 고대의 명화나 철학서에 어떤 어려운 문구가 인용되더라도 두려워 할 필요가 없다.

처음 읽을 때는 이해되지 않겠지만 저자의 해석을 따라가다보면 결국 알게 될 것이다. 어려운 문장을 곱씹어 내재화 할 수 있는 독해력을 얻을 수 있다는 것은 옵션이다.

IT를 전공한 나로써는 저 이데아에서 객체지향프로그래밍이 파생된 것을 알기에 곱씹을 수록 놀라웠다. 인문학 속에 숨은 옛 현인들의 고민이 오늘날의 현실에서 패러다임을 뒤 흔들고 공학과 기술에 큰 영감을 불어넣는다는 것을 다른 이들도 직접 보고 듣고 느낀다면 인문학이 얼마나 중요한지 알게 될 것이다. 스티브잡스의 인문학이 애플 아이폰을 만든다는 뻔한 말이 아니라 스스로 직접 구현해보며 손으로 눈으로 느낄 수 있다면 좋겠다.

어쨌든 저자 덕분에 물고기와의 이심전심으로 장자의 철학을 들여다 볼 수 있는가 하면 예로부터 유명한 명화에 담겨있는 작가의 사상과 시대적 배경을 엿볼 수도 있고 심지어는 이 시대 가장 많은 이들이 즐겨보는 영화 속에 숨어있는 철학도 엿볼 수 있다.

이러한 해석은 우리가 필요로 하는 현실의 문제에 맞닿아 있다. 우리가 잠들기 전에 이불킥하거나 살아가는데 너무 힘들어 누군가를 잡고 지혜를 얻고 싶은 그런 문제에서 벗어나지 않는다. 이 책이 우리에게 주는 뛰어난 가치다.

일상에서 우리가 마주하는 스케일이 큰 질문중에 AI 시대에 인간이 나아가야 할 방향에 대한 문제가 있다. 나는 인문학에서 많은 힌트를 얻었다. AI는 사람의 행동에 의해 수집된 데이터에 의존하는 경향이 강하기에 사람만이 해낼 수 있는 길에 주목했다.

가보지 않은 길, 새로운 프레임, 생각지도 못한 길이 인간이 가야할 방향이다. 인간의 데이터에 의존하는 AI는 가보지 않은 길을 아직까지는 갈 수 없다.

물론 이 또한 약 인공지능이 주류를 이루는 오늘날의 해법일 것이고 사람과 거의 유사한 강 인공지능이 출현하면 무용지물이 될 수 있는 전략일지도 모르겠다. 강 인공지능으로 나아가는 핵심에 오늘날 강화학습이라는 기술이 숨어 있다. 강화학습은 인간이라면 선입견 때문에 내놓지 못하는 해결책을 내어준다.

프로기사들이 주저했던 알파고의 수 - 예를 들면, 3*3 착점 -, 새로운 단백질 분자구조, 새로운 암호 조합 기술 등이 강화학습 덕분에 출현하고 있다. 앞으로 모든 분야의 사람들은 강화학습을 보조도구 삼아 창의성을 높히고 생존 전략을 찾아나가야 할 것이다.

한 발 더 나아가 강화학습 또한 한계가 있음에 주목할 필요도 있다. 아직까지는 유한 확정 완전 정보 세계에서만 강점을 드러내고 있기 때문이다.

즉, 바둑과 같은 게임 세계에는 완전한 규칙이 있고 이로 인해 보상과 벌칙으로 AI를 학습시키는데 인간 세상같이 무엇이 득인지 실인지 판단하기 어려운 세계에는 한계점도 존재한다.

이런 AI의 맹점을 보완할 수 있는 것이 인간이다. 그리고 그 원천은 다양성에 있으며 예로부터 뛰어난 질문과 고민으로 축적된 인문학에 있다 생각한다.

책에서도 소개되었듯 때로는 광기의 역사에 억압받는 광기 속에서 그 답을 찾을 수 있을 것이고 러셀의 생각처럼 주 4시간의 노동으로 확보된 시간의 자유에서 찾을 수도 있을 것이다.노동시간

때로는 죽음을 남의 것이 아닌 자신의 문제로 받아들이고 버킷리스트를 만들며 삶의 의미와 행복에 대해 고민하며 얻게 될 수 있고, 죽음을 표현한 아래 명화에서 영감을 얻을 수도 있을 것이다.죽음과삶

책이 다루는 인문학의 범위가 상당하고 약 500p에 육박할 정도로 많은 양을 다루고 있기에 이를 압축해서 내가 최근에 고민했던 AI 시대의 생존 전략이라는 화두에 한정하여 책에서 배운 것들을 접목하며 리뷰를 줄여나갔다.

하지만 책에는 그 외에도 나 자신의 내면을 들여다보거나, 알 수 없는 불안과 심리학에 대해 생각해 볼 기회도 주어진다. 더불어 사람과의 관계, 돈과 노동의 의미, 행복해 지기 위한 길 등 너무도 많은 우리의 문제를 인문학이라는 안경으로 살펴본다.

독자의 고민 중 최소 1개는 이 그물망에 걸릴 것이라 장담한다. 굳이 책장에 고이 모시지 말고 당장의 문제를 해결하고 생각의 프레임을 전환하는데 이 책을 통해 도움받을 것을 강력히 추천하는 바이다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
대한민국 아파트 부의 지도 - 똑똑한 월급쟁이들의 돈 버는 부동산 투자 전략
이상우 지음 / 한빛비즈 / 2018년 6월
평점 :
절판


고소득직장, 교통, 교육, 자연환경, 도시계획 등 아파트 입지와 관련된 5가지의 가장 중요한 요인 분석을 통해 독자의 수준에 따라 어느 곳에 아파트를 사야할지 알려주는 부동산 투자서이다.

리뷰에 앞서 먼저 일러두고 싶은 것이 있다. 초판 1쇄가 2018년 6월에 발행되어 현 시점의 부동산 정보가 반영되지 않았을까 걱정되기도 하지만 그럼에도 불구하고 현 시점 초판 9쇄까지 발행된 것을 보면 여전히 인기가 좋은 책임을 알 수 있다.

물론 현 시점 3년 전의 정보가 담긴 책을 읽는 것은 일부 현 시점의 정책, 시세와 일치하지 않는 다는 단점이 있긴 하다.

하지만 다행히 본 도서는 세월이 흘러도 큰 변화가 없는 입지에 관한 내용을 주로 다루고 있어 현 시점에도 충분히 가치 있는 책임을 언급하고 싶다.

먼저 입지를 결정하는 5가지 주요 요인에 대한 분석에 앞서 PIR 추이를 통해 소득 대비 어느 정도 금액 수준의 아파트를 사는 것이 좋을지 분석해본다.

PIR = 소득 대비 주택 가격 비율 = 주택가격 / 가구연소득 ex) 연소득 1천만원인 가구가 1억원 주택을 구매 시 PIR은 10

PIR

그림에서 보다시피 서울의 PIR은 8, 수도권은 6 정도 됨을 알 수 있다. (참고로 현 시점은 11 정도 되는 것으로 나타났다.) 일반 대중의 눈높이와 비슷한 수준으로 구매한다면 스스로의 소득을 감안하여 PIR이 8 정도 되는 수준의 매매가를 가진 아파트를 기준치로 잡는 것도 좋은 방법이라고 소개하고 있다.

금액대가 결정된다면 필요 금액을 산정해볼 필요가 있다. 아래 그림은 소득별 적정 가격의 주택을 나열한 도표로 주담대 등을 제외한 필요 금액을 알려준다.필요금액

책은 이렇듯 불확실성을 최소화하여 독자의 상황에 맞게 구체적으로 내집마련 시나리오를 그리게 유도함으로써 내집 마련의 실현가능성을 한발짝 높혀주는 것이 특징이다.

이제 남은 것은 과연 어디에 집을 사야 하는지에 대한 문제이다. 저자는 입지에 있어 가장 중요한 요소를 고소득 직장, 교통, 교육, 자연환경, 도시계획 등 5가지로 압축한다.

이 중 독자가 스스로 처한 상황과 조건에 따라 최우선 순위에 해당하는 2가지 정도를 선택 후 그에 맞는 주택을 고른다면 큰 문제가 없을 것임을 전략으로 내세우고 있다.


  • 고소득 직장
    고소득 직장
    고소득 직장은 아파트 값을 올리는 가장 중요한 요인 중 하나로 대표적으로 삼성이 수원, 동탄 등지로 이전하면서 광교신도시의 가격이 급부상한 것을 예로 들 수 있다. 아파트 주변에 고소득의 좋은 직장이 위치한다면 수요가 올라가는 것은 물론 소득 상 여력이 보태져 중요한 상승 동력이 된다.

    책에서는 고소득 직장이 위치한 4대문 지구(CBD), 여의도·마포 지구(YBD), 강남 지구(GBD) 등을 중심으로 자세히 분석하고 있으며, 저자의 분석 기법을 따라가다보면 미래에 대한 어느정도의 안목도 갖출 수 있게 된다.

  • 교통
    GTX정시성을 중시하는 지하철, 광역철도 그 중에서도 핵심으로 떠오르는 GTX를 중심으로 분석하고 있다. 그 외 신림선(여의도~서울대), 동북선(왕십리~상계), 위례신사선(위례 신도시~신사), 신안산선(안산·시흥~구로~여의도), 월곶판교선(월곶~안양~판교), 위례과천선(위례 신도시~과천) 등의 신규노선과 관련된 주변 입지와 예상 효과도 분석한다.

  • 교육
    대치동학원가인생에는 5번 정도 집을 바꿀 기회가 찾아온다고 한다. 총각, 처녀시절에는 관심도 없었는데 실제 결혼하고 아이 낳고 살아보니 직장 접근성보다도 교육관련 입지가 중요해졌다. 나는 고생해도 괜찮지만 자식이 고생하는 것은 가슴 아픈 것이 여느 부모나 마찬가지일 것이기 때문이다. 따라서 교육 환경이 우수한 곳은 자녀를 둔 부모들의 수요가 끊이지 않을 것이기에 역시 상승 동력이 될 수 있다. 책에서는 사교육 중심지 강남을 시작으로 목동, 중계동 등의 교육 중심지 입지를 분석한다.

  • 자연환경
    자연환경자연환경 역시 개인의 선호도 혹은 나이가 들며 자연을 선호하는 현상 등으로 수요가 느는 요건이다. 저자는 한강 뷰를 대표로 하는 물의 입지는 도움이 되는 편이며, 반대로 산의 경우는 부동산 가격과 큰 상관 관계가 없다고 정리한다. 반면 경희궁 자이 아파트 처럼 입지가 뛰어난 곳은 분양가가 아무리 높을지라도 반드시 가치를 증명하며 개인적으로 산을 좋아한다면 산지 디스카운트 효과를 노려보라는 조언을 해주는 등 여러 측면에서 자연환경에 따른 입지를 분석한다.

  • 도시계획
    도시계획뉴타운, 재건축, 역세권 개발 사업 등을 중심으로 정책으로 인해 입지에 변화가 생기는 곳을 자세히 살펴본다. 개발 사업들이 대략 어떤 프로세스로 이뤄지는지 살펴 볼 수 있어 많은 도움이 되었다.


이렇듯 본 도서는 오래 가치를 유지할 수 있는 입지의 핵심 요소를 중심으로 부동산을 바라보는 안목을 키워준다는 점이 장점이라 할 수 있다. 그 외 불확실성을 제거하여 독자로 하여금 구체적인 내집마련 혹은 투자에 대한 실행력을 높여준다는 점에서도 가치가 있다.

부동산 투자는 긴 호흡이 중요하고 평생 반드시 맞닥드릴 수 밖에 없는 삶의 주요 과제이기에 추천을 권하는 바이다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo