하룻밤에 읽는 한국 근현대사 - 개정 증보판 페이퍼로드 하룻밤에 읽는 한국사
최용범.이우형 지음 / 페이퍼로드 / 2019년 10월
평점 :
장바구니담기


얼마 전 넷플릭스에서 “남산의 부장들”이라는 영화를 보았다. 최근 100년 간 대중이 가장 궁금해할만한 소재를 중심으로 급박하게 펼쳐지는 긴장감과 고증을 검증하는 재미가 쏠쏠했다. 비록 제 5공화국같이 실명을 거론하지 않아 실감이 부족했고, 영화 특유의 바랜 느낌이 팩트보다는 추억으로 나를 인도한 것이 약간 아쉬웠다.

문득 제 5공화국이나 유신 시절이나 민주주의를 빼앗겼던 우리에겐 기쁘지 않은 역사임에도 불구하고 당시의 시대상이 재미있는 이유는 무엇일까 생각했다. 그 시간속에 치열했던 사람과 사람 간의 욕심, 속내, 모략, 생각, 의중이 생생이 내비치기 때문이 아닐까? 그리고 지금 우리가 살고 있는 현 시점 이 장소에서도 주위에서 알아주지 않을 뿐 그런 전쟁이 펼쳐지고 있는 것은 아닐까? 그냥 재미를 넘어서 당시 등장인물들의 행동은 지금의 나를 투영하여 막막한 현실에 뭔가 해답을 주진 않을런지..정부

이 책은 근현대사를 다루는 책이다. 저자도 서문에서 밝힌 바와 같이 근현대사는 우리 민족에게 정말 암울했던 시기이다. 나는 어릴적부터 역사를 좋아하였고 20여 년전 고교시절에도 선택과목을 한국사나 세계사로 선택할 만큼 역사를 좋아했고 이 두 과목만큼은 만점을 놓친적이 거의 없다. 다만 역사와 관련된 불만이 딱 하나 있었는데 이 근현대사의 비중이 지나치게 높다는 점이었다. 너무 암울해서 읽기 싫어 죽겠는데 시험 문제 중 50점은 이 시기에서 출제되니 울며 겨자먹기로 어거지로 읽었다.

그땐 그저 역사를 재미로만 느꼈지만 이 책을 덮고나서 역사 그리고 근현대사에 대해 다시 생각하게 되었다. 저자가 서문에서 밝힌 책을 집필했던 자세를 흔쾌히 공개해준 덕분에, 그런 기조가 책 한 권에 속속들이 녹아있었기에 그간 경시했던 역사의 진면목에 대해 다시금 생각할 기회를 주었다.

역사를 통해 배울 것은 너무도 많겠지만 이 시점 이 책을 통해 내가 느낀 역사의 소중한 가치는 두가지로 정리할 수 있겠다.

하나는 “빛과 어둠“이다. 빛이 있으면 반드시 어둠이 있다. 세상 순리가 그러하다. 역사에서는 이를 누누히 알려주고 있건만 사람들은 보고 싶은 것만 보고 듣고 싶은 것만 듣는다. 우리가 아는 역사는 그저 한손으로 해를 가리는 식의 한 줌도 채 되지 않는다는 것을 알고 빛을 보면 어둠을 찾고, 어둠을 보면 빛을 찾아야 할 필요가 있다. 이른바 비평의 시작으로 매사 비판적인 태도는 우리와 주위를 보다 올바른 길로 이끌어 준다.

특히 요즘 세태를 보면 가관이다. 그 중에서도 남녀간의 혐오, 좌파와 우파 진영의 대립 두가지가 가장 추악스럽다. 범죄자냐 아니냐를 나누기 이전에 남자와 여자를 나눈다. 그러면 남자와 여자부터 나누고 다시 범죄남, 무죄남, 범죄녀, 무죄녀로 나눌 것인가? 처음부터 범죄, 무죄로 나누면 아무 말썽 없을 일이다.

좌파 우파는 한 술 더 뜬다. 좌파를 추종하면 빨갱이라고 하고 우파를 추종하면 토착왜구라 한다. 굳이 나누라면 지금의 난 좌파 성향에 한 발 가까이 있다. 그런데 논리도 없는 좌파들에게 묻고 싶다. 토착 왜구로 싸잡힌 김영삼 대통령의 “일본 놈들의 버르장머리를 고쳐놓겠다.” 발언과 조선총독부 철거라는 모순은 어떻게 설명할 것인가?

본 도서에서는 우리가 이분법적으로만 생각했던 역사의 단면을 빛과 그림자로 갈라놓곤 한다. 예를 들어 223p엔 3.1 운동 추진 세력이 이완용의 참여를 요청하는 등 민족의식 측면에 불철저한 모습을 드러냈음을 알리기도 하며, 97p에는 당시로서 드물게 양반과 유생이 평민 의병장 신돌석의 휘하에서 싸웠다는 등 상식으로만 단편적으로 알고 있던 역사를 비판적으로 받아들이는데 도움이 되는 자극을 던진다.

우매한 이분법 이전에 바라보는 관점과 시각에 합당한 빛과 그림자를 찾는 건전한 비판의 자세의 중요성을 늘 역사가 알려주고 있지만 이를 아는 이는 많지 않은 것 같다.

또 하나의 가치는 “사람“에 의해 그려지는 역사에 주목해야 한다는 것이다. 우리가 역사를 통해 배울 수 있는 것 중 상식의 암기는 사는데 거의 쓸모가 없다해도 과언이 아니다. 중요한 것은 그런 결과가 있기까지 주요 인물들이 어떤 동기에 의해 어떤 판단을 했으며 그 이유는 무엇이며 성공과 실패의 갈림길 속에 바깥 요소들은 어떤 작용을 했는지 살펴보고 오늘날 우리의 생각과 행동을 쇄신해야 한다는 점에 있다.

본 도서에도 언급한 바와 같이 3.1 운동은 아시아독립운동의 모델이 되었다. 별도로 연구한 것은 아니지만 오늘날 우리나라가 한류 문화로 문화 강국으로 발돋움한데는 당시 선조들로부터 이어져 온 3.1 운동과 같은 상식을 거부한 창의성과 안목이 전승되었을 가능성이 높다 생각한다. 비록 이것이 사실이 아니라 가정할지라도 3.1 운동을 분석한다면 문화 강국으로 도약하기 위한 열쇠는 찾을 수 있을 것이다.

왕정 체제하에 자유의 맛을 제대로 맛보지 못한 채 오늘날 심리학에서 말하는 학습된 무기력을 능가하는 근대 민중들의 삶이 어땠을지는 누구나 상상한 그대로일 것이다. 그럼에도 껍질을 깨뜨리고 반봉건 반외세의 기치로 동학농민혁명이 발발할 수 있었던 것이나 항일의병전쟁 혹은 만민공동회 활동이 가능했던 것에는 분명 이유가 있다.

이렇듯 세상을 바꾸는 힘은 사람에게 있으며 보다 구체적인 해답은 상식을 파괴했던 행보를 걸었던 위인들에게서 찾을 수 있을 것이다. 그렇기에 근현대사는 암울하기 짝이 없는 감정으로 받아들여야 하는 시대가 아닌 눈을 씻고 반짝이는 안목으로 지혜를 구해야 하는 장이라 생각한다. 다행히도 시간 상 가까워 많은 기록이 보존되어 있고 왜곡의 정도가 다른 시대에 비해 덜하기에 더욱 가치 있다.사람

책의 내용은 1863년 흥선대원군의 집권기를 시작으로 1980년대 김일성 3대 세습체제까지 이어진다. 책에 관심이 있다면 온라인 서점의 소개글에서 제목만 봐도 대강의 역사 흐름을 파악하기에는 무리가 없다. 역사를 다룬 책인만큼 저자의 집필 자세를 살펴볼 필요가 있는데 서문에서 밝힌 바와 같이 균형잡힌 시각으로 객관적으로 저술하고자 노력한 흔적이 종종 눈에 띈다. 특히, 역사는 사람이 만들어간다는 대전제를 고수하며 다양한 시각으로 더 나은 길을 찾고자 집필했다는 점에 박수를 보내고 싶다.

근현대사의 큰 흐름을 빠르게 정리하는데 이만한 책을 찾기 어려울 것이라 생각한다. 또 책 중간중간 등장하는 흑백 사진은 당시의 사건들을 머리속에서 생생하게 상상하는데 많은 도움을 줄 것이다.정취

다만 제한된 분량의 단 한 권의 책에 역사가 빠르게 요약되고 있어 사극이나 영화를 보는 감흥을 느끼기는 어렵고 약간 무미건조한 느낌을 받을 수도 있다. 이는 집필의도에 따른 트레이드 오프로써 단점이라고 생각지는 않는다. 본인의 취향이 이러한 구성과 일치한다면 본 도서는 꽤 재미있게 읽을 수 있을 것이다.

무려 150년에 달하는 굵직하고 파란만장했던 대한민국의 근현대사를 빠르게 훑어보고 그 안에 빛과 어둠을 살피며 비판적인 자세로 역사에 숨겨진 통찰을 얻고 싶다면 본 도서의 일독을 권하는 바이다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
지금 당장 회계공부 시작하라 - 전면개정판 지금 당장 경제 시리즈
강대준.신홍철 지음 / 한빛비즈 / 2021년 6월
평점 :
장바구니담기


회계라는 어려운 개념을 일상에서 흔히 활용하고 접하는 개념으로 끌어내리는 독자의 뻔한 프레임을 바꿔주는 필독서이다.

이 책을 재무제표, 관리회계, 원가회계, 재무상태표, 손익계산서 등을 알려주는 교과서라고 판단했다면 오산이다. 한 발짝 더 나아가 어려운 회계를 최대한 거부감 없이 쉬운 설명과 도식으로 이해시켜 주는 정도로 평한다면 일부는 맞을지 몰라도 전체적인 평으로는 부족하다.

아마 책의 53p에 등장한 표현이 적절할 것 같다.

“독자한테 참 좋은데 어떻게 표현할 방법이 없네”

천호식품 김영식 창업주의 CF를 인용한 글이다.

회계, 숫자, 재무, 경영이라는 개념이 독자와 동떨어진 것이 아닌 살면서 끊임없는 모든 것들과 닿아 있음을 깨닫게 해주고 이를 바탕으로 경영으로 움직이는 삶의 모든 순간을 보다 또렷하게 보고 판단할 수 있도록 도와주는 책이다. 어차피 우리는 매일 수지타산이 맞는지에 따라 행동하게 될 것이기 때문이다.

회계 개념을 일상으로 끌어 내리기에 책은 몇가지의 질문을 던지기도 하고, 일상에서 궁금했던 소재들과 결부시키기도 한다. 아래 질문들은 우리가 한 번쯤을 궁금하게 생각해봤던 질문들일 것이다.

  • 커피 한 잔의 원가는 어떻게 구성되나?
  • 쿠팡, 이마트, 편의점의 제품은 가격이 다르다. 무슨 기준으로 책정한걸까?
  • 어떤 지표가 주가와 상관관계가 가장 높은 지표인가?
  • 경영자들은 의외로 회사의 이익을 줄여서 발표하고 싶다는 사실을 알고 있는가?
  • 수익과 이익의 차이는 무엇인가?
  • 매출은 느는데 이익은 줄어드는 이유는 무엇일까?
  • 고유가로 위태로운 A항공사는 원가절감이 아닌 되려 운행횟수를 늘리고 신규노선을 개척하고 있다. 이래도 되는걸까?

위 질문들이 궁금하다면 이 책은 적합한 선택이 될 것이다.

또 누구나 한 번 쯤은 지옥같은 직장 때려치고 자기 사업을 구상해 본 적이 있을 것이다. 나 역시 나름의 수익 모델을 계산하며 치열하게 고민했음에도 아래 그림에 나오는 빙산의 숨은 부분을 고려하지 못했다.원가빙산

이 책을 읽지 않고 무리하게 사업을 추진했다면 결과가 어땠을지 아찔하다. 이 책은 이런 전체 판도를 읽을 수 있는 시야를 키워준다는 점이 가장 매력적인 장점이라고 할 수 있다.

또 영화 수익이나 스포츠 구단 인식과 같은 사업은 얼마나 수지타산이 남는 장사인지 궁금해 하는 이가 많다. 회식 혹은 사적인 모임에서 흔히 등장하는 주제이기 때문이다.조선명탐정

이 책의 각 장 말미에는 배운 지식을 기반으로 우리가 관심있던 현실의 과제에 도전할 기회를 준다. 교과서에 나오는 회계 문제가 아니라 우리가 늘 궁금했던 일상의 문제를 회계 지식으로 풀다보면 인식이 달라진다. 이 책을 일다보면 고차원의 추상적인 개념이 일상의 개념으로 바뀌는 신기한 경험을 자주 겪는다.도전과제

책을 읽다보면 결국 우리가 삶을 성공적으로 살아가기 위해 재고, 계산하고, 측정해보고, 숫자로 바꿔보는 과정과 회계가 별반 다름이 없음을 알게된다. 기업 역시 성공하기 위해 일련의 과정을 거치는데 그 순간 하나하나 그리고 이를 기반으로 한 의사결정의 기록이 회계라는 형식으로 쓰여 있을 뿐이다.

우리가 회사에 소속된 직원이든 주식 투자자이든 경영자이든 간에 우리는 해당 기업의 정보를 필요로 할 것이고 이를 표현한 언어가 회계이다.이해관계자
회계의정보들

책의 핵심에 해당하는 2 ~ 6장에서 우리가 직장에서 보는 회사의 활동들을 어떻게 측정 가능한 형태로 남겼는지 재무제표, 관리회계, 원가회계, 재무상태표, 손익계산서라는 양식과 함께 살펴본다. 낯설고 두려운 단어인 것은 알지만 전혀 걱정할 필요가 없다. 위에서 설명했듯 저자가 우리의 일상으로 풀어내기 때문이다.

특히 3 ~ 5장은 재무제표의 전반을 볼 수 있게 해줘 너무 만족스러웠다. 때로는 무서워 보이는 양식이 수익과 비용을 열거한 것에 지나지 않음을 알게 해줬고, 때로는 이해하지도 못했는데 주위에서 자꾸 들려오는 IFRS라는 놈의 정체가 부모 자식같은 느낌으로 전달되어 자신감을 높혀주기도 했다.

6장은 주식으로 돈 좀 벌어보고 싶은 이에게 아주 유용한 정보가 담겨있다. 본인이 묻지마 투자 혹은 소문이나 지인 추천 또는 자신의 감을 믿고 투자하는 기도매매하는 투자자였다면 다 털리기 전에 일단 이 책의 6장이라도 먼저 읽어볼 것을 추천하고 싶다.

그것조차 싫다면 아래 그림 한 장이라도 먼저 살펴봤으면 좋겠다.투자

사회 초년생일때 어서 들은건 있어서 DART 금감원 사이트 정도는 들어가서 볼 줄 알아야 한다고 주위에 으슥거리고 잘난 채를 했던 기억을 떠올리면 부끄럽기 짝이 없다. 정보가 어디있는 줄 알면 뭐하나? 하나도 볼 줄을 모르는데.. 그런데 이 책을 다 읽고나니 생각보다 별 것 없다는 자신감이 솟았다.

하물며 가장 기초적인 개념인 위 사진의 문제에 답하기 어렵다면 특정 기업을 제대로 알고 투자한다 말할 수 있을까?

7장은 CEO에게 추천하고 싶은 파트이다. 특히 미래의 CEO를 꿈꾸는 사람들에게 적합할 것이다. 회사라는 조직을 성공적으로 운영하기 위해 회계라는 대시보드를 읽을 수 있게 도와주기 때문이다.

이 책은 회계 리터러시 능력을 키워주는 책이다. 그 중에서도 쓰는 능력보다는 읽고 활용하는 능력을 향상시키기 위해 쓰여진 책이다.

회계, 마케팅, 재무 부서의 전공자들보다 무엇보다 창업에 관심이 있거나 CEO에게 추천하고 싶은 책이다. 비즈니스 전체의 판을 쉽고 빠르게 이해할 수 있도록 구성되어 있기 때문이다. 그 다음으로 추천하고 싶은 이는 일반인이다. 투자자로서의 안목을 높히거나 직장 내 본인의 위치를 돈으로 환산하는 등 새로운 비즈니스 시야를 확보할 수 있을 것이다.

회계로 움직이는 비즈니스의 전체 판을 읽고 그 안에서 자신이라는 말의 역할을 파악하고 스스로의 역량이 얼마의 수익에 직결되는지 정확히 인지하여 시장에서 자신의 몸값을 흥정하고 싶다면, 돈으로 움직이는 자본주의 사회에 블랙박스를 걷어내고 싶다면 이 책을 반드시 읽을 것을 추천하고 싶다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
2021 빅데이터분석기사 필기 한권완성 - 2021년도 최신기출복원문제 최초 수록 / 빅데이터분석기사 국내 최다 문제(1,314문제) 수록 / 실전모의고사 총 8회분
최기선 외 지음 / 예문사 / 2021년 7월
평점 :
구판절판


이미 필기 시험을 합격하였고, 빅데이터 분석기사 문제 수준에 적잖이 실망하였기에 사실 수험서를 더 봐야할 필요는 없었다. 그럼에도 시험과 무관하게 이 분야에 관심이 지대하고 책마다 저자마다 미묘한 관점의 차이를 비교하다보면 난해한 부분을 보다 잘 이해하는데 도움이 되기에 서평단에 지원하였다.

전체적으로 볼 때 수험서로 상당히 괜찮은 책이라는 생각이 들었다. 무엇보다 현 시점에 빅데이터 분석기사 첫 시행 문제를 복원한 점과 경향을 반영한 점은 다른 수험서들이 갖추지 못한 차별점이라 할 수 있다.

파트7에 해당하는 2회 시험의 복원 능력에 감탄했다. 문제 유출이 금지되는 시험이기에 이를 복원하는 능력 수준도 수험서의 주요 평가 지표라 생각한다. 이미 치뤄본 기억을 되살려 봤을 때 2과목의 몇 문제를 제외하고는 실전 문제와 거의 유사했다. 말이 많았던 드롭아웃, 오류역전파와 같은 용어까지 그대로 복원되어 있다.

또 다른 장점으로 8회분에 해당하는 실전 모의고사를 들 수 있겠다. 시험이 치뤄지기전 많은 수험서 중에서 가장 혹평을 받았던 시x고시 출판사 수험서는 막상 뚜껑을 열어보니 호평을 받았다. 문제의 양이 많아 실전 테스트에서 적중수가 높았기 때문이다. (양이 많으니 적중률까지는 모르겠다.)

어쨌든 빅데이터도 그러하듯 데이터 양치기는 어떤 훈련에 있어서도 진리이기에 8회분이나 되는 모의고사를 푼다면 상당 부분 실전에 대비할 수 있을거란 생각이 들었다. 문제 또한 살펴보니 2회의 경향을 대부분 잘 반영하고 있었고 그 외 ADP 필기 시험에 자주 등장하는 문제들도 섞여있어 마음에 들었다.

그 외 이론 설명 부분 파트도 괜찮은 편인것 같다. 단 내용에 대한 깊이는 기대했던 만큼은 아니어서 개인적으로는 아쉬웠던 부분도 있지만 수험생의 입장에서 볼 때는 꽤 괜찮은 구성이라는 생각이 든다.

특히 아래 그림처럼 좌, 우측 여백에 OX QUIZ, 핵심요약, 빈칸채우기와 같은 각종 학습도구들이 포진해 있는데 이는 암기를 도와주는 효과는 물론 기억을 오래 지속시키는 측면에도 유용하다. 같은 주제를 다양한 관점과 기준으로 생각해 볼 여지를 주기 때문이며 ADP와 같은 시험에 실제 출제된 선택지 등으로 구성되어 있어 적중룰을 높히는데도 도움이 된다 생각한다.

박스플롯

또한 위 그림에는 박스플롯을 담고 있는데 복수개의 정답으로 논란이 되었던 문제이기도 하다. 이렇게 기출로 다뤄진 부분에 대한 설명이 충실히 보강되어 있어 경향을 확실히 반영했다는 생각이 들었다.

다만, 박스플롯으로 분산이나 표준편차는 확실히 측정할 수 없으나 평균은 오해의 소지가 있다. 간접적 혹은 활용하는 tool에 따라 추적할 수 있는 여지가 있기에 그런 부분에 대한 설명도 포함되었다면 어땠을까 하는 아쉬움이 있다.

그 외 파트1, 4와 같이 암기가 생명인 부분이 외우기 쉽게 깔끔하게 정리되어 있다는 것도 장점이라 할 수 있다. 아래 그림과 같이 확률 분포의 경우 이렇게 깔끔하게 표로 정리하여 상호간의 비교를 편리하게 정리하면 따로 단권화할 필요가 없어 학습에 효율적이다.

확률분포

마찬가지로 파트4의 시각화 유형 비교도 잘 정리되어 있다. 기출로 등장했던 부분은 따로 마킹이 되어 있으니 더 유심히 볼 수도 있고, 반대로 아직 기출로 등장하지 않은 부분들을 다음 시험 문제로 예측해 볼 수도 있어 편리하겠다는 생각이 들었다.

시각화

장점을 살펴보았으니 이제 단점도 살펴보려 한다. 우선 이론파트에 난이도 있는 부분의 설명이 누락된 경우가 더러 보인다. 예를 들면 2회차 시험에는 표본의 평균검정 문제가 있었던 것으로 기억난다.

물론 이론 파트에서 일부 이 부분을 다루고는 있지만 간략한 개념 정도만 다루고 있다. 실제 데이터가 주어지거나 t-분포표가 주어진 후 계산하는 문제가 없는 것이다. 2회차 복원 문제에도 그 부분이 생략되어 있으며 실전 모의고사에도 관련 문제가 등장하지 않는다.

표본 평균검정, 두 표본의 평균차이 검정, 대응표본의 평균차이 검정과 같은 문제들은 계산 문제이기에 상황별 단어를 바꾸거나 수치만 바꿔도 여러번 출제할 수 있는 파트라는 생각이 든다. 회차가 흐를수록 수험생들의 실력도 향상될 것이기에 난이도가 높아질 가능성이 클텐데 그 때 활용하기 좋은 파트라는 생각이 든다.

개인적인 기우일지는 몰라도 2과목 통계 파트가 앞으로의 난이도를 조절하는 중요한 키가 될 것이라는 생각이 들었다. 실제 카페 후기를 봤을 때에도 수험생 대부분이 2과목이 어려웠다는 평이 많았기 때문이다.

물론 60점만 넘으면 되는 시험이기에 어려운 부분은 포기하는 것도 전략일 수도 있겠다. 하지만 그런 이유에서라면 좌우측 여백에 전략에 대한 Tip으로 내용을 생략했다는 언급 정도는 나왔으면 좋겠다는 생각이 들었다. 엄연히 기출에 등장한 유형이기 때문이다.

또한 통계 파트를 처음 접하는 독자들은 요약식으로 구성된 이론의 구성이 다소 어려울 수 있겠다는 우려도 든다. 이지패스의 책을 제외하고는 대부분 이런 구성을 띄고 있는데 그래도 본 수험서는 많은 양의 문제로 보완하고 있어 문제가 될 부분은 아닐듯 하다.

그 외 출간한지 얼마되지 않아서인지 일부 오탈자나 내용상 오류도 보이긴 하지만 큰 문제는 없고 우려할 수준은 아닌 것 같다. 오탈자가 업데이트 게시되니 이를 수시로 참고하고, 수험서가 2권이라면 비교하면서 보는 것도 좋은 방법일 듯 하다.

끝으로 서평 이벤트에 당첨되었다는 이유로 편파적으로 리뷰를 작성하지 않고자 매우 노력했음을 밝힌다. 철저히 수험생의 입장에서 합격을 목표로 분석했음을 알린다.

도서를 제공받아 작성된 글입니다.



댓글(0) 먼댓글(0) 좋아요(1)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
파이토치로 배우는 자연어 처리 - 딥러닝을 이용한 자연어 처리 애플리케이션 구축
델립 라오.브라이언 맥머핸 지음, 박해선 옮김 / 한빛미디어 / 2021년 6월
평점 :
절판


자연어 처리 입문서로 신경망에서 시퀀스까지의 범위를 다루고 있으며, 각 예제는 Pytorch 1.8 버전으로 구현되어 있다.

개인적으로 동적 계산 그래프 기반의 Pytorch 특성은 정적 프레임워크 언어들에 비해 상대적으로 서비스, 제품 측면에 대한 사전 고민이 필요없기에 프로그래머의 의도를 구현하기 보다 친숙하고 편리하다는 생각이 든다.

지금은 분야 막론하고 Pytorch가 점점 대세 프레임워크로 자리잡고 있지만 초기 등장 시기만해도 NLP 분야에 강세를 보여왔기에 책에서 다루는 주제를 구현하는 프레임워크로 Pytorch가 선택된 점이 마음에 들었다. 또, Pytorch를 다루는 책이 희소하다는 점도 이 책의 가치를 높혀준다.

아래 예제는 퍼셉트론으로 이진 분류를 수행하는 책에서 다루는 가장 간단한 예제인데 Pytorch를 사용한 적이 없는 독자도 이 예제를 본다면 Pytorch의 직관성을 쉽게 파악할 수 있을 것이다.Pytorch

책의 특징은 크게 두가지로 요약할 수 있다. 먼저 성능 및 효율성 측면에서 퍼셉트론, 신경망, CNN, 임베딩 단계별로 개선점을 확인할 수 있다. 덕분에 각 단계에서 사용하는 모델이나 스킬들이 어떤 목적으로 활용하는지 감을 잡을 수 있고 베이스라인 코드 감각을 익힐 수 있다.단계별개선

또 한가지 특징으로 시퀀스 모델링 파트를 중점적으로 다룬 점을 들 수 있다. 책의 6 ~ 8장에 해당하는 부분으로 먼저 초급 과정에서는 RNN을 적용한다. 국적별로 성씨를 분류하는 모델을 만들며 RNN이 시계열에 적합한 모델임을 확인할 수 있음과 동시에 부분 단어 수준의 단기 기억만 가능하다는 한계점을 파악할 수 있다.

중급 과정에서는 LSTM을 적용하여 단기 기억 문제나 Gradient 소실, 증폭 문제를 해결하는 방법에 대해 다룬다. 특히 200p를 전후하여 게이팅(스위치) 개념을 소개하며 엘만 RNN의 문제를 개선하는 방법에 대한 아이디어가 등장하는데 수식없이 글만으로 이렇게 LSTM의 핵심을 잘 설명하는 책은 드물거라 생각한다.

이렇듯 곳곳에 숨어있는 저자의 전달력, 그리고 밑바닥 예제가 변화하는 과정을 보여주며 특정 개념을 눈으로 확인하며 감을 잡을 수 있게 해주는 구성이 책의 장점이라고 생각한다.

시퀀스 모델 훈련 시 고려할만한 아래와 같은 주요사항들을 정리하며 중급 과정을 마친다.

  • 게이트 활용 권장 : 수치 안정성, 단기 기억 문제 해결
  • GRU 권장 : LSTM 대비 자원 소모 측면에서 효율적이며 파라미터 수가 적다. (대부분 LSTM 모델을 대표적으로 설명하기에 이 대목에서 국뽕이 상승하고 뿌듯했다..!)
  • Adam Optimizer 권장
  • Gradient 이상치 클리핑 활용

고급 과정인 8장에서는 Sequence-to-Sequence 모델을 중점으로 학습하며 인코더-디코더 모델을 활용한 조건부 생성 작업도 다룬다.조건부생성

특히 특정 단어를 읽을 때 주변 단어, 절, 장, 주제 등에 주의를 기울이는 사람의 어텐션 매커니즘에서 착안한 Attention 모델에 대해 알아본다. NMT Model과 함께 엔드 투 엔드 기계 번역 예제를 만들 수 있는데 책을 통떨어 가장 재미있는 예제였다고 생각한다.

부록에는 재미있는 주제가 하나 등장한다. 최근 카카오브레인에서 릴리즈한 pororo(뽀로로)의 간단한 개요와 활용 방법을 다룬다. 한글 자연어 처리 작업을 위한 30여 가지의 처리 작업을 선보이는 라이브러리로 책에서는 OCR인식, 이미지 캡셔닝, 번역, 요약, 감성분석, 추론, 토픽 분류 등 7가지 예제를 다뤄볼 수 있다. 관심이 많았지만 시간이 없어 미루고 있었는데 덕분에 pororo의 강력함을 맛볼 수 있었다.
pororo

전체적으로 정리해보자면 연구 보다는 구현 및 활용에 초점을 맞춘 책이라고 할 수 있기에 입문서라고 볼 수 있다. NLP에 관심 있거나, 막 입문 단계에 발을 디딘 분이라면 쉽고 빠르게 Sequence 모델의 구현과 실제를 파악할 수 있다.

특히 NLP에 익숙한 독자가 PyTorch의 특성을 빠르게 파악하고 구현 스킬을 올리고 싶다면 이 책에 제 격일 것 같다는 생각이 든다. NLP에 익숙한 분들은 Tensorflow 혹은 다른 프레임워크에도 익숙할 것이기에 빠르게 PyTorch의 패턴을 파악하기에 좋다.

예제와 이론 설명이 따로 노는 것이 아니고 밑바닥 데이터를 예제를 통해 눈으로 확인할 수 있는 구성으로 되어 있어 실전적인 구성이 좋았다.

박해선님의 번역이기에 읽기에 어색하거나 이해되지 않는 부분도 거의 없으며 책의 200p 하단 주석과 같이 재미있는 주석도 볼 수 있다. 보다 자세한 설명은 핸즈온 머신러닝 서적을 참고하라고 언급되어 있는데 역자분이 워낙 많은 책을 번역하시다보니 이런 시너지도 가능해 진다는 것이 재미있고 신선하게 다가왔다.

반면 책에 다소 아쉬운 점도 꼽아보겠다. 사실 단점이라기 보다는 개인 취향인데 책 전반부에 Perceptron, 피드포워드신경망, CNN을 차례차례 도입해가며 성능을 향상 시키는 구성은 마음에 들었으나 이 과정을 하나의 예제로 진행했다면 보다 단계별로 개선되는 부분이 뚜렸하게 드러나 이해에 도움을 주지 않았을까 싶다.

또 어느책이든 마찬가지이지만 기술 서적의 난이도를 잘 알고 책을 구매하는 것은 중요한 부분이라고 본다. 난이도에 따라 대상 독자층이 보기에 충분히 훌륭한 책도 있는데 가끔 난이도 높은 책이 아니라는 이유로 또는 반대의 이유로 오평을 하는 독자들을 자주 봐왔기 때문이다.

그런점에서 나는 이 책 보다는 수준이 약간 높은 편이기에 아무래도 수식이나 연구 결과에 대한 설명이 부족한 부분이나 시퀀스 모델 이후의 부분에 집중하지 않는 것은 약간 아쉬운 부분이다.

저자의 전달력이 굉장히 마음에 들었는데 그 전달력으로 어려운 어텐션 이후 GPT-2, 3와 같은 모델에 대한 설명이 있었으면 더욱 만족스러웠을 것이다. 또 연습문제가 1장에만 등장하고 다른 장에는 등장하지 않는 점도 약간 실망한 부분이다.

하지만 이런 아쉬운 부분들은 개인적인 관점에 따른 부분이고 트레이드 오프를 피할 수 없는 부분이기에 대세에 지장을 주는 단점은 거의 없다고 볼 수 있으며, 특히 입문자에게는 정말 좋은 책이 될 것이라 생각하며 리뷰를 마친다.


한빛미디어 “나는 리뷰어다” 활동을 위해서 책을 제공받아 작성된 서평입니다.



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
주머니 속의 머신러닝 - 파이썬으로 구조적 데이터 다루기 제이펍의 인공지능 시리즈 (I♥A.I.) 31
매트 해리슨 지음, 박찬성 옮김 / 제이펍 / 2021년 4월
평점 :
장바구니담기


머신러닝의 자주 활용하는 스킬 80%를 20%의 분량으로 요약한 듯한 느낌을 주는 일종의 머신러닝 사전이다. 마치 국어사전, 영한사전과 같이 필요한 스킬의 가장 중요한 핵심 개념과 활용법을 빠르게 찾아 적용해 볼 수 있으며 컴팩트한 사이즈라 휴대하기도 좋고 새롭게 알게된 주요 기법들을 메모하며 스스로의 실무 지식이나 캐글 등의 경진대회에 활용할 지식들을 단권화하기에도 좋다.

가로 세로 사이즈는 서점에서 볼 수 있는 책 중에서 가장 작은 A4사이즈의 절반도 안된다고 보면 되며 약 300P의 두께로 구성되어 있다. 컴팩트한 사이즈에 머신러닝의 주요 기법들이 거의 대부분 담겨 있는데 예를 들면 “3장. 분류 문제 둘러보기”만 봐도 왠만한 입문서 한 권의 내용이 압축되어 들어가 있다.

목차를 대충 살펴보면 다루는 범위가 얼마나 광범위 한지 알 수 있는데 머신러닝 과정의 개요, 베이스라인, 결측치, EDA, 전처리, 피처 엔지니어링, 평가, XAI, 차원 축소, 클러스터링, 파이프라인의 기법들이 다뤄지고 있으며 특히 활용하는 분류 및 회귀 모델의 알고리즘 대부분이 비교하기 쉽게 잘 정리되어 있다.개요

컴팩트한 사이즈에 거의 대부분의 내용을 제법 깊이있게 다루고 있다면 어떤 내용이 생략된 것인지 궁금할 수도 있는데 수학, 연구 수준의 지식은 아주 중요한 것을 제외하고는 포함되어 있지 않다. 더불어 군더더기로 붙는 중요하지 않는 소스코드들은 제거되어 있다. 실무에 초점을 맞춘 구성이라 할 수 있다.

이런 구성상의 특징이 개인적으로는 매우 마음에 들었다. 책을 좋아하는 독자로써 두꺼운 책을 읽으면 읽는 당시에는 잘 이해하고 있을지라도 계속 기억하는데는 한계가 있기 때문이다. 결국 실무를 하며 어차피 책을 들춰보거나, 논문을 찾아본다던가, 수학과 같은 기초가 부족하면 교과서 등을 다시 들춰봐야 한다. 즉, 머리속에 기억하고 있어야 할 가장 핵심만 담고 있어 빠르게 검색하고 활용하기에 좋다.

찾다보면 삼천포에 빠져 너무 깊이 들어가는 경우가 생기는데 문제를 해결하기 위한 탐색인지 개인적인 공부인지 분간하기 어려워진다. 이럴 때 이 책을 이용하면 빠르게 베이스라인을 구성할 수 있을 뿐더러 실무에서의 경험을 잘 메모해 놓는다면 기억이 잘 안날때 들춰보면 빨리 찾아 적용해 볼 수 있어서 유익하다. 두달 여에 걸쳐 실무에 적용해보며 내린 결론이다.

폭 넓은 범위를 다루면서도 핵심 부분이나 혼동되는 부분이 잘 정리되어 있다는 점도 책의 장점 중 하나이다. Python의 유연성은 대부분 큰 장점이지만 때로는 같은 결과를 향한 방법이 다양하게 존재할 수 있어 다른이의 코드를 볼 때 혼동될 수 있다는 단점도 존재한다. 아래 그림의 소스코드와 같이 혼동될 수 있는 부분 또한 잘 정리하고 있다.다양한표현

가장 마음에 드는 점은 회귀, 분류에 해당하는 알고리즘을 일목 요연하게 정리한 부분이다. 핵심 코드들이 잘 정리되어 있어 활용한지 오래된 모델의 핵심을 떠올리기에도 좋고 파라미터들이 잘 정리되어 있어 모델별로 기능은 동일한데 다른 명칭을 가진 파라미터를 분간하기에 좋다. 특히 모델마다 시간복잡도를 언급하고 있어 프로젝트마다 주어진 데이터 혹은 가용 자원에 따라 성능 측면에서도 알고리즘을 선택하기 편리하게 구성되어 있다.시간복잡도

두달 정도 실무에 적용해보며 느낀 점은 머신러닝 프로젝트라는 가정하에 목표로 하는 90%는 이 책 한 권만으로도 모델을 생성하기 충분했다. EDA, 전처리, 피처 엔지니어링은 항상 활용하는 기법들이 거의 다 정리되어 있다. 가끔 특정 기법들이 존재하는지도 기억하지 못한 채 건너뛸 때도 있는데 누락되거나 실수하는 과정이 발생하지 않도록 체크리스트 역할을 톡톡히 해낸다.

앞에서도 언급했듯 두꺼운 책을 읽어봐야 머리 속에 잔존하는 지식은 이 책 정도에 지나지 않는 것 같다. 그런 의미에서 교과서 위주의 두꺼운 책들은 이해될 정도로만 정리해놓고 이 책으로 실전에 돌입하다가 특정 부분에 대해 깊은 이해가 필요할 때 다시 들춰보는 편이 효율적일 것 같다. 즉, 이 책은 머신러닝 서적들의 메타 서적의 개념으로 활용하면 좋다.

머신러닝의 기본 수준을 뗀 독자라면 이 책으로 일단 모델을 구성해 본 후 책에 없는 기법을 활용한 경우 이 책의 여백에 메모를 해 나간다면 추후 훌륭한 본인만의 비급이 탄생하지 않을까 싶다. 다만 입문자나 초보자의 경우 약간 어려울 수 있으므로 먼저 기본서를 통한 실습 후 이 책을 볼 것을 권장한다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo