수학이 외계어처럼 들리는 이공계생을 위한 제로 수학
김우섭.강민범 지음 / 한빛아카데미(교재) / 2021년 6월
평점 :
장바구니담기


이공계 관련 학과에서 반드시 알아둬야 하는 수학의 핵심을 단 한 권에 요약한 책이다.

복소수까지 이르는 수의 체계, 집합과 명제로 이루어진 수의 논리, 이를 바탕으로 한 중학교 수준의 수의 연산을 시작으로 함수, 기하학, 선형대수, 극한, 미적분의 내용을 담고 있다.

다루는 범위는 이공계 수학에서 반드시 알아야 하는 수준을 담고 있다. 기계공학과라면 미적분 파트가 더 중요할 수도 있고 컴퓨터공학과라면 선형대수가 더 중요할 수도 있겠는데 이 책에서 다루는 범위는 각 이공계 학과에서 배워야 할 수학의 교집합이라고 볼 수 있을 것 같다.

타 학과를 전공하지 않았기에 함부로 평하긴 어렵겠지만 적어도 컴퓨터 공학 전공인 내게는 학부 시절 필요로 했던 수학의 내용들이 모두 담겨 있었다.

예를 들면 집합과 명제에서 수의 논리로 이어지는 내용은 부울 대수로 이어지고 그 개념은 논리회로나 전자회로의 과목으로 이어진다. 그 외 과목에도 증명, 응용 가능성을 판단하기 위한 기본 수의 논리에 유용하게 활용된다.

수의 체계는 공리 등을 위한 거의 모든 과목의 기본 요건이며 다항식의 연산은 대학 수준에 이르면 사칙 연산 수준이라 할 수 있을 정도로 기초 뿌리로 활용된다.

특히 컴퓨터공학에서는 이 책의 백미라고 할 수 있는 3, 4장의 선형대수가 많이 활용되는데 컴퓨터 안의 세상은 인간 세상을 사상하여 만들어진 공간이 상당 부분 존재하고 그때마다 선형대수의 개념이 빛을 발한다. 이산수학으로 대표되는 과목의 뿌리가 되기도 한다.

VR, AR 등 공간표현에 기초가 되는 컴퓨터 그래픽스 과목에 활용되거나 AI분야에도 활용된다. 요즈음 핫한 딥러닝에서는 데이터들의 공간 표현 및 NLP분야의 임베딩 및 감성분석 등에도 활용되며 이를 실수 연산을 조합한 형태인 Vectorization화하여 GPU가 빠르게 연산할 수 있도록 변형하기도 한다.

미분 또한 AI 분야에서 손실함수의 경사하강법 적용을 통한 최적화에 활용되며 미분의 연쇄법칙 같은 경우는 딥러닝의 역전파법에 응용되어 인공지능이 학습할 수 있는 뛰어난 인사이트로 활용된다. 적분 역시 3D프린터에 활용된다.

다양한 분야의 수학을 한 권의 책으로 컴팩트하게 담고 있기에 책을 1회독하는데 걸린 시간은 예상보다 오래 걸렸다. 다른 책도 읽고 직장의 업무를 보면서 하루 평균 2시간 정도 학습에 매진했는데 대략 한 달 정도의 시간이 필요했다.

나는 수학을 어느정도 손에 잡고 있었고 또 절반 정도는 책의 내용을 확실히 알고 있는 상태였기에 이를 감안하면 수학의 기본기가 부족한 독자라면 그 이상의 시간이 걸릴 것이다.

수학을 전혀 모르는 채 이 책 하나만으로 대학 이공계 수준의 수학 역량을 얻을 수 있는지에 관심많은 독자분들이 많을텐데 난 충분히 가능하다고 말하고 싶다.

대신 전제 조건이 있다. 책은 가급적 순서대로 읽을 것을 권장하며 각 단원의 앞 부분을 확실히 정복하지 않았다면 완전히 익힐 때까지 다음 장으로 넘어가지 않는다는 규칙을 지켜야 한다. 아마도 90% 이상은 이 책 한 권으로 거의 커버가 가능한데 가끔 본인이 약한 부분은 인터넷 검색을 활용한다면 큰 무리없이 미적분에 도달할 수 있을거라 생각한다.

이 책을 읽고 느낌 장점은 크게 세가지로 요약할 수 있다.

첫번째 장점은 이공계 수학의 큰 흐름을 파악할 수 있다는 점이다. 어떤 분야든 본격적으로 연구하기 시작하면 스스로의 수학적 깊이 부족에 자책할 때가 많다.

하나씩 알아가며 흥미가 생기면 시간이 허락한다는 전제하에 대수학, 기하학, 해석학, 정수론, 집합론 등 수학의 세부 분야에 빠져들기도 하는데 재미는 있지만 시간이 너무 오래 걸려 문제다.

아주 공부를 열심히 하여 세부 분야를 알았다고 하더라도 다시 공학의 세계로 돌아오면 전체 흐름이 보이지 않아 또 진땀을 뺀다. 해석학이 집합론과 어떻게 연결되는지 연결고리가 부실해지거나 인간의 망각에 의해 당시 분명히 다잡았던 개념들이 흐릿해져 해메이기도 한다.

즉, 공학에 필요한 수학 전체를 아우르는 메타 지식이 부재한 상태라고나 할까? 전체 그림이 보이지 않으면 공학에서 응용할 수학을 바로 짚어낼 수가 없다.

수학 자체만 놓고 본다면 세상을 구성하는 진리를 발견하고 탐구하는 고상한 한 차원 높은 목적이 존재하겠지만 내 그릇을 넘어서는 영역이라 함부로 평하기 어렵다.

하지만 공학에 포커스를 맞추면 수학은 공학의 도구 상자라는 생각이 든다. 집에 책상이 필요해 만들고 싶다면 망치나 톱을 활용해야 할 텐데 각 도구의 용도를 모르면 아무리 망치질과 톱질을 잘하더라도 걸작 책상을 만들지 못하게 된다.

오차역전파법 덕분에 AI가 스스로 학습이 가능해졌다는 사실이 좋은 비유가 될 듯 싶다. 미분에서 미분 가능 여부를 따지는 계산을 분명히 배우고 스스로 문제를 풀줄도 알게 되었는데 정작 필요할 때 못쓰는 망치로 전락하는 경우가 많다.

미분으로 한 차원 뛰어넘는 성능을 낼 수 있는데 엉뚱한 아이디어로 미분 불가능한 함수를 만들어 연구 결과로 만든 구현체가 동작하지 않거나 성능이 느려 활용하지 못하는 단계에 이르는 경우도 있다.

또, 기껏 미분의 연쇄법칙을 배워놓고 딥러닝의 Layer마다 일일이 가중치를 역산하여 선행 노드에 전달한다면 이 역시 느려서 쓰지 못하게 되고 방대한 코드량은 사람의 몫이 되어 실현 불가능한 인공지능에 좌절하게 된다.

즉, 미분 연쇄법칙을 자동 미분에 활용할 수 있는 능력이 필요하다. 적어도 이공계 공학도라면 수학을 배울 때 어떤 분야에 활용할 수 있을지 연결할 줄 아는 안목을 키워야 한다.

수학을 너무 깊이있게 파고 들면 이런 활용의 방점에 약해지기 마련인데 바로 이런 약점을 보완해주는데 이 책이 상당한 도움을 준다. 수학의 세부 분야 중 응용에 핵심이 되는 부분만을 추려 한 권의 책으로 익히는 과정에서 메타지식이 형성되기 때문이다.

각 분야 마다의 연결고리가 점점 진하게 덧칠해져가며 공학적 용도에 대한 사고까지 이르게 되는데 이런 수학의 세부분야별 큰 흐름을 조망할 수 있다는 것이 이 책의 큰 장점이라 할 수 있다.

두번째 장점은 컴팩트하지만 깊이가 결코 얕지 않다는 점이다.

시중에도 이미 수학이 어떤 용도로 활용되고 무슨 내용을 다루는지 넓고 얕은 지식을 다루는 좋은 책들이 많다. 보통 이런책들은 교양서적과 전공서적의 중간 노선의 색채를 띄고 수학에 대한 흥미를 돋궈주지만 기껏 시간들여 읽은 것 대비 당장 활용하기 부족한 단점이 있다.

이 책은 그런점에서 두마리 토끼를 다 잡은 느낌이다. 쉽게 표현하고 있지만 깊이는 결코 얕지 않다. 전공서적에 비해 쉽고 가볍게 구성되어 있으며 밑바닥의 원리만 들이파는 전공서적과 달리 용용에 연계할 수 있는 힌트를 직접적으로 제시하는 경우도 많다.

세번째 장점은 手학이다. 즉, 눈보다는 손으로 배울 수 있게 구성한 점이 장점인데 수학을 공학에 응용하는 것이 중요하다고는 했지만 결코 쉬운일이 아니다.손으로

색다른 아이디어, 안목, 프레임의 재구성이 있어야 가능한데 이는 앞서 망치에 비유한 수학 기초에 대한 튼튼한 기초가 있을때나 가능한 일이다.

이견이 있을지도 모르겠지만 적어도 나는 손으로 푸는 과정에서 창의성이 생긴다고 생각하며, 손으로 풀어야 수학의 진의를 느낄 수 있다고 생각한다.

손으로 느껴지는 질감에서 새로운 창의성이 피어오른다는 것은 뇌과학 분야에서 이미 증명된 바 있는 연구 내용이고 또 시간이 걸리더라도 손으로 풀며 펼쳐지는 사고의 Map이 공학에서의 활용의 연결고리를 구축하는 시간이라 생각한다.

설명하긴 어렵지만 공학에서 어떤 주제를 실현가능하게 만들 때 어떤 수학적 도구나 사고를 활용해야 할지 바로 떠오르는 경우는 흔치 않다. 어느 정도는 직관에 의존해야 할텐데 손으로 풀며 고심했던 그 비슷한 느낌이 있어야 새로운 연구에 수학을 접목할 수 있는 것이 아닐까 생각한다.

이 책의 저자들은 확실히 그 부분을 놓치지 않았고 의도적으로 책의 대부분은 문제로 가득차 있다. 그래서 꽤 오랜시간 밑바닥부터 확실히 이해해야 하는 부담감이 있지만 확실히 기초 수학을 스스로의 자산으로 만들 수 있는 계기가 된다.

반면 책의 단점은 찾기 어렵다. 대신 단점보다는 약간 더 보완되면 완벽한 책이 될 수 있었겠다는 건의 사항은 있다. 하나는 각 장의 초미에 해당 수학이 일상에 어떻게 연결되었는지 혹은 어떤 일화로 이 수학이 등장했는지 등 일상에서 피부로 느낄 수 있는 흥미를 돋궈주는 장치가 있었으면 어땠을까 싶다.

예를 들면 극한이나 미적분 파트에서는 한없이 가까워지지만 0은 아닌데 결국은 0으로 취급하는 무한소의 모순이 해석학의 위기를 초래한 일화는 분명 흥미를 돋굴 수 있는 요소이다.

기하학의 평행선 공리로 지구와 같은 3D의 세계에서 직선이 곡선이 될 수 있다는 점, 집합과 명제 단원에서는 칸토어의 역설을 소개하며 자기 언급의 역설에서 제논의 역설에 이르기까지 흥미로운 요소로 각 단원을 시작했다면 이공계들의 활용의 인사이트를 번뜩이게 할지도 모른다는 생각을 했다.

또 앞서 예를 든 것 처럼 AI가 스스로 학습할 수 있게 해준 기반에 어떤 수학이 활용되었는지 설명이 보강되면 더욱 역작이 되었겠다는 생각이 든다.

하지만 이는 한 권의 책에 모든 것을 녹이는 것은 쉽지 않음을 알기에 단점이라기 보다는 개인적 바램으로 여길 뿐이다.

책에도 이미 데카르트가 언급되며 기하학의 대수화 과정이 소개되고 있으며, 175p처럼 코사인의 법칙을 활용하면 자로(길이로) 각을 잴 수 있게 해준다는 응용 관점을 제시한 것, 228p 케일리-해밀턴 정리를 통해 0이 되는 다항식을 유도하여 복잡한 식을 간소화하는 과정, 제곱을 덧셈으로 바꿔주는 드 므와브르 정리 등 공학적 응용에 인사이트를 불러 일으킬만한 신선한 자극들이 즐비해있기에 기왕 개인적 바램을 추가로 보탰음을 밝힌다.케일리해밀턴
드므와브르

정리하자면 이공계에 필요한 수학을 빠르게 익히는 과정에서 각 수학적 세부 요소 간 메타지식을 얻을 수 있다는 정점과 수학을 공학으로 이어주는 인사이트를 얻을 수 있게 자극한다는 점에서 이공계 수학의 기초를 탄탄히 하고 싶은 독자에게 추천하고 싶은 책으로 공학도를 위한 수학 교과서라 칭하고 싶다.




댓글(0) 먼댓글(0) 좋아요(2)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
데이터 분석가의 숫자유감 - 만화로 배우는 업무 데이터 분석 상식 만화로 배우는 잡학지식, 잡학툰
권정민 지음, 주형 만화 / 골든래빗(주) / 2021년 8월
평점 :
장바구니담기


“골든래빗 출판사로부터 책을 제공받아 작성했습니다.”

일상이나 직장에서 숫자나 통계의 함정에 쉽게 빠지지 않도록 데이터 리터러시(문해력)를 만화로 쉽게 배울 수 있게 도와주는 책이다.

저자는 데이터 분석 및 과학 분야의 전문가이시다. 스프링거社의 “실전 예측 분석 모델링”, “딥러닝과 바둑” 등 다수의 AI 관련 도서를 잘 번역해 주신 역자님에서 저자님으로 뵙게 되니 감회가 새로웠다. 몇년 전부터 데이터 관련 팟캐스트에도 자주 출연해주셔서 알파고 등장 초기에 데이터 과학 영역을 알아가는데 큰 도움이 되기도 했다.

식상해진 4차 산업혁명이나 AI라는 말을 차치하더라도 데이터를 활용하는 능력이 점점 중요해지는 시대이다. 대부분의 일반인들은 숫자나 통계라면 맹신하는 경향이 있어 백신의 사망률이 정치적으로 이용되거나 특정 통계가 영업, 수익의 목적으로 재단되거나 왜곡되기도 한다.

이 책에서는 일상에서 범하기 쉬운 숫자의 함정들을 만화로 쉽고 재미있게 풀어내고 있는데 긴 설명보다는 삽화를 중심으로 5가지정도 추려 소개해볼까 한다.


  • “소아마비 예방하려면 아이스크림 적게 드세요!”
    언뜻 생각해도 상식적으로 말이 안된다.상관관계1

    하지만 1940년대의 한 보건 전문가가 실제로 권고한 내용이다. 시간의 흐름에 따라 소아마비의 발생 빈도와 아이스크림 섭취 빈도가 묘하게 일치했기 때문이다.

    실상은 이렇다. 더운 여름에는 아이스크림을 많이 먹는다. 또, 여름에는 소아마비가 많이 발병할 뿐이다.상관관계2

    즉, 아이스크림 섭취 빈도와 소아마비의 발병 사이에는 상관관계는 존재하지만 인과관계는 존재하지 않는다. 그럼에도 우리는 상식으로 일상을 살아가는데 습관이 베여있어 주위를 기울이지 않으면 쉽게 빠지고 마는 함정이기도 하다. 상어에 잡아먹히기 싫으면 아이스크림을 먹지말라는 말도 비슷한 예이다.


  • 쿠폰으로 구매한 사람이 186명, 쿠폰없이 산 사람이 324명. 쿠폰 행사 괜히 한 것일까?
    우리는 대부분 숫자로 표시되면 무조건 맞을거라 생각하는 착각을 자주한다. 이럴 때 조건에 따라 확률을 파악하는 조건부 확률에 대한 이해가 사실을 보다 명확하게 바라볼 수 있게 도와준다.

    일부 숫자에만 주목할 것이 아니라 주어진 상황과 조건을 면밀히 파악할 필요가 있다. 아래 그림과 같이 실상은 쿠폰이 주어진 사람이 300명, 쿠폰이 주어지지 않은 사람이 832명이기 때문이다.조건부확률

    결국 쿠폰이 있을때 구매 확률이 높기에 효과가 없다고 보긴 어려울 것이다. 회사에서는 이윤을 남기기 위한 목적을 지니므로 A/B테스트를 자주 진행하는 편인데 그 때 반드시 알아둬야 하는 기본 소양이다.


  • 옆 회사의 평균 연봉은 4,800만원이니 이직해야 할까?
    우리 회사 평균 연봉은 4,000만원이고 옆 회사가 평균 4,800만원이기에 이직을 했는데 연봉이 2,000만원이 되었다. 왜 이런 일이 생기는 것일까?

    옆 회사는 사장님 급여 10억을 제외한 나머지 구성원의 연봉이 2,000만원 언저리였기 때문이다. 극단적인 예이지만 이렇듯 평균이라는 과학적인(?) 용어는 분포의 함정에 빠져들기 쉽다.분포

    급여는 보통 좌측 그림의 롱테일 분포를 따르는 편인데 정규 분포로 착각하여 벌어진 일이다. 비슷한 예로 로또에서 앞번호가 많이 등장했다는 이유로 뒷번호를 찍는 경우도 흔한데 이는 정규분포를 균등분포로 착각했기 때문이다.


  • 당신의 별점 4점과 나의 별점 4점은 다르다.
    누군가에게는 5점만점에 4점이면 아주 후한 기준이고 또 다른 누군가에게는 흔한 점수가 될 수 있기에 별점을 곧이 곧대로 믿는 것은 위험하다. 정규화라는 작업은 이럴 때 유용하다.정규화

  • 엑셀 좀 쓰는 사람이 즐겨찾는 R-제곱값의 정체는?
    아래 그림을 보면 판매량이 올라가고 있는 것처럼 보이기도 한다.결정계수1

    비슷한 상황에서 주위에서 엑셀 좀 쓴다고 평가 받는 사람들은 추세선에 R-제곱값을 즐겨 활용하는 경향이 있다.결정계수2

    이 기능을 활용하니 판매량이 되려 감소하는 것으로 보인다.결정계수3

    이는 통계학에서 자주 활용되는 결정계수인데 설명력을 나타내는 값으로 보통 0.1도 안되는 것은 신뢰도가 매우 낮다고 볼 수 있다. 복잡한 그래프에서 보다 정확한 추세를 판단하기에 꽤 유용한 도구이다.


일상에서 자주 벌어지는 위 사례 외에도 책에는 여러 사례가 추가로 소개된다. 데이터가 난무하고 AI가 사람의 판단력도 넘보는 세상에서 데이터를 매의 눈으로 비판적으로 바라보는 능력은 일상은 물론 직장에서도 더욱 중요해질 것이다.

이 책은 이런 데이터 문해력의 진입 장벽을 낮춰주는 것이 장점이다. 앞서 소개했듯 데이터 분석 분야의 전문가인 저자의 글을 수학에 거부감이 많은 그림 작가가 스스로 이해한 후 재구성한 책이기에 일반 독자 눈높이에 맞게 난이도가 조절되었다는 점도 특징이다.

숫자나 데이터에 거부 반응이 있는 독자에게 꼭 추천하고 싶은 책이다. 아무런 사전 지식이 없어도 재미있게 책을 읽을 수 있을거라 생각하며, 책을 덮고 난 뒤에는 데이터를 바라보는 안목이 한 층 업그레이드 되었음을 느낄 수 있을 것이다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
2022 이기적 빅데이터분석기사 필기 기본서 - 최신 기출분석 반영 + 동영상 강의 무료 제공 + CBT 온라인 모의고사 2022 이기적 빅데이터분석기사
나홍석 외 지음 / 영진.com(영진닷컴) / 2021년 9월
평점 :
구판절판


시험도 합격하였고, 이전판 2021 이기적 빅데이터분석기사 필기 기본서도 학습했기에 책을 조금 더 객관적인 시각에서 리뷰해 볼 수 있다는 생각이 들어 금번 2022 개정판의 서평단으로 지원하게 되었다.

이제 빅데이터 분석기사 책도 시중에 많이 등장했다. 내가 알기로만 7종인데 대부분 비슷한 주제와 범위를 다루고 있음에도 디테일하게 다루는 내용들에는 약간 차이가 있으며 특히 관점이나 서술방식에 차이가 있어 비교하며 읽다보면 기본적인 내용임에도 색다르게 읽히는 재미가 있어 빅데이터 분석기사 서적을 여러권 읽고 있다.

금번 도서는 2021 버전의 개정판으로 2021 버전에 비해 많은 부분이 보강되었다. 페이지 수만 봐도 100 페이지 이상 늘어나 제법 두꺼워졌다. 기본 뼈대는 2021 버전의 장점을 잘 가져왔고 그 외에 뒤에서 소개할 업그레이드 된 내용들이 있다.

2021 대비 어떤점이 개선되었는지에 초점을 맞춰 리뷰를 작성해보려한다. 먼저 2021 버전의 장점이자 이번판에도 고스란히 계승된 뼈대 장점들을 아래와 같이 정리해 본다.

  • 2과목 통계 계산 파트에 대비하기 쉬운 꼼꼼한 예제
    암기식 위주의 학습을 필요로하는 파트 1, 4에 비해 파트 2, 3은 난이도에 따라 충분히 어려운 계산 문제가 등장할 수 있는 파트이다.

    최초로 시행된 2회차 시험에서도 대부분의 예상을 깨고 파트2의 통계 계산 문제가 생각보다 어렵게 출제되어 확실한 통계 개념을 잡고 있지 않은 수험생들이 카페 게시판에 어려움을 토했던 기억이 난다.

    이번 3회차가 어떻게 출제될지는 모르겠지만 앞으로 시간이 지날수록 파트2의 통계 계산문제로 회차별 난이도 조정이 이뤄질것 같다는 생각이 든다. 암기식은 새로운 지식이 등장하지 않는 이상 해마다 수험서의 내용이 업그레이드되면서 변별력을 가지기 힘들 것이기 때문이다.

    반면 파트 2의 계산 문제는 기본형 문제에서 숫자나 데이터 혹은 약간의 전제조건만 바꿔도 문제의 품질을 보존하면서도(수험생들의 이의 제기에서 안전하다는 의미) 수준있는 문제를 출제할 수 있기 때문이다.

    예를 들어 이번 2회차 때 이 책의 문제와 거의 유사한 문제가 기출로 나왔다. t-검정으로 기억나는 단측검정 문제가 나왔는데 양측 검정으로 혼동하여 문제를 푼 수험생도 있을 거라 생각한다.

    이처럼 검정과 같은 통계문제를 바탕으로 데이터 혹은 검정 방식 등의 옵션을 조정하면 난이도로 변별력을 만들기 좋은 파트라는 생각에 난 앞으로 파트2 과목이 가장 중요하다는 생각이 든다.

    구구 절절하게 2과목을 길게 설명한 이유는 이 책에 소개되는 2과목 파트가 꼼꼼하게 정리되어 있음은 물론 각 개념별 대표성을 띄는 예제가 상세하고 풍부하다는 장점이 있기 때문이다.

    통계학과 전공이 아닌 이상 다른 수험서는 2과목에 해당하는 계산 문제가 나왔을 때 대응하기 약간 부족한 부분이 있을거라 생각한다. 반면 이 책이라면 2과목의 통계 계산 유형이 어떻게 출제되더라도 상당 부분 방어할 수 있을거라는 생각이 들었고 이 점을 이 책의 가장 큰 장점으로 꼽고 싶다.

  • 집필진의 전문성
    내 주제에 면면이 훌륭한 분들을 평가한다는 것은 주제넘지만 집필진이 고려사이버대학교 AI, 빅데이터 연구소 소속이라는 네임 밸류에 걸맞는 전문가 분들이라는 점과 책의 가독성이나 전달력 좋다는 평을 내리고 싶다.

    먼저 계층형으로 복잡한 개념들을 이해하기 쉽게 Top-Down 방식으로 잘 정리하고 있어 지금 학습하는 내용이 전체 구성의 어느 부분에 해당하는지 파악하기가 쉽다.

    또 앞서 언급했지만 좋은 예제들, 특히 고등학생들의 용돈 수준 조사나 두집단의 사료가 젖소의 우유생산량에 미치는 영향의 차이와 같은 일상에서 쉽게 이해할 수 있는 예제를 들어 어려운 통계 개념 예제를 만들 수 있다는 것이 전문성을 입증하는 부분이라 생각한다.

  • 모의고사 해설 동영상 서비스
    내가 아는 7종의 수험서 중 무료 동영상 강의가 제공되는 유일한 수험서이다. 영진출판사는 특히 수험생에게 유리한 플랫폼이 기존 부터 존재해 왔기에 이를 활용할 수 있다는 점이 차별화된 점이라 생각한다.

  • 핵심만 요약한 분량
    2021 버전의 총 분량은 약 370p 정도에 지나지 않았다. 최단 시간 내 가장 적은 시간과 노력으로 합격을 계획했던 깔끔한 요약 형태가 개인적으로 마음에 들었는데 이는 개인의 지식 정도와 선호에 따라 호불호가 갈릴만한 부분인 듯 하다.

위의 장점은 이번 2022 개정판 버전에도 잘 계승된 장점들이다. 그렇다면 이번 2022 버전은 기존 버전 대비 어떤 점이 좋아진 걸까? 아래와 같이 간단하게 요약해 본다.

  • 구성상의 변화
    • 확인 문제라는 코너가 새로 등장하였다. 각 단원별 연습문제가 등장하는데 그 중에서도 개념을 혼동하기 쉽거나 가장 중요한 개념을 다루거나 계산이 필요한 문제가 확인 문제에 등장한다. 꼭 알아야 하는 필수 문제가 등장하기에 시간이 없는 수험생은 이 코너를 먼저 접근해보는 것도 효율성 측면에서 괜찮겠다는 생각이 든다.

    • 모의고사가 기존 1회분에서 3회분으로 증가했다. 아직 기출이 1회분밖에 존재하지 않는 시험이기에 양질의 문제를 많이 풀어보는 것이 학습 적합성을 높이는데 중요하다 생각한다.

      기존 2021 버전은 문제량이 적은 것이 좀 마음에 들지 않았는데 이번에 전반적으로 모의고사는 물론 연습문제 등의 문제량이 상당히 늘어 만족스러운 부분이다.

      또 각 회차별 문제를 풀어보니 2회차 기출문제가 상당부분 수록되어 있다는 것을 확인할 수 있었다. 시험장에서 직접 풀었던 문제들이 고루 섞여 있다.

    • 동영상 강의 품질 개선도 마음에 드는 부분이다. 2021 버전의 경우 어떤 동영상은 연습문제의 해설을 그냥 읽다시피 한 동영상도 있어 실망이 컸는데 이번에는 달랐다. 과목별로 접근 전략을 어떻게 취해야 하는지 소개하는 것 부터 종이 책에 수록된 해설이 빈약한 경우 보충 설명을 해주고 있어 상당한 도움이 될 듯 하다.

      다만, 문제 풀이 강의만 존재하고 이론에 대한 해설 강의가 없다는 점은 여전히 불만이다. 동영상이 아직 계속 업로드되고 있는 중이기에 어디까지 올라올지 모르겠지만 이론에 대한 강의도 올라왔으면 하는 바램이다.

  • 내용상의 변화
    • 2021버전의 장점을 계승하여 2, 3과목을 중심으로 한 어려운 통계 계산 파트의 예제가 더욱 업그레이드 되었다. 조금이라도 어려운 개념이라 생각하면 반드시 일상의 쉬운 계산 예제 문제가 하나 꼭 등장한다. 2021 버전에서 굳이 예제를 수록하지 않았던 개념에도 이번에 예제가 새롭게 추가되어 저자의 꼼꼼함과 친절함에 놀랐다.예제

    • 1, 4과목 암기파트의 깔끔한 정리도 돋보였다. 기존 2021 버전의 분량이 적고 함축이 심한 부분은 장점이자 단점이기도 했는데 이번에 분량이 대폭 늘어났다. 늘어난 분량의 주 요소는 크게 세 부분이 차지한다.

      첫번째는 앞서 언급했듯 문제의 양이 늘었다는 것이 이유이다.

      두번째는 따분한 이론만 등장하는 경우 실무에서 다루는 구체적인 기법이 소개되어 추상적인 개념을 구체적으로 이해할 수 있게 도와준다는 점인데 이로 인해 다소 분량이 늘어난 듯 하다.실무

      세번째는 도표나 시각화 자료를 이용해 깔끔하게 정리된 파트가 늘어났다는 점이다. 이전 버전에서 딱딱하게 줄 글로만 늘어져있어 입체적으로 보이지 않고 가독성이 떨어지거나 지루한 부분이 있었는데 그런 부분들 마다 깔끔하게 정리되어 인상적이었다.정리

    • 이전 버전의 기술적인 부분의 오류가 잘 보완되었고 혼동을 유발하는 설명들이 깔끔해졌다.

      예를 들면 Confusion Matrix 같은 경우 크게 예측과 사실로 나뉘는데 기존 버전에서 사실에 해당하는 부분이 결과라고 표현되어 있어 초보자들이 보면 오해하기 쉽겠다는 생각이 들었는데 이번엔 잘 보정이 되었다.

      또, 난이도-시급성 사분면 같은 경우도 우선순위에 논란이 될 부분이 있었는데 그 순서도 여타 다른 수험서와 마찬가지로 동일한 내용으로 잘 정리되었다.

      더불어 이전 버전에서는 데이터 시각화 유사개념 파트는 솔직히 읽고도 잘 이해가 되지 않았고 내 판단이 맞다면 잘못 설명된 부분들도 더러 있었다. 그런 부분도 이번에는 깔끔하게 새롭게 쓰여져 이해가 잘 되고 인포그래픽, 정보디자인 등 혼동할 수 있는 개념들을 잘 구분하여 정리하였다.

    • 거버넌스, 수준진단, 적정성 평가, 품질 검증, 데이터 처리 등의 파트가 기존 버전에는 누락되어 있었었는데 이 부분이 잘 정리되어 포함되었다. 물론 개인적으로는 출제율이 낮은 파트들이라 생각되어 기존 버전 처럼 과감히 누락시키는 편이 나을거라는 생각이 들긴 하지만, 대부분의 수험생들이 원해서 반영된 사항이 아닐까 한다. 아직 시행 회차가 적은 만큼 나올 가능성이 충분한 부분이기에 이번 버전에서 포함된 것은 바람직한 방향이라고 본다.

    • 2회차 시험에서 딥러닝 부분은 출제 비중이 높지 않았다. 하지만 이 시험이 통계 기사시험이 아닌 빅데이터 시험이고 최근 AI 트렌드의 주류를 딥러닝이 차지하고 있기에 점차 출제 비중이 높아질 것으로 생각하는데 그런점이 또 이 책의 장점이다.

      여타 다른 수험서 대비 딥러닝 파트의 정리가 꽤 깔끔하고 실무에서 활용하는 깊이있는 개념도 잘 정리된 편이다. 특히 이전편에는 딥러닝 학습 단계에 있어 반드시 알아야 할 개념들이 불충분했었는데 이번에는 이터레이션과 같은 필수 개념들이 잘 정리되어 더욱 탄탄한 기본기를 다질 수 있다.딥러닝

마지막으로 총평을 내리자면 이번 개정판은 구판의 단점이 상당 부분 보완된 완성도 높은 수험서라는 평을 내리고 싶다. 만약 출제 경향이 2회차와 동일한 기조로 이어진다면 이 책은 합격율을 높이는데 많은 도움이 될 것이다.

특히 향후 난이도 변별력 조정에 활용되기 좋은 과목2의 통계 개념, 계산 유형 예제들이 잘 정리되어있고 연습문제, 모의고사 등 문제가 풍부한 부분은 왠만한 난이도의 문제는 방어할 수 있을만큼 알찬 구성이라는 생각이 들었다.

큰 단점은 내 기준에서는 발견하지 못했고, 작은 단점이라면 위에서 언급했듯 동영상 강의를 이론 강의까지 확대 적용하여 서비스했으면 하는 바램 정도 외에 전반적으로 장점이 가득한 책이다.

서평단 이벤트에 당첨되었다는 이유로 편파적으로 리뷰를 작성하지 않고자 매우 노력했음을 밝힌다. 철저히 수험생의 입장에서 합격을 목표로 분석했음을 알린다.

도서를 제공받아 작성된 글입니다.



댓글(0) 먼댓글(0) 좋아요(1)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
유튜브 마케팅 인사이트 - 수백억 광고비를 써서 알아낸
서양수 지음 / 한빛비즈 / 2021년 9월
평점 :
장바구니담기


유튜브 플랫폼의 알고리즘 및 성과 분석을 통해 마케팅으로 성과를 내기 위한 가이드이다.

그야말로 유튜브, 넷플릭스 세상이다. 코로나로 인한 이들 플랫폼의 사용률은 급증하고 있으며 사람이 모이는 곳엔 광고가 따른다. 반면 TV와 같은 전통 광고시장은 점차 차지하는 비중이 줄어들고 있다.유형별

대부분의 일반인이라면 한 번 쯤 접했을 “응답하라 1988” 외전 시리즈, 이국종 교수 블록버스터급 브랜드 필름, 이말년 및 주호민 작가의 “Y드립 시네마” 등 선풍적 인기를 끌었던 광고 등을 제작한 전문가로 실제 기업에서 수 백억원을 들여 광고를 기획한 경력이 있다.

유튜브에 관련된 광고나 마케팅을 모두 정리한 책은 찾기가 어려운 편인데 이미 유튜브에서의 성공 경험이 있는 저자가 유튜브의 기능과 그 안에서 살아남기 위한 마케팅 전략을 재미있게 정리하고 있어 유튜브 마케팅을 필요로 하는 독자에게는 도움이 될만한 책이다.

요즈음 유튜브를 시청하지 않는 이는 거의 없고 더욱이 코로나 이후 동영상 시청으로 시간을 소비하는 경우가 많아졌기에 자주 뜨는 광고가 얼마나 귀찮은지 대부분 알고 있을 것이다.

5초 후 스킵 기능이 활성화되는 기능을 활용하지 않는 이는 거의 없을텐데 이런 척박한 환경에서 유튜브 광고를 생존시킨 다는 것은 현재는 광고 소비자인 내가 봐도 쉽지 않은 전쟁터라는 생각이 든다.

뿐만 아니라 구글의 모든 제품이 그렇지만 유튜브 또한 광고주에게 친절한 설명을 해주지 않는다. 관공서보다 딱딱한 매뉴얼이나 일반 기업과 달리 전화 걸어 뭘 물어볼 수 있는 콜센터도 제대로 없는 것이 구글이다. 그러다 보니 광고를 내고 싶어도 어렵게 별도의 공부를 해야하는 상황이기에 유튜브의 광고 관련 기능을 상세히 분석해 주는 본 도서가 더욱 가치가 있다 할 수 있겠다.

책의 내용을 간단히 소개하면 크게 유튜브의 트렌드 및 광고의 현주소, 유튜브의 기능 구조, 유튜브 광고로 살아남기 위한 전략 등 세부분으로 요약할 수 있다.

먼저 유튜브의 광고는 TV 등에서 행해지던 기존 전통 방식의 광고와는 다른 특징이 있다. 기존과 달리 5초 후 스킵이 가능한 기능, 엔드 카드 등을 활용한 구매로 이어지는 고객의 능동적 액션 연결, 추천 알고리즘을 통한 개인화 맞춤형 광고 제공, 표현 방식의 자유도 상승, 핸드폰 매체를 중심으로 주로 소비되어 원경보다는 근경에 초점을 맞춘 디자인 등이 차이점이라 할 수 있고 이런 점에 따라 기존의 전략과는 다른 대응이 필요하다.

이에 앞서 먼저 유튜브의 기능 구조와 광고의 종류를 살펴볼 필요가 있다. 먼저 조회수는 30초가 지날때까지 신청하면 광고주에게 과금되는 애드뷰와 시청자가 자발적으로 클릭하여 시청하는 오거닉뷰를 합산하여 산정된다. 또 광고 노출 순위는 광고의 품질평가점수와 CPV 입찰가에 해당하는 입찰금액을 합산하여 산정된다.

광고의 종류는 무려 6가지가 있다. 고객에 도달하는 마케팅 퍼널 관점에서 각 6가지의 광고가 차지하는 위상은 아래 그림과 같다.광고종류

5초 후 클릭하면 사라지는 일반적인 스킵광고에서 부터 6초 제한시간이 걸린 범퍼광고, 영상속에 파붇힌 섬네일 형태의 트루뷰 디스커버리, 엔드카드 노출 형태의 트루뷰 포 애션, 스킵 기능이 없는 논스킵 광고, 최상단에 배너식으로 박혀있는 마스트헤드가 각각 존재한다.

광고를 개제한 후 투입한 예산과 더불어 성과를 측정하는 방법도 중요한데 이는 책에 알고리즘 소개와 같이 자세히 다루고 있다. 내용이 방대하여 가장 핵심이 되는 내용을 정리하면 아래 그림으로 요약할 수 있다. 노출에서 시작하여 시청자 도달에 이르기까지의 각 단계 지표의 비율을 측정하여 성과를 관리할 수 있다.도달퍼널

유튜브의 기능이 어느정도 파악되었다면 이제부터 진검 승부로 넘어간다. 과연 어떻게 광고를 만들어야 살아남을 수 있을까? 이 부분에 대한 전략은 주로 2장과 5장에서 다루고 있다.

광고를 고객의 참여로 인한 놀이터로 만드는 것이 주요한 전략이다. 댓글과 이벤트로 참여를 유도하고 감정을 자극하는 장면과 때로는 광고 문구까지 제거하는 과감함이 필요할지도 모른다. JYP와 유사한 작전을 폈던 GEICO와 같은 초두효과를 노리는 방법에서 리얼클래스의 타일러와 같이 호기심을 자극하는 질문이 광고 뒷부분에 이어지는 것 등 다양한 전략을 소개하고 있다.

이를 보다 정형화하면 ABCD Framework로 정리할 수 있는데 ABCD는 Attract, Brand, Connect, Direct의 머리글자에서 따온 약자이다. 원경보다는 근경을 중시하는 화면이나 사람이 등장하고 컷 전환을 통해 주의를 끄는 방법, 문제상황을 해결하는 구조로 브랜드를 노출시키는 방법, 감정을 자극하여 친밀감 등으로 연결하는 방법, 직접 구매로 이어지는 행동을 유도하는 방법이 각각의 기능이라 하겠다.

그 외에도 해시태그를 통한 추천 알고리즘을 활용하는 방법을 비롯하여 흥행하는 유튜버들의 비법도 분석한다. 부캐를 활용하거나 CEO가 직접 출연하여 내적 친밀감을 형성하는 방법, 진용진 채널과 같이 소소한 호기심을 해결해주는 방식까지 고객의 관심을 받기 위한 여러 기법들이 소개된다.

정리하자면 책 한 권에 까다로운 유튜브의 추천 알고리즘, 성과분석, 광고 게재 방식 등을 알기 쉽게 정리할 수 있다는 점이 책의 장점이라 할 수 있겠다. 물론 거기에서 그치지 않고 마케팅 흥행을 위한 저자의 경험, 전략, 벤치마킹이 잘 정리되어 있는데 이 부분이 책의 백미라 할 수 있다.

서두에서 언급했듯 까다로운 유튜브 마케팅 세계에서 살아남는 법을 정리한 희소한 책이기에 유튜브 플랫폼에서 마케팅으로 성공하고 싶은 독자들이 한 번 쯤 읽어볼 것을 추천하는 바이다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
만들면서 배우는 파이토치 딥러닝 - 12가지 모델로 알아보는 딥러닝 응용법
오가와 유타로 지음, 박광수 옮김 / 한빛미디어 / 2021년 8월
평점 :
장바구니담기


딥러닝으로 문제를 해결하는 과정에서 다른 연구자들의 아이디어 혹은 모델을 활용, 응용, 혹은 변형하는 능력을 키우고 싶을 때 유용한 PyTorch 기반의 실전 교과서라 평하고 싶다.

DNN, CNN, RNN, LSTM 등 딥러닝의 기본을 충실히 익히고 있고 다음 단계로 도약하고 싶은데 마땅한 국내서가 없었다면 이 책이 대안이 될 수 있을거라 생각한다.

새로운 문제 혹은 변형된 문제가 발생했을 때 모델의 입출력 혹은 모듈을 변형하거나, 손실함수를 바꿔본다든가, 다른 분야의 딥러닝 모델을 접목한다든가 등의 실전에서의 응용력을 키우고 싶다면, 더불어 논문 리터러시를 키우고 구현 능력을 키우고 싶다면 이 책이 많은 도움을 줄 것이다.

뇌 기능 측정과 계산 신경과학을 연구한 저자가 연구의 응용력과 구현 기술까지 탁월한데 책의 전달력까지 뛰어나 적잖이 놀랐다. 다른 독자분들의 평도 봐야겠지만 적어도 내 기준에서는 그동안 너무 찾던 책이다.

읽는 내내 컬러판이 아니라는 단점 하나 외에는 모두 장점 투성이였다. 부디 이 책이 널리 흥해서 컬러판이 나왔으면 하는 바램이다.

단, 주의할 점은 난이도가 중급서 이상이라는 점이다. 적어도 python, pyTorch, 딥러닝의 기본(DNN, CNN, RNN, LSTM 등), Linux 정도는 알고 책을 읽는 것이 좋을듯 하다. 처음부터 합성곱층, 전결합층, 텐서보드X 등의 용어가 나오기 때문이다.

각 장별로 어떤 내용을 다루는지 구체적인 설명과 더불어 읽으며 느꼈던 장단점을 기술해보겠다.


들어가기에 앞서 책 소개 챕터에 개발 환경을 구성하는 방법이 나오는데 그동안 봤던 어떤 책보다 실습환경 구성 방법이 자세하게 안내되어 있고 나중에 언급하겠지만 소스 코드들이 오류 없이 잘 실행되고 있어 실습을 따라하는데 편리하다.

1장은 기본기를 훈련하는 단계이다. 가장 크게 5가지 소챕터로 나뉘는데 각각 VGG-16, PyTorch 딥러닝 구현 패턴, 전이학습, AWS활용법, 파인튜닝의 주제를 다룬다. 각 주제들은 하나하나 한 권의 책으로 낼 수 있을 정도로 깊이 있는 주제들이지만 가장 급하게 알아야 할 중요한 요소들만 추려 적은 용량으로 깔끔하게 정리하여 마음에 들었다.

뒤에 이어질 12가지 심도 있는 모델을 이해하고, 구현하고, 응용하는데 있어 반드시 알아야 할 기초 지식이기에 충분히 숙지하고 넘어가야 한다.

첫번째로 Vision 분야의 고전이 되어버린 VGG-16 모델의 구조를 설명하여 독자로 하여금 CNN 등 딥러닝의 기본기와 연결고리를 맺게하여 논문을 읽고 구현할 수 있는 준비를 갖춰준다.

두번째로 PyTorch를 활용한 일반적인 딥러닝 구현 패턴을 설명한다. 딥러닝 실력이 부족하거나 PyTorch 혹은 Tensorflow가 능숙하지 않다면 딥러닝 구현 패턴에 의외로 많은 시간을 낭비하게 된다.패턴

각 논문 구현체나 서적마다 각기 다른 방식으로 구현하고 있기에 혼선이 생겨 직접 구현 시 어떤 패턴을 선택할지 의외로 많은 고민을 하게 되는데 깊게 고민할 필요도 없이 이 참에 이 책에 나온 패턴대로 주류를 잡고 차후 발견하는 패턴을 이 윤곽에서 업그레이드하는 형태로 접근해도 충분히 훌륭한 방식이 될거라 생각한다.

나는 초보자에 지나지 않지만 적어도 지금까지 겪어온 구현체 중에 가장 깔끔하고 확장성이 좋은 패턴이라는 생각이 들었다.

세번째로 전이학습을 다룬다. 앞서 배운 VGG-16 모델을 불러와 출력층만 원하는 형태로 바꾸는 실습을 진행한다. ImageNet 데이터셋과 달리 단순히 개미와 벌을 분류하는 예제이기에 불필요한 부분을 단순화하고 전이학습을 적용하는 방법에만 초점을 맞춘 구성이 마음에 들었다.

네번째로 AWS에서 딥러닝 환경을 구성하고 실습하는 방법을 배운다. EC2 우분투 기반의 인스턴스를 생성한 뒤 P2혹은 P3 인스턴스를 사용하여 손쉽게 딥러닝 개발환경을 구축할 수 있다. 다만 과금이 들어가는 부분이므로 주의해야 하며 다행히 책에서는 실습 시 인스턴스를 중지 혹은 삭제를 꼼꼼하게 가이드하고 있다.

마지막으로 파인튜닝을 다룬다. 딥러닝의 입문 단계를 거쳐 기본 과정에서 가장 많이 듣는 강의 중 하나인 앤드류 응 교수님의 DL Specialization 과정과 비교하자면 그 강의는 전이학습을 좀 간결하게 설명하는 경향이 있어 아쉬웠다. 그도 그럴 것이 전이학습을 넘어서 모델의 전단계에 영향을 미치는 파인튜닝으로 넘어가게 될 경우 설명해야 할 것이 너무 많기 때문이다.

파인튜닝은 새로운 논문이나 모델이 등장할 때마다 수시로 적용해 봐야 하는 마치 Python 문법과 같이 계속 곁에 두고 활용하는 기본 기술이므로 이 참에 이 책을 통해 확실히 익혀두면 실무에 매우 유용할 것이다. 다행히 2장 이후 지속적인 파인튜닝 실습을 진행하는데 이 책 실습만 잘 따라해도 파인튜닝에 꽤 익숙해져 새로운 과제가 주어져도 자신감이 생길만큼 능숙해질 수 있을거라 생각한다.


2장에서부터 본격적으로 비교적 최신 논문에 등장한 아이디어와 모델을 활용한 현실의 문제를 실습으로 해결해본다. 이 장에서는 이미지 Detection에 자주 활용되는 SSD 모델을 중심으로 다룬다. 이 모델을 적용하면 감지를 원하는 물체에 바운드 박스, 라벨, 신뢰도 등을 얻을 수 있다.

구체적으로 SSD300 모델로 실습하며 8,732개의 디폴트 박스, 오프셋 정보변수 4개, 신뢰도 21개 클래스로 218,300개의 정보를 출력하는 실습이다.SSD

SSD 알고리즘의 핵심은 아래 그림과 같이 디폴트박스(DBox)를 바운딩박스(BBox)로 변형하는 과정이다. 좌측에서 우측 그림으로 변형하며 cx, cy, w, h 등 4개의 오프셋 변수에 관계식이 생성된다. 이를 통해 손실함수 클래스 MultiBoxLoss 클래스를 구현하는 과정이 가장 인상적인데 당면한 문제마다 손실함수만 잘 설계해도 괄목할만한 성과를 얻을 수 있다는 것을 느낄 수 있는 부분이다.
SSD2

이 책의 겉표지에 왜 “딥러닝 응용”이라는 부제가 붙었는지 알 수 있는 부분이다. 이 책에서 말하는 응용은 구현 기술이라기 보다는 연구 결과를 구현체에 반영하는 과정에서의 응용이니 연구쪽에 가깝다고 할 수 있다. 책에 등장하는 12가지 모델에 잘 훈련된다면 아마 새롭게 마주하는 문제에 있어서도 거인의 어깨에 선 것처럼 기존 좋은 연구나 모델들을 활용하여 멋진 문제를 해결해 낼 수 있겠다는 생각이 들었다.

전체적인 구현 절차는 1장에서 언급했던 기본 패턴을 준수하고 있으며 의외로 디테일한 부분까지 설명하고 있어 친절하다는 느낌을 받을 수 있었다. 1장과 달리 DataLoader등을 직접 구현하기에 새로운 문제에 적합성을 키울 수 있다는 점도 책이 가지는 장점이다.

여담이지만 개인적으로 SSD는 정이 많이가는 모델이다. 몇년 전 SOTA급 논문을 어떻게든 구현하는 능력을 키우고 싶다는 욕망으로 처음으로 달려든 논문이 바로 이 SSD를 발표한 논문이었다. CNN을 배우고 나름의 자신감이 생겨 논문을 뜯어보며 고군분투했지만 당시엔 실패했다.

그 때 실패를 경험하며 삽질을 해서인지 아니면 이 책의 설명이 뛰어나서인지는 알 수 없으나 당시 나를 괴롭혔던 왜 SSD의 디폴트 박스가 8,732개가 나오고 입출력 차원이 원하는대로 계산되지 않았던 것인지 끙끙댈 때와 비교한다면 이 책이 가치를 느낄 수 있다. 이 모델을 처음접하는 독자에게 떠먹여 주는 정도가 아니라 아주 잘게 씹어 떠먹여주는 수준의 친절한 느낌을 받았다.

그렇기에 이 책은 딥러닝의 기본기를 다진 독자가 논문과 접하는 경계선을 탐험하고 스스로의 아이디어를 기존 모델에 접목, 변형해 보고 싶을 때 아주 좋은 무기가 될거라 생각한다.


3장은 PSPNet을 활용한 시맨틱 분할을 배운다. SSD가 무식하게 네모 박스로 감지했다면 얘는 좀 더 정교하게 픽셀 단위 그러니깐 물체의 모양 그대로 경계선을 그려 인식할 수 있다.

이 시점에서 책의 구성이 매우 돋보였는데 2장에서 거의 모든 것을 직접 구현해 기초를 다졌다면, 3장은 파인 튜닝을 활용한다. 뒤에 이어질 4장에서는 일부분을 직접 구현하도록 유도한다.

친절히 모든 것을 알려준 후, 타인의 연구를 응용하는 법을 배우며, 나아가 부족한 부분은 스스로 구현해보게 함으로써 수준높은 학습효과를 달성할 수 있다. 다른 이들은 어떨지 모르나 개인적으로 너무 마음에 드는 구성이다.


4장은 OpenPose 모델을 다루는 데 쉽게 말해 사람 이미지를 탐지할 경우 뼈다귀 형태의 사람을 추출하는 기술이다. 대략적인 방식은 아래 그림을 참조하기 바란다.OpenPose

이 장에서는 PAFs와 히트맵이 이 모델의 성능을 정교하게 끌어올리는 부분이 관심있는 부분이었다. 확실히 Vision 분야의 데이터여서 그런지 XAI 기법도 가능하고 해석력이 높은 모델인 점에 끌렸다.


5장은 GAN을 다룬다. 먼저 전통 GAN모델의 대표주자인 DCGAN으로 MNIST와 유사한 손글씨를 생성한 후 SAGAN에 대해 깊숙히 살펴본다.

이 장의 핵심은 Attention 모델이다. 특히 304p의 설명은 참 알기쉽게 잘 쓰여있다는 생각이 들었다. 원론, 수학적으로 크게 부족한 내용없이 소스 코드 구현과정을 통해 명확하게 이해할 수 있게 쓰여있어 인상적이었다. 더불어 308p의 스펙트럴 정규화도 참 알기쉽게 설명을 잘하고 있어 논문이나 교과서의 내용이 어렵다면 이 책을 통해 진입장벽을 낮춰 접근하는 것도 좋은 방법이 되리라는 생각한다.


6장은 AnoGAN이 메인 주제이다. 정상데이터에 대한 모델 학습 후 판별자 뿐만아니라 생성자도 활용하여 이상 이미지를 검출하는 방법을 다룬다.

이 장 역시 앞서 언급했던 손실함수 변형을 통한 문제 해결 능력을 키워주는 부분이 장점인 파트이다. 구현만이 아닌 이론, 수학적 차원에서 고민을 해결하고자 할 때 저자의 접근방식에서 힌트를 얻을 수 있을 것이다.


7장 ~ 8장은 NLP를 다루는 데 특히 Transformer, BERT가 핵심이다. 이를 통해 자연어 감정분석을 다루는데 5장의 Self-Attention에 이어 Attention이 언어에 어떻게 적용되는지 또 한 번 Attention의 본질과 응용 방법을 익히기 좋은 장이다.

문맥과 어순 즉, Sequence여야한다는 NLP의 고정관념을 깬 아이디어가 어떻게 BERT까지 이어지게 되었는지 논문 리뷰하듯 상세히 분석해주는 것이 장점이다.

단, 일본어를 예제로 다루고 있어 일본어 지식이 전무한 나같은 독자는 예제를 쉽게 이해하기 힘든 것이 단점이지만 그럼에도 Attention과 BERT의 핵심을 너무 잘 전달하고 있어 반드시 읽어둬야 하는 파트이다.


마지막 9장은 ECO 모델이 등장한다. 이는 동영상을 분류하는 알고리즘인데 마지막 장이어서인지 학습이나 파인튜닝의 소스는 독자 스스로 구현해봐야 한다. 앞서 언급한대로 개인적으로 매우 마음에 드는 구성이다.

이 모델은 2차원 CNN으로 작은 크기의 피처를 추출한 뒤 C3D 모델에 입력하는 것이 핵심이다. 아직 구현해보지 않았는데 공부도 조금 더 필요하고 아껴두는 마음으로 남겨뒀다. 이 장에서 스스로의 구현 능력을 얼마나 완성시킬 수 있느냐에 따라 앞으로의 새로운 연구의 구현, 응용의 미래가 달려있다 생각했기 때문이다. 일종의 시험치르는 느낌이었다.


책을 읽으며 워낙 배운 것도 많고 느낀 것도 많아 쓰다보니 리뷰가 너무 길어진 것 같다. 내용이 너무 길어지는 듯 싶어 써가며 나름 핵심만 남기고 줄였음에도 이렇게 길어질 정도로 이 책에서는 배우고 느낄만한 점이 정말 많다.

서두에 언급했듯 근래에 보기드문 중급서 교과서가 등장했다. 나 혼자만의 의견일진 모르겠지만 적어도 내겐 핸즈온 머신러닝, 머신러닝교과서, 밑바닥 시리즈 등과 비교해도 손색이 없을 정도의 완벽한 책이라는 생각을 했다.

거인의 어깨를 빌려 배우고, 응용하며 자신만이 가진 문제를 딥러닝으로 해결하고 싶다면 혹은 그 단계로 나아가기 위해 기초 수준에서 어려움을 겪고 있다면 강력히 추천하고 싶은 책이다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo