파이토치로 배우는 자연어 처리 - 딥러닝을 이용한 자연어 처리 애플리케이션 구축
델립 라오.브라이언 맥머핸 지음, 박해선 옮김 / 한빛미디어 / 2021년 6월
평점 :
장바구니담기


인공지능, 머신러닝 입문서 저자들은 고민할 겁니다. 인공지능의 어디에서부터 시작해야 할까는 정답이 없는 주제입니다. 텐서플로나 파이토치와 같은 프레임워크를 기준으로 한 교재는 인공지능의 여러 주제인 이미지 처리, 자연어처리, 회귀 정도를 입문 수준에서도 쉬운 정도로 다룰 수밖에 없습니다. 실제로 써먹으려면 주제 중 하나를 깊이 있게 다룰 줄 알아야 하는데, 바로 이 책이 자연어처리 주제로는 입문서 다음에 읽기 좋도록 잘 기획한 중급서입니다.


중급서라고 해도 긴장할 필요는 없습니다. 입문서 내용을 많이 까먹었더라도 Python이나 Anaconda를 설치해서 쓸 줄 알거나, Google Colab에 접속해 쓸 줄 알면 이 책을 시작할 수 있습니다. 합성곱 행렬같이 중요한 요소는 이 책에서 다시 설명해 줍니다.


아쉬운 부분이 있다면 번역서이다 보니 한국어를 직접적으로 다루지 않았고, 입문서는 아니다 보니 나름 친절한 서술이 많아도 대뜸 나오는 듯한 내용도 꽤 있습니다. 다행히도 역자가 세심하게 주를 달아 놓아 당황스러움을 달래 줍니다. 중후반에는 어려운 개념이 꽤 나오는데, YouTube에서 해당 개념을 검색하여 강의 영상을 보는 것도 도움이 됩니다. 293쪽에 자연어처리 전반을 꾹꾹 눌러 담은 책이라 머신러닝에 능숙하지 않으면 어려울 수밖에 없는 설명도 좀 나옵니다. BERT/GPT와 같은 transformer 계열 언어 모델은 다루지 않기도 합니다만 책 분량을 생각하면 무방합니다.


여전히 명확한 정규식과 워드 임베딩을 많이 쓰는 실제 업무현장 사정을 감안하면 자연어처리 중급서로서 이만치 충실한 책도 드물다고 봅니다. 이 책을 떼고 한국어 자연어 처리를 다룬 책을 찾아보길 권합니다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
구글 BERT의 정석 - 인공지능, 자연어 처리를 위한 BERT의 모든 것
수다르산 라비찬디란 지음, 전희원.정승환.김형준 옮김 / 한빛미디어 / 2021년 11월
평점 :
장바구니담기


이 책을 3장까지 읽고 든 생각은 '아이고, 수학공식이 별로 없는 수학책이구나'였습니다. 어쩐지 BERT부터 허깅페이스에 BERT의 파생 모델, BERTSUM 등 세세한 내용을 다루다가, 막판에는 한국어 모델인 KoBERT, KoGPT2까지 한 권에 죄다 다룬다고 해서 덥석 클릭했습니다만, 이걸 장점으로만 여겨서는 안 되었습니다.


그렇다 해도 몹쓸 책은 아닙니다. 제가 속한 팀에서는 이런 저런 자연어 처리를 하는데 팀원들이 실제로 운영 서비스에 쓰는 기술들이 이 책에 많이 담겼습니다. 그래서 이 책을 고르기도 했던 것입니다. 다만 이 책을 잘 소화하려면 책만 읽어서는 힘들 거라고 봅니다. 책 초반에 소개하는 아래 GitHub 프로젝트를 방문하여 코드를 열어 보길 바랍니다. 

https://github.com/PacktPublishing/Getting-Started-with-Google-BERT 


코드와 같이 읽으면 훨씬 낫습니다. 그런데 코드를 잘 읽으려면 PyTorch를 먼저 알아둬야 합니다. 

https://www.aladin.co.kr/search/wsearchresult.aspx?SearchTarget=Book&SearchWord=PyTorch


이걸 알아야 실습을 해보겠지요.

물론 수학적사고가 체화된 독자라면 술술 읽힐 거라 봅니다. 그렇더라고요. 부럽습니다.


마지막으로, 본문의 연습문제 해답은 부록으로 있습니다. 참 다행입니다. 그러고 보니 학부 교재로 써도 좋을 분량이 아닐까 합니다. 자연어처리 II 정도 되는 과정에 알맞겠습니다. 다시 말해 자연어처리를 처음 공부하는 참이라면 자연어처리 입문서를 먼저 읽는 게 좋습니다. Word2Vec을 모르는 채로 이 책을 읽어서는 놓치는 부분이 많을 겁니다. 기왕이면 PyTorch를 활용하는 자연어처리 입문서가 낫겠습니다.

https://www.aladin.co.kr/search/wsearchresult.aspx?SearchTarget=Book&SearchWord=PyTorch+%EC%9E%90%EC%97%B0%EC%96%B4%EC%B2%98%EB%A6%AC&x=0&y=0


싫은 소리를 먼저 하기는 했지만, 인공지능 주제로는 입문서만 범람하는 와중에 아주 소중한 심화서입니다. 이런 책이 아니면 인터넷 바다를 정처 없이 헤매야 합니다.


댓글(0) 먼댓글(0) 좋아요(2)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
제대로 배우는 수학적 최적화 - 최적화 모델링부터 알고리즘까지
우메타니 슌지 지음, 김모세 옮김 / 한빛미디어 / 2021년 9월
평점 :
장바구니담기


인공지능 시대라 해도 최적화는 다양한 층위의 기술을 죄다 써야 현안을 해결할 만하다고 단언하는 바이다.

한빛미디어에서 출간한 책을 여러 권 읽어 오면서, 이제서야 내가 배우고 싶은 주제만 오롯이 달달달 설명한 책을 만났지만 마음이 복잡해졌다. 부끄럽게도 수학에 능숙한 편이 못 되어 제대로 배우기 힘들었기 때문이다. 이 책에 나오는 여러 개념이나 기법을 이 책을 통해 처음 접했다면 이 책을 끝까지 읽어내기도 힘들다. 고교수학에 어느 정도 자신이 있는 이는 두려움 없이 도전해도 좋겠다.

목차를 보면 전통적인 최적화 외에 머신러닝과 유관한 내용도 꽤 되었다. 알고리듬 교재 같은 면도 있다. 최적화를 익힘에 있어 확실히 도움이 될 만한 책인데 진입장벽이 결코 낮지 않다. 뒷표지에 최적의 입문서 운운했지만 그렇지 못하다. 이 책에서 소개하는 입문서는 대체로 일본에서 출판했기에 소개가 도움이 되지 않는다. 답답해졌다.

모르는 사안은 달리 알아서 찾아 봐야 하겠지만, 이 책의 의의는 분명하다. 최적화라는 주제에 나오는 방대한 사안을 빠짐 없이 언급했기 때문이다. 최적화로 도서를 검색했을 때에 전통적인 내용만 다루거나 머신러닝 얘기만 하는 식으로 갈리는 게 실태라 이런 어려운 책도 분명히 도움이 된다. 용기를 내길 바란다. 영 힘들 때에는 일단 엑셀의 '해찾기' 기능부터 도전하면 좋다. 상당히 강력한 최적화 기능이다.



댓글(0) 먼댓글(0) 좋아요(1)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
fastai와 파이토치가 만나 꽃피운 딥러닝 - 박사 학위 없이 AI를 폼나게 구현하는 법
제러미 하워드.실뱅 거거 지음, 박찬성.김지은 옮김 / 한빛미디어 / 2021년 8월
평점 :
장바구니담기


머신러닝, 딥러닝을 수학적으로 잘 풀어준 교육, 교재는 많다. 아무래도 수학이 장벽으로 느껴지곤 하니 아예 딥러닝 관련 수학을 알려주는 교육과정과 책도 꽤 있다. 그런데 좀 색다른 책이 나왔다.


딥러닝 교재의 기본 스타일은 Coursera의 Deep learning specialization 과정이다. (https://www.coursera.org/specializations/deep-learning) 어지간한 인공지능 이론/실습 과정은 선구적인 이 교육과정의 영향을 받았다고 해도 과언이 아닐 것이다.


그래서 책 안내를 접하고 기대 반 걱정 반이었다. 일단 딥러닝의 원리를 수학 공식을 들먹이지 않고 설명하는 것에 감탄했고 컬러 인쇄를 해서 뭔가 더 다가가기 쉬웠으나, TensorFlow나 PyTorch가 아닌 fast.ai를 통해 배우면 결국 실전에 돌입할 때에는 머신러닝 프레임워크를 새로 배워야 하지 않는가 하는 걱정이었다. 더구나 다른 입문서는 책이 얇은 편인데 700쪽이 넘는 두꺼운 책이라 분량이 도리어 장벽이 되지 않을까 우려가 되기도 했다.


드롭아웃이 12장이나 되어야 나올 정도로 딥러닝 원리를 풀어 나가면서도, 이미지와 자연어를 막론하여 다양한 데이터를 찬찬히 다루어 나갔다. 700쪽이 넘는 이유는 설명이 다방면에 걸친 데이터를 상세하게 다루었기 때문이었다. 에포크와 배치를 늘이고 줄이는 노하우도 눈에 들었다. 다방면으로 원리를 충분히 배우니 프레임워크를 바꾸더라도 어렵지 않게 적응할 수 있겠다는 생각이 들기도 했다.


2021년 기준으로 이 책이 다루지 않는 인공지능 주제는 없다시피하다. 실제 현장에서는 모델을 경량화하곤 하는데, 그런 주제만 다루지 않는 편이다. 파이썬 문법에 어려움을 겪지 않는 수준이라면, 검색 좀 섞어서 이런 저런 프로그래밍 예제를 풀 수 있는 사람이라면 이 책으로 인공지능을 시작해도 괜찮다고 본다. 아니면 개념 검증 차원에서만 계속 fast.ai를 사용하고, 본사업은 전문업체에 맡겨서 진행해도 좋겠다. 강인공지능이 나오기 전까지는, 한 번 보고 꽂아놓고 잊어버릴 게 아니라 현안을 새로 만날 때마다 다시 열어 볼 만한 책이다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
데이터 스토리 - 데이터를 설득력 있는 이야기로 바꾸는 방법
낸시 두아르테 지음, 권혜정 옮김, 윤영진 감수 / 한빛미디어 / 2021년 7월
평점 :
장바구니담기


10여년 전 '파워포인트 블루스'(http://www.demitrio.com/?page_id=4431)와 더불어 PPT가 가치를 많이 담을 수가 있음을 알려줬던 'slide:ology - 위대한 프레젠테이션을 만드는 예술과 과학'(https://www.hanbit.co.kr/media/books/book_view.html?p_code=B6957570029) 낸시 두아르떼(Nancy Duarte) 대표가 신작을 냈습니다.


인공지능, 빅데이터 업계에서 계속 일하다 보니 낸시 두아르떼 대표가 데이터를 가지고 무슨 얘기를 했는지 참 궁금했습니다. 역시나 그의 전문 분야로서 데이터를 다루었기에 데이터 분석가나 모델러가 보면 기술을 직접적으로 언급하지 않아 다소 실망스러울 수도 있지만, 고생해서 얻어낸 통찰력을 시각화하여 경영진이 의사결정하도록 이끌어 나가는 면에서는 상당한 혜안을 전해줍니다.


데이터를 찾아내고 어떻게든 확보하여 정제 가공하며 시행착오 끝에 모델을 만든 이후를 주로 이야기하는 책이긴 해도, Plan-Do-Check-Act 관점에서는 Plan과 Check 단계에 유용한 조언이 많이 나옵니다. 파워포인트 장표라면 다들 학을 뗄 사람이 천지라는 상황을 저자 역시 잘 아는지 경영자 성향에 맞춰서 다양한 밀도로 문서를 생산하도록 설명합니다.


주제 설명과 이를 요약한 장표가 함께 한다는 게 특기할 만합니다. 이 정도면 거의 가져다가 바로 쓸 만하게 보이는 장표와 아이디어도 있습니다. 제본 여백과 접힘까지 고려한 페이지 구성도 눈에 듭니다.


무엇보다 장표와 발표를 잘 아는 경영자가 썼다는 점이 가장 주목할 만합니다. 이 책 중간 중간 경영진은 이런 제약을 극복해야 한다든가 어떤 어려움을 겪고 있다든가 무엇을 바란다든가에 대해 계속 이야기합니다. 이렇게 분명하고 알아들을 만하게 요구하는 경영진이 많지 않은 만큼 참 소중한 책이라 해도 지나치지 않겠습니다.



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo