fastai와 파이토치가 만나 꽃피운 딥러닝 - 박사 학위 없이 AI를 폼나게 구현하는 법
제러미 하워드.실뱅 거거 지음, 박찬성.김지은 옮김 / 한빛미디어 / 2021년 8월
평점 :
장바구니담기


머신러닝, 딥러닝을 수학적으로 잘 풀어준 교육, 교재는 많다. 아무래도 수학이 장벽으로 느껴지곤 하니 아예 딥러닝 관련 수학을 알려주는 교육과정과 책도 꽤 있다. 그런데 좀 색다른 책이 나왔다.


딥러닝 교재의 기본 스타일은 Coursera의 Deep learning specialization 과정이다. (https://www.coursera.org/specializations/deep-learning) 어지간한 인공지능 이론/실습 과정은 선구적인 이 교육과정의 영향을 받았다고 해도 과언이 아닐 것이다.


그래서 책 안내를 접하고 기대 반 걱정 반이었다. 일단 딥러닝의 원리를 수학 공식을 들먹이지 않고 설명하는 것에 감탄했고 컬러 인쇄를 해서 뭔가 더 다가가기 쉬웠으나, TensorFlow나 PyTorch가 아닌 fast.ai를 통해 배우면 결국 실전에 돌입할 때에는 머신러닝 프레임워크를 새로 배워야 하지 않는가 하는 걱정이었다. 더구나 다른 입문서는 책이 얇은 편인데 700쪽이 넘는 두꺼운 책이라 분량이 도리어 장벽이 되지 않을까 우려가 되기도 했다.


드롭아웃이 12장이나 되어야 나올 정도로 딥러닝 원리를 풀어 나가면서도, 이미지와 자연어를 막론하여 다양한 데이터를 찬찬히 다루어 나갔다. 700쪽이 넘는 이유는 설명이 다방면에 걸친 데이터를 상세하게 다루었기 때문이었다. 에포크와 배치를 늘이고 줄이는 노하우도 눈에 들었다. 다방면으로 원리를 충분히 배우니 프레임워크를 바꾸더라도 어렵지 않게 적응할 수 있겠다는 생각이 들기도 했다.


2021년 기준으로 이 책이 다루지 않는 인공지능 주제는 없다시피하다. 실제 현장에서는 모델을 경량화하곤 하는데, 그런 주제만 다루지 않는 편이다. 파이썬 문법에 어려움을 겪지 않는 수준이라면, 검색 좀 섞어서 이런 저런 프로그래밍 예제를 풀 수 있는 사람이라면 이 책으로 인공지능을 시작해도 괜찮다고 본다. 아니면 개념 검증 차원에서만 계속 fast.ai를 사용하고, 본사업은 전문업체에 맡겨서 진행해도 좋겠다. 강인공지능이 나오기 전까지는, 한 번 보고 꽂아놓고 잊어버릴 게 아니라 현안을 새로 만날 때마다 다시 열어 볼 만한 책이다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
데이터 스토리 - 데이터를 설득력 있는 이야기로 바꾸는 방법
낸시 두아르테 지음, 권혜정 옮김, 윤영진 감수 / 한빛미디어 / 2021년 7월
평점 :
장바구니담기


10여년 전 '파워포인트 블루스'(http://www.demitrio.com/?page_id=4431)와 더불어 PPT가 가치를 많이 담을 수가 있음을 알려줬던 'slide:ology - 위대한 프레젠테이션을 만드는 예술과 과학'(https://www.hanbit.co.kr/media/books/book_view.html?p_code=B6957570029) 낸시 두아르떼(Nancy Duarte) 대표가 신작을 냈습니다.


인공지능, 빅데이터 업계에서 계속 일하다 보니 낸시 두아르떼 대표가 데이터를 가지고 무슨 얘기를 했는지 참 궁금했습니다. 역시나 그의 전문 분야로서 데이터를 다루었기에 데이터 분석가나 모델러가 보면 기술을 직접적으로 언급하지 않아 다소 실망스러울 수도 있지만, 고생해서 얻어낸 통찰력을 시각화하여 경영진이 의사결정하도록 이끌어 나가는 면에서는 상당한 혜안을 전해줍니다.


데이터를 찾아내고 어떻게든 확보하여 정제 가공하며 시행착오 끝에 모델을 만든 이후를 주로 이야기하는 책이긴 해도, Plan-Do-Check-Act 관점에서는 Plan과 Check 단계에 유용한 조언이 많이 나옵니다. 파워포인트 장표라면 다들 학을 뗄 사람이 천지라는 상황을 저자 역시 잘 아는지 경영자 성향에 맞춰서 다양한 밀도로 문서를 생산하도록 설명합니다.


주제 설명과 이를 요약한 장표가 함께 한다는 게 특기할 만합니다. 이 정도면 거의 가져다가 바로 쓸 만하게 보이는 장표와 아이디어도 있습니다. 제본 여백과 접힘까지 고려한 페이지 구성도 눈에 듭니다.


무엇보다 장표와 발표를 잘 아는 경영자가 썼다는 점이 가장 주목할 만합니다. 이 책 중간 중간 경영진은 이런 제약을 극복해야 한다든가 어떤 어려움을 겪고 있다든가 무엇을 바란다든가에 대해 계속 이야기합니다. 이렇게 분명하고 알아들을 만하게 요구하는 경영진이 많지 않은 만큼 참 소중한 책이라 해도 지나치지 않겠습니다.



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
고성능 파이썬 - 파이썬 성능 잠재력을 끌어내는 실용적인 개발 전략서, 2판
미샤 고렐릭.이안 오스발트 지음, 오현석 옮김 / 한빛미디어 / 2021년 5월
평점 :
장바구니담기


Python 입문서나 Python 머신러닝/딥러닝(Tensorflow, PyTorch 등) 입문서를 떼고, 소소한 과제가 아닌 경진대회나 실제 업무를 접하면 필연코 한계를 절감합니다. 성능, 속도 같은 한계에 부딪히기도 하지만, 이 코드가 돌아가는데 왜 돌아가는지 이 방법과 저 방법의 차이가 무엇인지 모르는 답답함도 정말 사람 속을 뒤집어 놓습니다.

이런 때에 읽어 보길 권합니다. 이 책을 입문서를 떼기 전에 봤다면 그냥 미리 사 둬도 좋습니다. 어차피 겪을 문제라서 구글 검색부터 하느라 시간을 많이 보내기 보다는, 구글 검색을 하더라도 이 책으로 시작하면 필요한 결과를 더욱 빨리 찾을 겁니다.

우리나라는 특히 많은 Java 개발자가 파이썬을 익힐 때에도 이 책은 쓸 만합니다. 파이썬이 어떤 특장점으로 인기가 있는지 설명하며 목차를 훑어 봐도 Java에서 했던 개발작업에 상응하는 부분이나 파이썬스럽게 할 수 있는 방법을 알려 줍니다. 저도 Python은 나중에 배웠는데 기본 함수보다 Numpy를 많이 쓰는 이유를 몰랐던 기간이 길었습니다. 물론 이 책을 보고 안 것은 아니지만(검색을 했죠.) 더 빨리 알았다면 쓸 데 없는 고집을 부리지 않고 더 효과적으로 개발할 수 있었겠다는 생각은 듭니다. Cython이나 다른 성능향상 방안도 소개가 잘 되어 있습니다. 용기내어 해볼 만하겠습니다.

더불어 비동기 I/O나 multiprocessing을 다룬 장도 고개가 끄덕여졌습니다. 팀원들이 실제로 개발할 때에 꼭 신경쓰거나 적용해야 했던 모듈입니다. 알고 입사했던 팀원도 있지만, 들어와서 열심히 익힌 팀원도 있었습니다. GPU와 docker를 다룬 장도 흥미로웠습니다. 분량이 많지는 않은데, 이 책을 통해 존재를 알았다면 필요한 주제를 검색해내기가 더 쉬워질 거라 봅니다. 이런 식으로 파이썬 요소 요소에서 성능을 높힐 팁이 빼곡합니다. 1판부터 더 일찍 만났으면 좋았겠습니다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
MongoDB 완벽 가이드 - 실전 예제로 배우는 NoSQL 데이터베이스 기초부터 활용까지, 3판
크리스티나 초도로우 외 지음, 김인범 옮김 / 한빛미디어 / 2021년 3월
평점 :
장바구니담기


몽고DB가 충분히 원숙해진 후인 3.4 버전 때에 경험 많은 엔지니어에게 배우며 적당한 트래픽 환경에서 운영했던 행운을 누렸던 터라, RDB를 굳이 쓰지 않아도 되는 사안에는 자연스럽게 몽고DB를 기준으로 생각하곤 합니다. 그러다 보니, <몽고DB 완벽 가이드(3판)>는 세 번째 읽는 몽고DB 교재입니다.


실전 예제로 배우는 NoSQL DB라는 홍보문구 답게 질의 예제를 충분히 다룹니다. 더불어 운영 관점에서 복제(replica)와 샤딩과 더불어 서버 관리와 모니터링에 분량을 상당히 할애합니다. 몽고DB를 몽고DB 답게 하는 Replica와 sharding 내용이 충분한 편입니다. 몽고DB와 Spark를 엮어 쓰며 고생스러웠던 적이 몇 번 있었던 경험이 떠올랐습니다. 설치/배포 관련해서도 리눅스 운영체제 설정이나 가상화 관련해서도 조언을 줍니다.제가 처음 배우던 때에 이런 책이 있었으면 좋았겠습니다.


3판은 버전 4가 나온 후에 나왔기에 버전 4의 강점에 대해서도 많이 다룹니다. 일례로 공간 정보(Geospatial) 인덱스 예제가 참 상세해서 만족스러웠습니다. 몽고DB가 지도 기반 서비스에도 아주 효용이 크다는 점을 아주 잘 알 수 있었습니다. 텍스트 검색 관련 예제도 마찬가지로 볼 만했습니다.


다만, WiredTiger Storage Engine 외에 In-Memory Storage Engine도 언급은 할 법한데 제가 놓쳤는지는 몰라도 다루지 않았습니다. 대세 엔진은 아닌지 모르겠지만 Redis를 굳이 쓰지 않아도 되는 좋은 선택지 중 하나라고 보았으므로 살짝 아쉬웠습니다. 번역 면에서는 한국어로 번역한 용어를 처음 언급할 때나 소제목으로 쓸 때에는 영어 원문을 병용하면 좋았을 텐데 일관적이지 못합니다. 해당 기능을 익히는 데에는 별 문제가 없긴 하겠습니다.


버전 4.0이 나온지 엊그제 같은데 4.2를 거쳐 벌써 4.4 버전이군요. 발전이 참 빠릅니다. 때문에 내년쯤 되어 팀원이 몽고DB 교재를 필요로 한다면 새로 나올 책을 사야 하지 않을까 싶기도 합니다. 이 책도 4판이 나오려나요? 기대하고 있겠습니다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
GAN 첫걸음 - 파이토치 신경망 입문부터 연예인 얼굴 생성까지
타리크 라시드 지음, 고락윤 옮김 / 한빛미디어 / 2021년 3월
평점 :
절판


타리크 라시드 씨가 <신경망 첫걸음>에 이어 <GAN 첫걸음>을 내놓았습니다.

<신경망 첫걸음>이 제게 참 유익했기에 이번 책도 평소 관심사와 엮여서 무척 기대했습니다. 팀 업무에 쓸 머신러닝 학습 데이터가 부족해서 만들어 볼까 생각해 왔던 중이었기 때문입니다.

내용은 정말 알찹니다. 저자가 입문자인 독자를 배려하여 Google Colab을 써서 실습하도록 했기에 장소에 구애 받지 않고 공부하기에도 딱 좋습니다.

그러나 읽고 나서 첫번째로 들었던 생각은 독자 대상이 좀 애매하지 않은가 하는 의문이었습니다. 이 책은 <신경망 첫걸음> 다음으로 나오기는 했지만 후속작은 아닌 모양입니다. <신경망 첫걸음>을 실습까지 마친 독자에게는 초반이 다소 심심할 수 있습니다. 반대로 읽지 않았던 독자는 전작을 신경 쓸 필요 없이 설치와 설정을 거의 신경 쓰지 않아도 되는 Colab 환경에서 맘편히 GAN 공부를 시작할 수 있습니다.

두번째로 든 생각은 너무 짧다는 아쉬움이었습니다. GAN 하면 먼저 떠오르는 사람 얼굴 합성을 좀 다루다 끝나는 느낌을 받았습니다. 사진을 명화 스타일로 변환하기도 기대했는데 말입니다. 저자는 머리말에서부터 GAN의 모든 것을 다루지 않는다고 선언했으니 원망할 도리는 없습니다. 이 책이 잘 팔려서 GAN 두걸음 같은 후편이 나와줘도 좋겠습니다. 홀로서기를 달성한 개발자라면 이 책만으로도 충분하긴 할 겁니다. 좀 더 곱씹어 보고 실습하며 체득하렵니다. 그게 정석이겠습니다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo