핸즈온 비지도 학습 - 텐서플로, 케라스, 사이킷런을 활용한 알고리즘과 방법론, AI 활용 사례
안쿠르 A. 파텔 지음, 강재원.권재철 옮김 / 한빛미디어 / 2020년 7월
평점 :
장바구니담기


[이 글은 출판사의 지원을 받아 작성하였습니다]

겉면

결론부터 얘기하자. 이 책 추천한다.

출판사에게 지원을 받아서 그런 게 아니다. 책을 보면 안다. 이 책은 번역서지만 번역서라고 하기 어려울 정도로 역자들이 공을 많이 들인 흔적이 보인다. 국내서적과 번역서 그 사이 어딘가 혼혈서적? 그 정도라고 분류하면 좋을 정도로 역자들은 기초적인 개념부터 어려운 개념까지 주석을 달아주었다.

역자들이 주석을 단 모습

책 자체는 엄청 특별한 내용을 담고 있는 책은 아니다. 제목 <핸즈온 비지도학습>이라는 이름에 걸맞게 딱 그렇게 비지도학습에서 어떤 기법이 있고 어떤 목적으로 사용되며 그 속에서 주의할 점이 무엇이 있는지 알려주는 개론서로써 좋은 책이다. 물론 책 분량의 한계로 인해서 매우 자세히 다루진 않는다. 

완전 떠먹여주는 수준까지 바라는 사람(나 또한 약간 그런 마음이 있다고 고백한다)이라면 약간 실망할지도 모르겠다. 하지만 대략적인 개념 정도는 잘 적어둔 편이니 보면서 익혀놓고 실무에서 필요하면 그 때 깊이 알아보는 것도 나쁘지 않을 방법이라고 생각한다.

이 책에서 6장 고객 세분화 부분이 가장 마음에 들었는데 데이터를 랜딩클럽의 고객 데이터를 가지고 실습하기 때문이다. 사실 어떤 기법도 중요하지만 다루는 데이터가 내가 관심이 있는 데이터인지, 그리고 기법을 통해 도출하는 결과가 내가 관심있는 것인지가 더 중요하다고 생각하기 때문에 6장이 마음에 들었다. 

그런 반면 MNIST를 3장과 5장에서 사용하는데 MNIST말고 다른 비즈니스 데이터를 사용할 수는 없었는지 아쉽다. 이 책을 보는 사람들은 단순히 비지도학습을 익히기 위해 보는 게 아니라 실무를 잘하려고, 포트폴리오 쌓으려고 하는거일텐데 그런 관점에서 MNIST데이터는 별로 흥미가 가지 않았다.

우선 7장까지만 공부하고 그 이후 신경망부분은 따로 시간을 내서 실습하려고 하는데 뒷 부분에 추천 시스템이 있어서 뭔가 흥미롭다. 

맞다. 그러고보니 이 책의 아쉬운점이 또 있는데 TF1.X 사용한다. 2.x 문법을 사용하셔야 하는 분이라면 아쉬우실 수 있다. 그럼에도 이 책은 개론서로서 충분히 가치가 있다고 생각한다. 




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
당신이 지금 알아야 할 빅4 클라우드 머신러닝 - 아마존, MS, 구글, IBM 클라우드 기반 머신러닝 이론 및 실습
이영호 지음 / 비제이퍼블릭 / 2020년 3월
평점 :
절판


[이 글은 출판사의 지원을 받아 작성하였습니다]


AWS, Azure, GCP와 같은 클라우드는 개발하는 사람이 아니더라도 한번쯤 들어보거나 기사를 읽어본 세상이 되었다. 예전에 학교에서 공부할 때 경영정보학 교과서에서도 클라우드에 대한 언급은 있었지만, 그 때가 이른 시기여서 그런지 아니면 개발공부를 하지 않아서 그런지 몰라도 이 정도까지 대중적이라고 느끼진 못했다. 마치 '빅데이터'처럼 말이다.


기술이 어떤 상태에 있는지 보여주는 하이프 사이클 - 출처 : 나무위키


내 느낌적인 느낌으로 클라우드는 이미 Plateau of Productivity 상태에 들어섰다고 생각했는데 과연 가트너는 어떤 의견을 냈을지 궁금했다.


출처 : https://www.gartner.com/en/newsroom/press-releases/2019-10-14-gartner-s-2019-hype-cycle-for-it-in-gcc-indicates-pub 


19년 10월 기준으로 Public Cloud Computing은 Inflated Expectation을 겪고 조금씩 trough of disillusionment, 즉 환멸의 굴곡기를 향해 달려가고 있는 상태라고 가트너는 진단한다.


제대로 Plateau, 즉 stable한 상태에 도달하려면 10년이나 걸린다고 진단하는데 과연 그럴까? 지금 확산속도와 엔지니어들의 Position 배치를 볼 때 나는 더 빠를거라고 생각이 드는데.. 뭐 가트너의 생각이니까.


책에 대해서 쓰기전에 이런 잡소리를 쓰는 이유는 이 책의 느낌이 딱 이런 느낌이기 때문이다. 


기술서적이라기보다는 보고서 느낌?


AWS 사용 사례 설명 부분


어쩔 수 없는 부분이긴 하다. AWS만 해도 다루는 책들 보면 다들 두꺼운 책 한 권 나온다. 그런데 4개의 클라우드를 다 설명하겠다고 하고 앞부분에선 ML 개론까지 써놓았으니(100여 페이지가 ML개론이다... 여기서 뭔가 직감했다).. 이 부분이 엄청 아쉬웠는데 ML개론은 요새 모르는 사람이 없고(내 편견일 수 있지만) 인터넷 검색하면 다 나오니 없애거나 핵심적인 부분 몇개만 적고 넘어가는게 낫지 않았을까 싶다. 

그래도 다르게 생각해보면 엔지니어 입장이 아닌 기획자의 입장에서 깊이알기보다 보고서나 기획서, 정부과제 사업계획서를 써야 하는데 인터넷 봐도 뭔 소리인지 모르겠는 사람들에겐 유용할 수 있겠다는 생각이 들었다. 참고할 Reference에 대해서 써있고 그리고 대충 어떤 기능을 하는지 개념 설명이 되어있기 때문이다.

생각해보니 이 책을 고른 이유는 뭔가 빠르게 핵심만 익혀서 지름길을 가고 싶은 욕심때문이었다. 내 꾀에 내가 당한 꼴이었다.


엔지니어라면 자기 욕심 채우지 못할거 뻔히 알면서 이 책 잡고 괜히 성질내지 말고 시중에 많은 클라우드 서적을 잡자. 지름길 없는거 뻔히 알잖는가.


과제계획서/보고서 써야하는 기획자라면 빠르게 익히고 필요한 Reference따서 쓰자. 그러다 재미생기면 그때 제대로 ML 공부하면 된다.




댓글(0) 먼댓글(0) 좋아요(1)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
신경망 교과서 - 6개 프로젝트로 제대로 배우는 신경망의 기본기
제임스 로이 지음, 이춘오 옮김 / 길벗 / 2020년 5월
평점 :
절판


이 글은 출판사로부터 책을 제공받아 작성하였습니다.


아마 이 책과 같은 길벗출판사였던걸로 기억하는데 모두의 딥러닝이라는 베스트셀러가 있다. 딥러닝 튜토리얼을 담은 책인데 그 책을 한국인 저자가 썼다면 이 책은 비슷한 내용을 외국저자가 쓴 느낌이다. 그렇기 때문에 모두의 딥러닝이란 책을 본 사람이라면 '어? 익숙한데?'라는 느낌을 받을거라고 생각한다.


물론 완전히 똑같진 않다. 모두의 딥러닝이 아주 기초부터 하나하나 설명해주고 하나하나 꼭꼭 씹어서 먹여주는 느낌이라면, 이 책은 말그대로 '튜토리얼'에 집중한 책이다. 바로 코드부터 쓰자고 한다. 만약 아예 아무것도 모르는 사람이라면, 당황스러울 수 있다. (물론 그런 분은 이 책을 잡지 않겠지만)

이 책은 당뇨예측, 택시요금예측, 이미지분류, 이미지 노이즈 제거, 영화 리뷰 감성 분석, 안면인식 총 6개의 튜토리얼을 다루고 있으며 컴팩트하게 구성된 튜토리얼이기 때문에 코드를 따라치다보면 대충 느낌 온다.

'아 여기에 Layer이렇게 쌓아야 하는구나'
'여기에 adam optimizer 쓰고 task가 분류니까 binary_crossentropy 써야지' 

6개의 튜토리얼을 조금씩 따라하다보면 금방 각 나온다.

딥러닝이라고 하면 무조건 GPU를 떠올리기 마련인데 다행히 튜토리얼은 GPU까진 필요없다. CPU만 있어도 충분히 돌릴 수 있으니 그런 걱정 말고 궁금한 사람은 그냥 돌리면 된다. 

환경셋팅은 이미 yml파일을 해주었으니 그냥 하라는대로 conda virtual environment만 구성해주면 된다.




딥러닝 좀 하시는 분들이라면 이 책이 재미없을거라고 생각한다. 실전과는 거리가 있고, 튜토리얼 수준이기 때문이다. 하지만 파이썬 조금하다가 딥러닝이 궁금하신분들, 이런저런 이론보다 실전으로 경험하고 싶으신 분들에게 이 책을 추천드리고 싶다. 번역서임에도 매끄럽게 번역되어 있어서 따라하기 쉽기 때문이다.





댓글(0) 먼댓글(0) 좋아요(1)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
딥러닝과 바둑 - 알파고를 능가하는 바둑봇을 만들며 익히는 딥러닝, 강화학습
막스 펌펄라.케빈 퍼거슨 지음, 권정민 옮김 / 한빛미디어 / 2020년 6월
평점 :
장바구니담기


이 글은 출판사로부터 책을 제공받아 작성하였습니다.


OOP를 평소에 많이 쓸 일이 있지 않다보니 이 책을 따라하면서 많이 어려웠다. 그리고 솔직히 고백하자면 요새 이사한다 뭐한다 바쁜 일들이 있어서 이 책을 아직 끝까지 따라하지 못했다. 그 말은 강화학습 구현까지 가지 못했다는 얘기다. 그렇기에 내 리뷰는 책의 앞부분 느낌에 대한 리뷰라고 해야 정확하다.



책은 어떤 함수를 적고 그 함수에 대한 의미 설명을 적어놓으며 계속해서 Tutorial을 제공한다. 사실 뭐가 뭔지도 모르고 그냥 따라치게 된다.



완전히 OOP를 모르는 분이라면 이 책을 잡기를 추천하지 않고 싶다. 아마 그런 분이라면 그냥 알파고라고 하기에 흥미로워서 이 책을 잡으려 하겠지만, 알파고고 뭐고 간에 결국 프로그래밍이다. 파이썬부터 OOP 언어이기 때문에 OOP를 활용하지 않고 구현을 한다는 건 말이 안된다.


만약 잘 몰라도 따라해보고 싶으신 분은

https://www.youtube.com/watch?v=fk8a-U46FSg&list=PL2P1Vm9k53HOflCAdyYaOx7hfBHydWNcL&index=33


이런 OOP강의를 들으시면서 따라하면 될 듯 하다. 사실 나부터도 OOP를 그리 잘 아는편이 아니라서;; 


평소에 Jupyter를 열어서 간단한 Pandas 분석을 주로 사용하는 사람들(나 포함)에게 책은 분명 낯설거라고 생각한다. 그치만 뭐 1달 내에 알파고를 구현못하면 해고되는 것도 아니고 천천히 음미하며 해도 된다. 특히나 딥러닝 구현은 간단한 Jupyter로 안되고 OOP를 이용해서 복잡한 모델을 구현해야 하기 때문에 이 책을 보며 꾸준히 따라치다보면 분명 딥러닝 구현을 하는데 도움이 될거라고 생각한다. (정신승리라도 해야 버티지 이런거라도 없음 버티질 못한다)


어떤 책에선 코딩 패러다임이 바뀌었다며 매우 간단하게 모델 구현이 가능하다는 설명이 있지만, 아직 우리에겐 코딩 능력이 필요하다는 걸 깨우쳐준 책이다. 특히나 딥러닝 엔지니어가 되고 싶다면, 혹은 제대로 공부해보고 싶다면 Google Colab 켜지 말고 이 책을 보며 따라하는 건 어떨까 싶다.


고수의 코드를 따라할 수 있는 기회가 그리 많지 않다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
나만의 스마트워크 환경 만들기 - 파이썬으로 만드는 업무 자동화 프로그램
박찬성 지음 / 비제이퍼블릭 / 2020년 5월
평점 :
절판


구직활동을 하는데 있어 포트폴리오는 필수입니다.
그런데 막상 만들려고 보면 붕 뜨지요. 그럴 때 이 책을 잡고 실습해보세요. 도움이 되실겁니다

댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo