머신러닝 디자인 패턴 - 효율적인 머신러닝 파이프라인과 MLOps를 구축하는 30가지 디자인 패턴
발리아파 락쉬마난.세라 로빈슨.마이클 먼 지음, 맹윤호 외 옮김 / 한빛미디어 / 2021년 11월
평점 :
장바구니담기


본 포스터는 한빛미디어에서 [나는 리뷰어다]를 통해 책을 지원받아 작성한 리뷰 포스터입니다. 


 

34,200원으로 싸지는 않은 책이지만 그만한 가치는 하는 책이라고 생각합니다. 최근 AI가 많이 유행해짐에 따라서, 기업에서도 많은 수요가 생기고 학생 및 직장인분들도 AI 공부를 하는 상황입니다. 그래서, PyTorch, TensorFlow 등을 이용해서 CIFAR-10 등의 벤치마크 데이터를 돌려보거나 사이드 프로젝트를 하는 사람도 많아졌습니다. 

 

하지만, 기업의 채용공고를 보면 알겠지만 우대사항에 "모델 서빙을 직접 해본 경험이 있으신 분" 이라는 문구가 많이 생겨나고 있습니다. 모델을 만드는 것도 중요하지만, 이를 어떻게 배포하고 관리하는지 또한 중요한 영역이고 마침표가 되는 부분이기 때문입니다. 

 

이 책은 그러한 마침표의 이정표가 되는 책이라고 생각합니다. AI 리서치를 하시는 분들에게는 불필요한 책이겠지만 취업을 준비하는 학생분들과 엔지니어분들이 읽으시면, 도움이 많이 될거라고 생각합니다. 전체적으로 많이 만족한 책인 것 같습니다. 


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
만들면서 배우는 파이토치 딥러닝 - 12가지 모델로 알아보는 딥러닝 응용법
오가와 유타로 지음, 박광수 옮김 / 한빛미디어 / 2021년 8월
평점 :
장바구니담기


본 포스터는 한빛미디어에서 [나는 리뷰어다]를 통해 책을 지원받아 작성한 리뷰 포스터입니다. 

이번 책은 확실히 다양한 테스크(Image Classification, Object Detection, Semantic Segmentation, Open Pose, GAN, Anomaly Detection, Transformer 등)에 대해서 데이터 로더부터 모델을 직접 짜서 학습까지 연습할 수 있는 책입니다. 일반적으로 딥러닝 공부의 경우 논문을 읽는 것이 시작이기에, 데이터 로더를 어떻게 작성하고 네트워크를 짜야하는지에 대해서는 부족한 부분이 있습니다. 이미지 세그멘테이션 모델인 PSPNet을 예로 들면, Pascal VOC 데이터셋을 가져와서 이를 어떻게 로더로 불러올지, 모델을 어떻게 작성하고, 학습은 어떻게 하고 예측할지에 대해서 잘 작성되어있습니다. 특히, PSPNet 논문을 읽으면서 아쉬운 점은 PPM 구조에 대해서는 논문에 설명이 잘 나오지만 백본에 대해서는 설명이 없는데 그러한 부분까지 어떻게 구현되어있는지 잘 확인할 수 있습니다. 그렇기에, 이 책만 보더라도 해당 테스크의 베이스라인 코드를 작성하는데에는 두려움이 없이 참고할 수 있겠다라는 생각이 들었습니다. 

 

하지만, 구현체에 대한 코드 설명은 충분한데 논문 자체에 대한 설명은 부족해서 따로 논문은 읽어봐야 이해하기 수월하다는 점입니다. 그리고, 7장의 경우는 주석은 한글로 되어있는데 입출력은 일본어로 되어있어서 많이 아쉬웠습니다. 그래도, 개인적으로 올해 읽었던 딥러닝 책중에서는 가장 좋았던 책이라고 생각합니다. 코드 부분에 대해서 설명이 잘 나와있고, 테스크 또한 다양하게 있어서 대회를 주로 나가는 제가 참고하기에는 좋았습니다. 

 

요약하면, 딥러닝의 초급을 떼고 중급으로 넘어가는 분들에게 추천합니다. 특히, 코드에 대한 설명이 주를 이루고 기본적인 부분에 대해서는 설명이 없기에 초급자가 보기에는 어려울거라 생각합니다. 또한, 딥러닝 테스크의 여러 분야를 보고 싶은 분에게 추천합니다. 개인적으로 저는 연구분야인 세그멘테이션 이외에도 Object Detection, Anomaly Detection 등 다양한 분야를 공부하기에 좋았습니다. 하지만, 한가지 분야에 대해서만 공부하시는 분들이면 좀 부담스러운 책이 될 것 입니다. 


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
데이터 스토리 - 데이터를 설득력 있는 이야기로 바꾸는 방법
낸시 두아르테 지음, 권혜정 옮김, 윤영진 감수 / 한빛미디어 / 2021년 7월
평점 :
절판


본 포스터는 한빛미디어에서 [나는 리뷰어다]를 통해 책을 지원받아 작성한 리뷰 포스터입니다. 

 

기존의 많은 책들은 "데이터 분석"에 초점을 맞추었다면 이 책은 "스토리 텔링"에 맞추어져 있습니다. 데이터 분석 공모전을 하면서 항상 느끼는 점은 내가 분석한 내용을 어떻게 설명을 해야할지 였습니다. 같은 데이터를 가지고 분석한 팀원들에게도 내가 한 분석을 설명하기 어려운데 심사위원들에게 이를 어떻게 설명하고 이해시킬지 막막하기만 합니다. 안그래도 최근에 이러한 고민을 많이하게 되었고 7월 리뷰로 해당 책을 선택하게 되었습니다. 

 

초급이라는 난이도 답게 책 자체는 많이 쉬운 편이었습니다. 책의 페이지가 200를 넘어가지만 페이지 내에 글씨 자체가 적은편이라 읽는 시간이 오래 걸리지 않았습니다. 내용 자체도 "직관력 기르기", "의사결성자 파악하기", "이유를 제시해서 동기 부여하기" 등 당연한 내용들도 포함되어있습니다. 하지만, 전반적으로는 내용 자체가 괜찮았고 생각해볼만한 거리가 많았던 것 같습니다. 맥락이 의미를 부여하는 부분, 시각화를 어떻게 할 지, 여러가지 사례로 보여주는 부분이 되게 좋았던 것 같습니다. 


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
스파크를 활용한 실시간 처리 - 실시간 데이터 처리를 위한 고수준 스트리밍 API 마스터하기
제러드 마스.프랑수아 가릴로 지음, 김인범 옮김 / 한빛미디어 / 2021년 4월
평점 :
장바구니담기


본 포스터는 한빛미디어에서 [나는 리뷰어다]를 통해 책을 지원받아 작성한 리뷰 포스터입니다. 먼저 저는 대학원생이고 스파크의 경우 아예 처음이었습니다. 


 

1. 소개

Apach Spark는 SQL, 머신러닝 등을 위한 대규모 데이터 처리 분석 엔진입니다. 한마디로 빅데이터를 분석하기 위한 언어입니다. 보통 Hadoop과 스파크 둘 중 하나의 언어를 사용하는데, 구글 클라우드 잼의 글에서는 아래와 같이 비교를 한다고 합니다. 

Hadoop은 주로 디스크 사용량이 많고 맵리듀스 패러다임을 사용하는 작업에 사용됩니다. Spark는 더 유연하지만 대체로 더 많은 비용이 드는 인메모리 처리 아키텍처입니다. 각 기능을 이해하고 있으면 언제 어떤 것을 구현할지 결정하는 데 도움이 됩니다.

출처 : https://cloud.google.com/learn/what-is-apache-spark?hl=ko


책의 구성은 아래와 같이 5개의 부로 구성되어있습니다. 

  • 1부 : 스트림 처리의 기본 개념, 스트리밍을 구현하는 아키텍처의 청사진, 스파크의 내용 
  • 2부 : 구조적 스트리밍, 프로그래밍 모델, 비상태 변환에서 고급 상태 작업에 이르는 스트리밍 애플리케이션 
  • 3부 : 스파크 스트리밍. 구조적 스트리밍과 비슷한 조직에서 스트리밍 애플리 케이션을 생성하는 방법 
  • 4부 : 고급 스트리밍 기술에 대한 개념. 스트림 처리 문제를 해결하고 스파크 스트리밍을 통한 온라인 머신러닝의 제한된 공간을 조사하기 위해 확률적 데이터 구조와 근사 기법의 사용 
  • 5부 : 아파치 스파크 이외의 스트리밍 방식 

책의 언어는 자바의 함수형 언어인 스칼라로 구성되어있습니다. 

2. 후기

결론부터 말하면 아쉬움이 남는 책이었습니다. 제가 스칼라도 모르고 스파크도 모르기에 공부하는데 어려움이 컸습니다. 아는 게 없어서인지 글 자체가 아예 안 읽히는 느낌이었습니다. 


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
러닝 SQL - 데이터 생성, 검색, 조작까지 데이터 제대로 주무르기
앨런 볼리외 지음, 류수미 외 옮김 / 한빛미디어 / 2021년 3월
평점 :
절판


본 포스터는 한빛미디어에서 [나는 리뷰어다]를 통해 책을 지원받아 작성한 리뷰 포스터입니다. 먼저 저는 대학원생이고 SQL의 경우 기본적인 강의와 코딩테스트용으로 잠시 준비했음을 미리 밝힙니다. 

 

SQL의 경우 필요한 데이터를 추출하고 정제하기 위해서 많이 사용하는 언어입니다. 실제로 데이터 분석가의 필수역량 중 하나로 SQL을 잘해야한다는 얘기도 많이 들었습니다. 저도 그래서 개인적으로 SQL의 인강을 듣고 코딩테스트를 준비하면서 기초적인 역량은 쌓았지만, 다른 언어들에 비해 많이 헷갈리는 부분들이 많았습니다. 

 

해당 책의 경우 읽으면서 부담감이 없이 읽혔습니다. 개인적으로 좋았던 부분은 많은 예시와 실습이 있어서 많은 연습을 해볼 수 있는 점입니다. 데이터 베이스에 대한 개념부터 시작해서 각종 쿼리에 대한 부분까지 다루니 기본서로 SQL을 입문하시는 분들에게 추천드리는 책입니다. 


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo