데이터 메시 - 효과적인 데이터 활용을 위한 데이터 메시 도입 가이드 I 데이터 메시 창시자 집필
세막 데그하니 지음, 이헌효 옮김 / 한빛미디어 / 2023년 12월
평점 :
장바구니담기


데이터 사용량이 기하급수적으로 커지면서 각각 다른 부서에 분산시키는 아키텍쳐인 데이터 메시가 주로 쓰일 것 같아 미리 공부해보려고 하는데 좋은 책이 나온 것 같아 기대됩니다!

댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
바로 쓰는 오라클 클라우드 - 마이크로서비스, 데이터 분석, 머신러닝 클라우드 네이티브 개발자를 위한 길잡이 에이콘 클라우드 컴퓨팅 시리즈
정영균.유정훈 지음 / 에이콘출판 / 2023년 11월
평점 :
장바구니담기


그동안 다른 클라우드 서비스를 써봤는데 유틸성을 높이기 위해 다른 클라우드를 공부하는 와중에 오라클 클라우드에 관련된 책이 출간되었다고 해서 기대됩니다!

댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
데이터 드리븐 리포트 - 상사와 고객을 설득하는 데이터 기반의 의사결정 with 파이썬
이상석 지음 / 한빛미디어 / 2023년 10월
평점 :
장바구니담기



대부분의 데이터 분석 관련 책들은 분석 자체에만 집중하는 경우가 많은데 이 책은 목적을 가장 중요하게 생각하고 알려주는 책이라서 마음에 들었다. 데이터 드리븐은 '데이터에 기반하여 의사결정을 하는 것'이다. 다른 말로 분석 결과를 통해 이해관계자들을 '설득'시켜야 한다는 것이다. 분석가들의 실질적인 목표인 보고를 위한 '보고를 위한 분석'에 중점을 둔 책이여서 데이터 분석이 업무에 들어가는 모든 직군이 읽어보면 큰 공부가 될 것이라고 생각한다. 또 보고 능력이 분석 능력에 비해 떨어지는 사람들을 위한 책이라고 한다. 데이터는 쌓는 자, 분석하는 자, 보고하는 자, 문제 해결자가 같은 사람일수록 큰 힘을 발휘한다. 요즘 등장하는 생성형 AI를 통해 이 간극이 좁혀지고 있지만 설득을 어떻게 해야하는지는 이 책을 통해 충분히 공부할 수 있다고 생각한다.



책 내용은 크게 데이터에 기반한 보고 방법, 구글 콜랩/파이썬/챗GPT를 실제 보고에 활용하는 방법, 보유한 데이터 특성에 따른 적절한 데이터 분석 기법 선정 방법, 데이터 분석 결과물을 바탕으로 설득 대상에 따라 효과적으로 의사소통하는 방법, 실제 분석 업무에 적용할 수 있는 단계별 실습 사례, 선형회귀분석을 통한 고객 설득 방법, 수치형/범주형 데이터에 적용하는 추론과 분류예측 방법, 텍스트 데이터에 적용하는 워드 클라우드와 토픽 모델링 방법이 있다. 각 사례 문단 첫번째에 요약이 있어서 핵심 내용을 빠르게 파악할 수 있고 QR코드를 통해 바로 예제 코드가 들어있는 콜랩에 들어갈 수 있어서 빠르게 예제를 실행해볼 수 있다.



또 챗GPT를 이용하는 방법 또한 기재되어 있어 어떻게 적용해봐야 하는지 알 수 있다. 아마도 이 책은 파이썬 기초 문법을 알고 데이터 분석을 해본 적 있는 직장인, 상사와 고객을 설득해야 하는 데이터 분석가 기존의 보고 방식을 뛰어넘어 예측 가능하고 선제적인 분석 기법을 알고 싶은 사람, 분석 업무에 챗GPT를 활용하고 싶은 사람, 데이터 분석 자격증과 실무를 동시에 고민하고 있는 사람이 읽는다면 큰 도움이 될 것이다.


"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
Mathletics - 수학으로 풀어보는 스포츠
웨인 윈스턴.Scott Nestler.Konstantinos Pelechrinis 지음 / 영진.com(영진닷컴) / 2023년 11월
평점 :
장바구니담기


막연하게 알기만 했던 스포츠 애널리틱스를 보다 체계적으로 공부해볼 수 있는 책인 것 같아 기대됩니다!

댓글(0) 먼댓글(0) 좋아요(1)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
AutoML 인 액션 - AutoKeras 창시자가 안내하는, AutoKeras와 KerasTuner로 머신러닝 파이프라인 최적화하기
칭취안 송.하이펑 진.시아 후 지음, 박찬성 옮김 / 한빛미디어 / 2023년 10월
평점 :
장바구니담기




케글이나 데이콘 같은 데이터 경진대회 플랫폼에 제출된 코드들을 보면 대회 초반에 AutoML을 이용해 여러 모델의 대략적인 추론을 보고 거기서 발전시킨 경우가 많다. 커뮤니티에서는 추론에 대한 감이 오지 않을 때 많이 이용한다고 하는데 최소한의 데이터 전처리라던가 여러 데이터의 유형에 따라 어떤 라이브러리를 써야하는지에 대해 미숙한 경우가 많았는데 좋은 기회가 생겨 이 책을 통해 공부하여 활용해볼 수 있었다.



총 9장으로 이루어져 있으며 엔드투엔드 파이프라인, 딥러닝 요점 정리, 자동화된 엔드투엔드 머신러닝 솔루션 생성, 파이프라인 생성을 통한 탐색 공간 조정, 사용자 정의 탐색 공간을 가진 AutoML, 검색 기법의 사용자 정의, 규모 확장, 주요 개념을 되돌아보고 여러 플랫폼을 알려주는 마무리로 구성되어 있다. 부록으로는 코드 실행을 위한 환경 설정, 이미지/텍스트/정형데이터 분류 예제가 있다. 분류 예제는 책 구성에 대한 전체적인 예시이므로 먼저 보고 공부해보기를 추천한다.



책 내용의 문법이 어색하거나 틀린 경우가 있지만 의미를 찾는데는 어려움이 없었다. 그리고 전체 프로세스를 보여주는 그림이 많아 다소 어려운 내용이 있더라도 따로 찾아보지 않고 이해할 수 있었다.



또 읽다보면 궁금해질만한 내용을 자세하게 알려주는 구간이 있어 공부를 하는데 많은 도움이 되었다. 코드에도 어떤 과정이 진행중인지 화살표를 통해 주석과 함께 알려주어 예시를 쉽게 따라해볼 수 있었다.



한번 전체를 공부해보고 느낀 점은 마냥 코드만 따라 치는 것보다는 어떤 상황에서 어떻게 코드를 입력하는지 과정을 전체적으로 학습하는게 어떻게든 도움이 된다는 것이다. 내가 도메인 지식도 알고 모델링에 대해 상세히 알고 있다면 AutoML이 필요하지 않지만 그렇지 않은 경우가 대다수이기 때문에 어떤 문제에 직면하여 모델링에 적합한 데이터 전처리를 어떻게 해야하는지, 또 어떤 하이퍼파라미터를 세팅해야 하는지 타이밍을 공부해볼 수 있는 좋은 기회였다. 본인처럼 모델링 접근법에 어려움을 겪는다면 이 책을 읽어보는게 많은 도움이 될 것이라 생각한다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo