-
-
머신러닝 엔지니어링 인 액션 - 머신러닝 엔지니어링 개념부터 프로덕션까지 성공적인 머신러닝 프로젝트 구축하기
벤 윌슨 지음, 김대근.심대열 옮김 / 한빛미디어 / 2023년 12월
평점 :
실제로 이 책의 저자는 이전부터 많은 일을 해오셨고, 개발 뿐만 아니라, ML, 통계, 데이터 분석 등등 다양한 업무를 해왔기에 하나의 프로젝트에 대해서도 다양한 사항들을 고려하고 그 내용들을 어떻게 해결하는 지에 대해서 많은 경험이 쌓여있음이 느껴진다.
간간히 나오는 개발 코드들은 대부분이 파이썬이지만, 실제로 분산처리를 위한 아파치 스파크에 대한 내용도 잠깐 나오고, 통계모델을 통해서 원시 데이터에 대한 분석 및 전처리 방법 등 다양한 경우의 수와 프로세스에 대해서 상세하게 알려주고 있다.
마치 옆에서 (인강) 선생님이 하나하나 알려주는 듯한 느낌이다.
실제로 이런 시니어나 선배가 계셨었더라면 좀 더 많은 것을 배워갈 수 있지 않을까 싶은 내용들이기도 했다.
Databricks에서 일하시는 것을 느낄 수 있는, MLFlow에 대한 내용과 실제 아파치 스파크와 어떠한 프로세스로 프로젝트를 빌딩하는지에 대해서도 순서도로 깔끔하게 정리되어 있다.
하지만 너무 딥하게 받아들여서 문제인 것인지는 모르겠지만, 스파크에 대한 지식이 없기에 단박에 이해는 되지 않았다.
그 외에도 9장에서는 "테스트 가능하고 읽기 쉬운 코드 작성"처럼 기본적으로 파이썬을 활용해서 코드를 어떻게 작성해야 할지에 대한 라인별로 설명이 존재한다.
실제로 336페이지 ~ 341페이지에 걸쳐서 하나의 스크립트가 나오고 클래스에 대한 메서드 설명들 뿐만 아니라 메서드에서 사용되는 인자들에 대해서까지 디테일하게 설명해주고 있다.
이후에는 유닛 테스트, 파이썬 코드에서의 네이밍 규칙 및 구조, 캡슐화 및 모듈화, 에러 잡는 try/catch
ML 서비스에선 빼먹을 수 없는 드리프트 및 모니터링, 로깅 등 솔직히 이번 리뷰기간 동안에 받은 이 책을 반의 반의 반도 받아들이지 못한 것 같다.
자세한 리뷰는 블로그를 참고해주세요
https://blog.naver.com/ab415/223303028270