-
-
AutoML 인 액션 - AutoKeras 창시자가 안내하는, AutoKeras와 KerasTuner로 머신러닝 파이프라인 최적화하기
칭취안 송.하이펑 진.시아 후 지음, 박찬성 옮김 / 한빛미디어 / 2023년 10월
평점 :
케글이나 데이콘 같은 데이터 경진대회 플랫폼에 제출된 코드들을 보면 대회 초반에 AutoML을 이용해 여러 모델의 대략적인 추론을 보고 거기서 발전시킨 경우가 많다. 커뮤니티에서는 추론에 대한 감이 오지 않을 때 많이 이용한다고 하는데 최소한의 데이터 전처리라던가 여러 데이터의 유형에 따라 어떤 라이브러리를 써야하는지에 대해 미숙한 경우가 많았는데 좋은 기회가 생겨 이 책을 통해 공부하여 활용해볼 수 있었다.
총 9장으로 이루어져 있으며 엔드투엔드 파이프라인, 딥러닝 요점 정리, 자동화된 엔드투엔드 머신러닝 솔루션 생성, 파이프라인 생성을 통한 탐색 공간 조정, 사용자 정의 탐색 공간을 가진 AutoML, 검색 기법의 사용자 정의, 규모 확장, 주요 개념을 되돌아보고 여러 플랫폼을 알려주는 마무리로 구성되어 있다. 부록으로는 코드 실행을 위한 환경 설정, 이미지/텍스트/정형데이터 분류 예제가 있다. 분류 예제는 책 구성에 대한 전체적인 예시이므로 먼저 보고 공부해보기를 추천한다.
책 내용의 문법이 어색하거나 틀린 경우가 있지만 의미를 찾는데는 어려움이 없었다. 그리고 전체 프로세스를 보여주는 그림이 많아 다소 어려운 내용이 있더라도 따로 찾아보지 않고 이해할 수 있었다.
또 읽다보면 궁금해질만한 내용을 자세하게 알려주는 구간이 있어 공부를 하는데 많은 도움이 되었다. 코드에도 어떤 과정이 진행중인지 화살표를 통해 주석과 함께 알려주어 예시를 쉽게 따라해볼 수 있었다.
한번 전체를 공부해보고 느낀 점은 마냥 코드만 따라 치는 것보다는 어떤 상황에서 어떻게 코드를 입력하는지 과정을 전체적으로 학습하는게 어떻게든 도움이 된다는 것이다. 내가 도메인 지식도 알고 모델링에 대해 상세히 알고 있다면 AutoML이 필요하지 않지만 그렇지 않은 경우가 대다수이기 때문에 어떤 문제에 직면하여 모델링에 적합한 데이터 전처리를 어떻게 해야하는지, 또 어떤 하이퍼파라미터를 세팅해야 하는지 타이밍을 공부해볼 수 있는 좋은 기회였다. 본인처럼 모델링 접근법에 어려움을 겪는다면 이 책을 읽어보는게 많은 도움이 될 것이라 생각한다.
"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."