Must Have 데싸노트의 실전에서 통하는 머신러닝 - 피처 엔지니어링 + TOP 10 알고리즘 + 실무 노하우로 익히는 실무형 문제풀이 해법서 Must Have
권시현(데싸노트) 지음 / 골든래빗(주) / 2022년 7월
평점 :
장바구니담기


머신러닝 입문서들은 많지만, 실제로 책을 읽어보면 이 책이나 저 책이나 다를 바 없을 때가 많다. 또한 기본 개념과 응용 코드들을 적어놓긴 하지만 깔끔하게 정제되고 간단한 타이타닉이나 붓꽃 예제로만 진행해서 실제로 다른 데이터들에 응용할 때에 애를 먹는 경우가 대부분이다.


 실전에서 통하는 머신러닝이라는 단어가 들어가 있어서 한 번 읽어보았는데, 매우 깔끔하게 정리가 되어 있을 뿐 아니라 다양한 예제들로 이루어져 있어서 좋았다. 위에서 말했듯이, 대부분의 예제가 타이타닉, 붓꽃, 와인 분류에서 벗어나지 못하는 다른 책들과는 다르게 해당 타이타닉과 같은 예시를 포함하여 스팸 여부 판단, 연봉 예측, 데이팅 성사 여부까지 흥미로운 데이터들을 이용하여 예시가 작성되어 있다는 점이 이 책의 가장 좋은 점이라고 할 수 있다. 


 1장에서 3장까지는 머신러닝을 처음 입문하는 이들을 위해서 책에서 설명할 10가지 알고리즘에 대한 비교와, 판다스와 넘파이와 같은 기초 라이브러리에 대한 설명이 적혀있다. 입문자라면 처음부터 보면 되는데, 조금씩은 알고 있다면 처음 2,3장은 스킵하는 식으로 맞추어서 학습을 하면 된다. 


 각 예시별로 처음에 문제 정의를 표 형태로 정리해서 제시해주는 것이 인상적이었는데, 데이터셋에 대한 설명부터 어떤 평가지표를 사용할 것인지, 어떤 모델을 사용했고, 이때 사용된 라이브러리들의 버전까지 정리되어 있어서 좋았다. 또한 실전이라는 말에 정말 알맞다고 생각했던 부분이 바로 클러스터링 부분이다. 다른 많은 예제들은 elbow method를 소개하면서 3,4번째에 정말 팔꿈치가 보이게 감소하는 예시들을 보여주었는데, 현업에서 실제 데이터를 이용하여 진행했을 때 너무나도 완만한 그래프에 당황했던 기억이 있다. 하지만 이 책에서는 그렇지 않은 예시를 보여주며 그런 경우 어떻게 해야 할지를 설명해주는 점이 '실전에서 통하는'이라는 단어를 사용할 만하다는 생각이 들었다. 


 데이터 분석을 하면서 가장 많이 쓰이는 모델에 대한 개념적인 소개와 활용 방안까지 잘 갖추어진 책이라는 생각이 들었다. 위에서 말했듯 기초 라이브러리에 대한 설명도 같이 있기 때문에 입문자들이 보기에 좋은 책이지만, 개인적으로는 파이썬 기초를 알고 있으면서 선형회귀라던지, 랜덤포레스트라던지 머신러닝을 '찍먹'은 해보았으나 그 뒤에 무엇을 해야할지 모르겠는 분들이 보시면 특히 좋을 것 같은 책이다. 


골든래빗 출판사로부터 책을 제공받아 작성했습니다



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo