처음 배우는 머신러닝 - 기초부터 모델링.실전 예제.문제 해결까지
김승연.정용주 지음 / 한빛미디어 / 2017년 10월
평점 :
절판


“처음…”, “… 첫걸음” 시리즈의 책들을 다 보진 못했지만, 근래 본 책은 다소 기대에 못 미쳤다. 그런데 이 책을 리뷰 서적 중 하나로 선택한 이유는 ‘헬로 데이터 과학’의 저자이며, ‘데이터 지능’ 팟케스트도 진행하고 계신 김진영님의 추천 때문이다. (그런데 어디서 추천했는지 찾을 수가 없다. 혹은 다른 책을 추천했는지도 모르겠으나… 이 책에 앞부분에 나오는 첫번째 추천글이 김진영님의 글이니 맞을꺼라 생각한다.)

딥러닝의 인기를 실감하면서 개발자로서 이 현상을 어떻게 받아들여야 하는지 아직 확신이 없다. 데이터 과학자와 개발자라는 영역을 정확히 구분하긴 어렵지만, 분명 서로의 직업군을 형성하고 있는 것은 사실이다. 그런데 이게 애매해 지고 있다. 딥러닝의 발전과 함께 비전문가도 쉽게 딥러닝(또는 머신러닝)을 사용하는 시대가 곧 올꺼라고들 하는데, 개발자의 필수 기술로 요구될 것은 너무 자연스럽기 때문이다. 특히 백앤드 개발자에게는 더욱 그렇지 않을까…

이 책은 제목처럼 배경지식이 없는 사람을 위한 머신러닝 입문서이다. 머신러닝의 개념과 함께 다양한 방법론의 알고리즘으로 무엇을 할 수 있는지를 알려준다. 우선 이 책의 장점을 들자면,

  • 잘 짜여진 구성
  • 쉬운 설명
  • 적절한 예제

크게 세 파트로 나눠져 있고, 각 파트는 기본개념, 모델, 구현에 대한 내용을 담고 있다. 개인적으로 파트2인 ‘머신러닝 주요 모델’이 가장 좋았다. 다양한 데이터형에 대한 설명을 시작으로 ‘데이터 표준화’에 대한 부분을 읽고 많은 깨달음을 얻었다. 이미 데이터는 주변에(개인적으로나, 회사에서나) 널려있는데, 이런 데이터를 이용하기 위해 먼저 어떻게 고민해봐야 할 지에대한 나름의 가이드를 얻은 것 같아서 좋았다. 그리고 다양한 방법론과 각 알고리즘이 적지않은 수식들과 함께 설명되어 있는데, 밸런스가 아주 적절했다. 수식에만 너무 빠지지도 않고, 그렇다고 수식을 대충 넘기지도 않는다. 이 수식이 무엇을 의미하는지, 왜 필요한지에 대한 설명에 더 힘을 쏟고 있다. 물론 나의 부족한 수학지식에 수식 자체를 100% 이해하고 넘어가지는 못하지만, 어떤 문제를 해결하기 위해 이 알고리즘이 어떤 역할을 하는지에 대한 이해는 충분히 되었다고 생각한다. 그리고 책에도 반복적으로 언급하는 것 처럼.

…(중략) 특별한 구현 없이 라이브러리로 바로 사용할 수 있습니다.

그렇다. 이미 다양한 머신러닝 라이브러리가 있고, 그것을 이용하면 그만인 것이다. 책에서도 다양한 라이브러리들을 소개하고 있고, 실전 예제에서 그 라이브러리들을 이용한다. 즉, 중요한 것은 내가 풀고자 하는 문제에 어떤 방법, 어떤 알고리즘을 활용할 것인지에 대해서 아는 것이 아닌가 생각해본다. 그런 의미에서 이 책이 큰 도움이 되어 줄 것 같다.

개인적으로 이전에 읽은 ‘밑바닥부터 시작하는 딥러닝’ 에서 봤던 용어나 수식들이 적잖게 등장해서 이해하는데도 조금은 도움이 되었던 것 같다.

책표지


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo