파이썬으로 완성하는 비지도 학습 알고리즘 - 비감독 모형과 텐서플로 2를 이용한 전처리 기법의 머신러닝 구현
송동근 지음 / 비제이퍼블릭 / 2021년 12월
평점 :
절판


비지도학습이란 입력값에 대하여 결과값의 정답 및 오답이 정해져 있지 않는 머신러닝 알고리즘으로 분류됩니다. CNN, RNN과 같이 이미지 인식의 결과 값에 대한 태그가 정답으로 정해져 있는 지도학습과 대비되는 알고리즘입니다. 삶에 정답이 정해져 있지 않는 것처럼 비지도학습은 우리가 사는 생활과 우리의 생각과 닮아있다는 생각이 들고, 그런 면에서 많은 가능성이 있는 머신러닝 알고리즘입니다.

이 책은 비지도 학습을 처음 접하는 분들에게도 어렵지 않게 학습이 가능하도록 비지도학습에 대한 개념부터 설명하고 있습니다. 장점이라면 기계학습과 딥러닝, 파이썬에 대해 어느정도 지식과 경험이 있는 독자라면 맞춤형에 가까운 빠른 학습이 가능할 듯 합니다. 하지만 파이썬 코딩을 안해봤으며 기계학습에 대한 개념이 부족하다면 다른 기본서를 먼저 익히고 나서 이 책을 사용하면 좋겠습니다. 비지도학습을 전문으로 다루는 이 책의 수준은 인공지능 기본서보다 난이도가 높을 수 밖에 없기 때문입니다. 하지만 비지도학습 알고리즘을 파이썬으로 구현하는 내용에 대해서는 확실한 컨텐츠를 담고 있습니다.

인공지능 머신러닝 비지도학습을 이해하기 위한 핵심 키워드는 네 가지로 볼 수 있습니다. 첫 번째는 고차원 데이터를 축소해서 시각화하는 "차원 축소"가 있습니다. 차원축소에 사용되는 기술에는 주성분분석과 특이값 분해가 가장 대표적이며 그 외의 기법들도 책에서 소개하고 있습니다. 두 번째는 예상치못한 데이터를 찾아내는 "이상치 탐지" 기법이며 전처리의 영역이라고도 볼 수 있습니다. 이상치 탐지를 허술하게 넘어가는 경우 예상치 못한 범위 외 데이터로 인해 군집화에 오류를 유발할 수도 있습니다. 손이 많더라도 이상치탐지와 전처리를 꼭 필요한 활동입니다.

세 번째는 비슷한 항목과 데이터끼리 모으는 군집화이며 비지도학습의 꽃이라고 불리는 가장 중요한 알고리즘이자 기법입니다. 상위 군집을 생성하고 군집별로 등급과 중요도를 구하고 군집을 생성해서 결과를 확인합니다. 그리고 책에서는 이 모든 과정을 텐서플로2와 오토인코더를 이용하면서 파이썬 코딩으로 실체화해서 구현하도록 가이드하고 있습니다. 파이썬 코딩은 별도로 기본 문법을 이해하고 접근하는 것이 더 좋을 듯 하므로 기본서로 공부하여 코드에 익숙해지면 좋겠습니다.

출판사로부터 책을 제공받고 솔직하게 쓴 글


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo