파이썬으로 완성하는 비지도 학습 알고리즘 - 비감독 모형과 텐서플로 2를 이용한 전처리 기법의 머신러닝 구현
송동근 지음 / 비제이퍼블릭 / 2021년 12월
평점 :
장바구니담기


지도학습은 비지도 학습에 비해 결과가 안정적인 것에 반해 비지도 학습의 경우 90%이상의 정확도를 보이기 힘들다고 저자는 말한다. 그래서 2차,3차 등 후처리 작업이 요구된다. 그럼에도 불구하고 비지도 학습을 해야 하는 이유는 어디에 있는 것일까. 비지도 학습은 답안을 이끌어 내는 것을 최대한 유추하여 일반화하는 과정이다. 테이터에서 패턴을 찾아 정의한 후 이 정의를 토대로 결과를 도출하는 과정을 반복 시행하는 과정이다. 데이터의 수많은 경우의 수로부터 패턴을 찾아내어 결과를 추론하고 도출하게 된다면 정해진 답안을 하나씩 확인하는 것보다 빠르게 목적에 도달하게 된다. 이것이 비지도학습을 공부해야 하는 이유이며 데이터가 무한대일 경우 비지도 학습은 더 큰 힘을 발휘하지 않을까 하는 생각도 든다. 특히 메타버스 시대를 앞두고 있는 지금 가장 활발해 질 분야도 이분야가 되지 않을까.

파이썬을 통해 증권데이타를 분석하는 공부를 하면서 비지도 학습에 대해서도 관심을 가지게 되었는데 처음 접하는 분야다 보니 책을 읽는데 어려움이 많았다. 오직 데이터의 특징 및 패턴만을 기반으로 하여 모델 스스로가 판단하게 만들고, 수집한 데이터를 군집화하여 유사한 데이터끼리 묶어 분석하게 만들고, 정보가 과다하게 많을 경우 차원축소를 통해 데이터의 특성을 가장 잘 표현한 특징들을 추출하는 등 많은 것을 보면서 배울 수 있는 시간이었다. 책을 읽는 것이 어려웠지만 유투브나 블로그 등을 통해 기본적인 내용을 인지하면서 책을 읽다보니 무척 흥미로웠다.

비지도 학습 일고리즘은 차원축소, 이상치 탐지, 군집화, 텐서플로, 오토인코더로 구성되어 있으며 초보자보다는 비지도학습을 이미 공부해본 사람을 대상으로 한다. 단순히 비지도 학습을 소개하는 정도에 그치는 것이 아니라 비지도 학습을 전문적으로 다루며 깊이 있는 설명을 하고 있다. 시중에 비지도학습을 소개하는 책이 많아서 인지는 모르겠으나 초보자를 위해서 두 챕터 정도만 할애하여 기본적인 설명을 실었더라면 책을 읽기가 한결 수월하지 않을까 하는 아쉬움은 남는다.


댓글(0) 먼댓글(0) 좋아요(1)
좋아요
북마크하기찜하기 thankstoThanksTo