파이썬으로 완성하는 비지도 학습 알고리즘 - 비감독 모형과 텐서플로 2를 이용한 전처리 기법의 머신러닝 구현
송동근 지음 / 비제이퍼블릭 / 2021년 12월
평점 :
절판



비지도 학습이란 일반적으로 당연하다고 생각되는 지도학습(명확한 정보를 바탕으로 한 지도형 학습)과 달리 머신 데이터를 기반으로 정보를 추출하는데 목적이 있습니다. 데이터가 범람하는 시대에 인터넷 사용자들을 위해 많은 것을 할 수 있기 때문에 아이템별 카테고리 분류, 데이터 추천 등 다양한 분야에 도움이 되고 있습니다. 이처럼 유사한 데이터를 군집화하는 과정을 거쳐 유저들이 원하는 가까운 값을 예측할 수 있기에 많은 분들이 비지도 학습 알고리즘에 관심을 가지고 있는데요. "파이썬으로 완성하는 비지도 학습 알고리즘"은 파이썬 언어를 통한 국내 최초의 비지도 학습 알고리즘 전문 서적입니다. 비지도 학습은 앞서 설명한 것 같처럼 결과를 유추함에 있어 복잡한 과정을 거치기 때문에 많은 기술들이 필요합니다. 해당 책은 지도 학습과 비지도 학습의 차이점과 장단점, 개념 설명에 이어 정보 손실을 최소화하는 차원축소, 문제에 대비하기 위한 이상치 탐지, 군집화, 텐서플로2, 오토 인코더를 다룹니다.



공부하기에는 단순한 예시에 그치지 않고 실제 사용 범위(고객 중심의 데이터 등)에 중점을 두어 설명하고 있기 때문에 훨씬 이해하기 쉽게 쓰여 있습니다. 차원축소 항목에는 다양한 이미지 시각화 예제, MINST 데이터 세트 패키지를 통한 단계별 테스트 과정을 통해 결과값을 도출하고 이해하기 쉽도록 하며, 이상치 탐지 항목에서는 각 데이터 출력값을 통해 실무에서 적용했던 것들을 간접적으로 경험할 수 있습니다. 책 3분의 1분량을 담고 있는 군집화의 경우 군집분석에 대한 여러 거리 측정법(Lp 민코우스키, 샤논 엔트로피 등)이 상세히 소개되어 있는데, 각 수식에 대한 자세한 설명과 방대한 알고리즘을 담고 있습니다. 그리고 GPU도 활용이 가능해 보다 빠른 계산이 가능한 텐서플로 2를 활용한 코드 예시, 익히기 쉽고 성능이 좋은 다양한 오토 인코더의 개념까지 익힐 수 있습니다.

특히 머신러닝은 수식에 대한 이해가 상당히 필요하다고 알려져 있는데요. 각 상황에 따라 달라지는 수식들에 대한 설명, 문제 풀이를 하는 듯한 수식 과정도 소개하고 있어, 답답하고 어려웠던 수식에 대한 이해도 어느정도 해결해 준다는 느낌으로 공부할 수 있어 좋았습니다. 각 라이브러리에 대해 개념을 익히고 수식을 이해하고 알고리즘을 익혀 나간다는 게 마음에 들었습니다. 저자는 목차를 차례대로 읽으면서 공부하는 걸 권장하지만 방대한 내용을 담고 있는 만큼 자신이 공부하고 있는 부분이나 궁금한 부분만 확인해서 참고서처럼 공부할 수 있을 것 같습니다. 초보자를 위한 책은 아니기 때문에 머신러닝에 대한 경험과 기초지식을 가진 분들에게 추천할만한 책입니다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo