[icon001님의 서재] : 알라딘

흥미 진짐함으로 머신러닝을 궁금하게 만드는 책ｌ마이리뷰

icon001 l 2022-08-18 10:42

https://blog.aladin.co.kr/786689156/13856308

혼자 공부하는 머신러닝 + 딥러닝 - 1:1 과외하듯 배우는 인공지능 자습서 ㅣ 혼자 공부하는 시리즈 박해선 지음 / 한빛미디어 / 2020년 12월 평점 :

오늘 리뷰 할 책은 혼자 공부하는 머신러닝입니다.

이 책을 읽게 된 이유는 우연하게 유튜브에서 박해선님의 혼자공부하는 머신러닝 강의를 들으면서 혼공머신의 활약상이 기대 되었기 때문입니다.

한빛 마켓 오픈 준비를 하면서 빙어와 도미를 구분하기 위해 혼공머신이 최근접이웃을 활용하여 빙어와 도미를 구분하는 머신러닝을 만들어 내고, 가장 간단하게 만들어진 최근접 이웃으로 만들어낸 머신러닝에게는 약점이 있을 수 밖에 없었는데요. 그러한 약점은 크기와 무게의 단위가 다른 점 때문에 단위를 같게 만들어야 하는 스케일링 기법이 필요할 수 밖에 없겠구나 라는 사실을 스스로 깨닫게 되는 마법같은 이야기~

기존에는 피처 엔지니어링 기법으로 스케일링은 각 변수의 데이터 범위가 다를때 일정하게 맞춰주는 기법과 같이 딱딱하게 다가 오던 내용들이 이 책을 읽으면서는 왜 그 상황에서 스케일링 기법이 필요한지 그렇게 하기 위해서는 어떻게 해야 되는지 를 설명해 주니 정말 머리에 쏙쏙 잘 들어 오더라구요~

그리고 이제 한빛마켓이 성장을 해서 이제는 도미를 무게 단위로 판매를 시작하네요.

무게를 예측해 봐야 할것 같아요~

이러한 무게 예측도 최근접 이웃으로 가능합니다. 하지만 훈련 데이터 범위 안에서 측정하는 것은 제대로 측정이 되는데 훈련데이터 범위 밖의 데이터가 입력 되면 엉뚱한 방향으로 예측을 하게 되네요. 해결 방법은 바로 선형 회귀 입니다. 선형 회귀는 데이터에서 직선의 데이터를 예측 할 수 있는 알고리즘이기 때문에 범위를 벗어난 데이터도 잘 맞출 수가 있습니다. 하지만 데이터가 항상 일직선의 데이터만 있는 것은 아니네요~ 2차 방정식 형태의 데이터를 해결해야 하는 다항회귀를 알고 넘어가야만 합니다.

이 처럼 이 책의 내용은 흥미를 유발하여 다음 장에서는 무엇을 배우게 될까? 라는 궁금증을 유발하는 책이네요.

그리고 혼공머신과 함께 한단계 한단계 성장하면서 나 자신이 머신러닝에 대해 쑤욱~ 성장해 나가는 모습을 볼 수 있는 것 같아요.

이렇게 하나 하나 따라 가다 보면 어느 새 로지스틱회귀,확률적 경사하강법,결정트리,교차검증과 그리드서치,트리의 앙상블, 비지도 학습의 군집알고리즘,k-평균,주성분분석, 이미지 분류를 위한 인공신경망,심층신경망,합성곱 신경망과 마지막으로 텍스트를 위한 인공신경망까지 개념을 이해 할 수 있는 모습을 확인 할 수 있었습니다.

또한 실습도 파이썬 프로그램 설치와 같은 과정들을 생략하고 구글에서 제공해 주는 코랩을 이용하여 쉽게 실습을 진행해 볼 수 있어서 정말 최적의 실습환경이 아닐까 라는 생각도 들었네요~

실제로 실습환경을 구축하면서 구축이 잘 안 되거나 하다 보면 진행속도도 느려지고 공부에 흥미를 떨어뜨릴 요소도 다분하거든요.

입문자에게 머신러닝은 참으로 쉽지 않은 것 같습니다. 여러개의 책을 살펴 보아도 대부분의 책은 머신러닝이란 이런거야 하고 소개하는 책과 아니면 머신러닝의 알고리즘을 설명하는 깊이 있는 책과 같이 중간 부분을 설명하는 책이 많지 않아서 입문자가 보기에 이 두개의 연결 다리를 해 줄 만한 책이 많지 않아서~

정말 이리 부딪히고, 저리 부딪히면서 조금씩 조금씩 깨우치는 방법 밖에는 없었는데요.

박해선님이 많은 머신러닝 관련한 책을 번역하시고 또한 책을 쓰시면서 입문자의 가려운 부분을 정확하게 짚어 내신 책인 것 같은 생각이 드네요.

이 책은 처음부터 마지막까지 흥미진진하게 내가 이 책속의 주인공이 되어서 문제를 해결하면서 모험을 떠나는 여행 같은 느낌으로 읽을 수 있었습니다.

댓글(0) 먼댓글(0) 좋아요(0)

ｌ

찜하기 ｌ

입문자가 쉽게 접근 할 수 있는 머신러닝ｌ마이리뷰

icon001 l 2022-08-18 09:55

https://blog.aladin.co.kr/786689156/13856209

Must Have 데싸노트의 실전에서 통하는 머신러닝 - 피처 엔지니어링 + TOP 10 알고리즘 + 실무 노하우로 익히는 실무형 문제풀이 해법서 ㅣ Must Have 권시현(데싸노트) 지음 / 골든래빗(주) / 2022년 7월 평점 :

오늘 살펴볼 책은 골든래빗 출판사에서 출판한 "데싸노트의 실전에서 통하는 머신러닝"입니다.

이 책의 구성을 먼저 살펴 보겠습니다.

1단계 배경지식 익히기

한눈에 살펴보는 머신러닝 - 인공지능,머신러닝,딥러닝의 개념을 살펴보고 가장 많이 사용하는 머신러닝 알고리즘 10개의 성능을 비교해 봅니다.
파이썬 기초 익히기 - 머신러닝을 처음 도전하는 분들을 위해 머신러닝에서 사용하는 기본적인 파이썬을 살펴 봅니다.
판다스와 넘파이 - 머신러닝을 사용하기 위해서는 필수 요소인 판다스와 넘파이 다루는 법을 살펴 봅니다.

2단계 답을 알려줘야 학습하는 지도학습 알고리즘

선형회귀 : 보험료를 예측하는 문제를 실습하면서 머신러닝의 가장 기본적인 모델인 선형회귀 모델을 다루어 보고 머신러닝의 개념을 이해합니다.
로지스틱회귀 : 유명한 타이타닉 생존자 예측 문제를 해결하면서 분류 알고리즘인 로지스틱 회귀에 대해 살펴 봅니다.
k-최근접 이웃 : 와인 등급 예측하기 문제를 통해서 결측치 처리하는 문제, 스케일링 방법등에 대해 살펴 봅니다.
나이브 베이즈 : 문자 데이터셋을 분석해서 스팸 문자인지 아닌지 필터링 하면서 나이브 베이즈 모델(조건부 확률 기반의 분류모델)을 이해 합니다.
결정트리 : 결정트리 모델은 스무고개와 같이 질문을 통해 대답을 찾아가는 모델입니다. 학력,교육연수,혼인상태,지업정보 등을 담은 데이터를 통해 연봉을 예측하면서 결정트리를 이해합니다.
랜덤 포레스트 : 중고차 가격을 예측하면서 K-폴드교차검증과 랜덤 포레스트 알고리즘에 대해 알아봅니다.
XGBoost : 부스팅알고리즘은 트리 모델을 기반으로 한 최신 알고리즘 중 하나로 랜덤 포레스트보다 훨씬 빠른 속도와 더 좋은 예측 능력을 보여줍니다. 커플 성사 여부를 예측하면서 XGBoost 사용법을 살펴 봅니다.
LightGBM : 이상거래 예측하기 문제를 해결하면서 최신 부스팅 모델인 LightGBM 모델을 살펴 봅니다. LightGBM은 리프 중심 트리 분할 방식을 사용하여 XGBoost보다 빠르고 놓은 정확도를 보여 주는 경우가 많습니다.

3단계 비지도학습 알고리즘

K-평균 군집화 : 온라인 쇼핑몰에서 고객이 구매한 물품,검색한 물품,살펴본 물품 정보를 이용해 고객에게 추천 서비스를 제공합니다. 이때 K-평균군집화 알고리즘으로 분류하여 어떤 물건을 선택 했을때 해당 그룹의 물품을 추천해 봅니다.
주성분 분석(PCA) : 주성분 분석의 목적은 데이터의 차원을 축소하는데 있습니다. 차원 축소를 하여 데이터 용량은 줄이되 가능한 그 특성을 보존해 내는 기법입니다. 많은 특징을 담고 있는 고객데이터셋을 축소하여 한눈에 예측하는 그래프를 그려 보면서 주성분 분석에 대해 알아 봅니다.

이 책은 가장 많이 사용되는 Top10 의 알고리즘을 살펴보고 그 알고리즘들이 어떤 경우에 사용되는지 하나씩 예를 들어서 분석을 하면서 알고리즘의 이해를 돕고 있습니다.

먼저 가장 기본이 되는 선형회귀 알고리즘 부터 캐글 컴피티션 우승자가 많이 사용하는 검증된 부스팅 모델인 LightGBM 모델까지 살펴 봅니다.

머신러닝을 공부하면서 머신러닝의 알고리즘에 대한 설명을 해 주는 문서들은 많지만 어떤 경우에 어떤 알고리즘을 사용해야 되는지 알려주는 문서들은 많지 않은것 같습니다.

실제로 같은 문제를 해결 하더라도 여러가지 알고리즘으로 접근이 가능한데, 어떤 알고리즘이 더 적합한지는 여러가지 알고리즘으로 훈련을 하고 매개변수를 직접 변경해 보기도 하면서 가장 좋은 방법을 찾아 내는 것이 데이터 과학자가 걸어가야 할 길인것 같은데요~

이 책은 먼저 문제를 정의하고 이 문제에서 사용할 수 있는 데이터를 살펴 보고 그 데이터를 사용하기 위해 전처리 과정(결측치 처리,훈련데이터와 테스트 데이터 분리,필요에 따른 스케일링 등)을 거쳐 모델을 훈련하고 훈련한 결과의 예측값을 살펴 보면서 우리가 데이터과학자가 되어 데이터 분석하는 방법에 대한 이해를 실습을 통해서 스스로 깨닫게 만들어 줍니다.

이 책은 머신러닝에 입문하려는 분들이 처음 접하기 쉽게 파이썬 기초,넘파이와 판다스에 대해 정리를 해주고 있어서 프로그래밍을 했던 분들이라면 무리 없이 따라 하실 수 있도록 구성이 되어 있습니다.

머신러닝 입문서가 정말 많은 것은 사실이지만 입문 하시는 분들이 쉽게 접근 할 만한 책은 많지 않은것 같아요.

이 책을 읽으면서 느낀 것은 머신러닝 입문하는 분들에게 한줄기 빛이 되어 줄것 같은 생각이 드네요.

이 책은 골든래빗 출판사에서 전자책으로 제공받아 북스포일러를 작성하였습니다.

댓글(0) 먼댓글(0) 좋아요(0)

ｌ

찜하기 ｌ

[100자평] 정서와 학습 그리고 뇌ｌ마이리뷰

icon001 l 2019-05-01 09:16

https://blog.aladin.co.kr/786689156/10831433

정서와 학습 그리고 뇌 - 아이는 무엇을 느끼고 어떻게 배우는가 메리 헬렌 이모디노-양 지음, 황매향 옮김 / 바수데바 / 2019년 3월 평점 : 절판

아이를 키우는 부모 이거나 아이들을 가르치는 교육자라면 한번쯤 보면 좋을 책

댓글(0) 먼댓글(0) 좋아요(0)

ｌ

찜하기 ｌ

icon001님의 서재

리스트

마이리뷰

마이페이퍼

방명록

흥미 진짐함으로 머신러닝을 궁금하게 만드는 책ｌ마이리뷰

icon001 l 2022-08-18 10:42

입문자가 쉽게 접근 할 수 있는 머신러닝ｌ마이리뷰

icon001 l 2022-08-18 09:55

[100자평] 정서와 학습 그리고 뇌ｌ마이리뷰

icon001 l 2019-05-01 09:16

서재지수 : 131점

오늘의 마이리스트

최근 댓글

먼댓글 (트랙백)