파이썬을 활용한 머신러닝 쿡북 - 전처리에서 딥러닝까지, 판다스와 사이킷런 중심의 실전 문제 해결 200선
크리스 알본 지음, 박해선 옮김 / 한빛미디어 / 2019년 9월
평점 :
구판절판


머신러닝을 공부하는 분들을 주변에서 많이 볼 수 있습니다.


머신러닝은 파이썬 언어를 사용합니다.


다른 프로그래밍언어로는 쉽게 못 짤 코드도 쉽고 빠르게 짤 수 있습니다.


파이썬을 활용한 머신러닝 쿡북은 입문자를 위한 책은 아닙니다.


아쉽게도 입문자분들은 기초부터 공부하신 후에 읽으실 것을 추천합니다.


머신러닝 원리와 작동방식을 알려주는 책으로 기초는 알려주진 않습니다.


입문자분들도 머신러닝 기본 개념을 먼저 숙지하신 후에는 읽으시면 도움이 되는 책입니다.


파이선을 할 줄 아는 사람들이 보게 하려고 만든 책입니다.


◆ 데이터 전처리

머신러닝 예측 정확도를 높이기 위해서는 데이터 전처리가 중요합니다.


데이터 전처리를 잘하기 위해서는 의미 있는 특징 데이터가 많은 게 좋습니다.


의미 있는 데이터로 새로운 해석도 할 수 있고 정확도를 올릴 수 있습니다.


데이터 전처리는 정확도가 높게 나오도록 하는 게 목적인데요.

정확한 예측을 하려면 특성추출과 모델평가를 잘해야 합니다.


특성추출은 데이터 중에서 의미 있는 데이터를 추출하는 게 가장 중요합니다.


머신러닝을 하면 데이터 전처리에 가장 많은 시간을 투자합니다.


모든 데이터가 있으면 좋겠지만 비슷한 값들로 빈값들을 채워줘야 하기 때문입니다.


이 책은 머신러닝 실무자들에게 머신러닝 문제해결 능력을 키우는 데 도움이 되는 설명서 역할을 해줍니다.


◆ 머신러닝 모델

머신러닝 모델을 만들 때 자주 사용하는 판다스와 ? 중심의 예제로 구성됐습니다.


전처리에서 딥러닝을 하기 위해서는 넘파이와 판다스를 잘 다룰 줄 알아야 합니다.


머신러닝 패키지인 scikit-Learn은 판다스와 함께 머신러닝에 필요한 패키지입니다.


입문자들이 가장 많이 시작하는 머신러닝으로 타이타닉 데이터셋으로 생존율을 파악합니다.


타이타닉의 생존율을 머신러닝을 돌려 예측하는 건데요.

기계가 예측 가능한 형태로 만들기 위해 원핫인코딩을 사용합니다.


머신러닝 초급자들 코스이지만 캐글을 하게 되면 다양한 머신러닝으로 예측하는 모델을 만들게 됩니다.


그때 수치형 데이터와 범주형 데이터도 만들어보며 머신러닝에 대한 감을 잡을 수 있습니다.


끝으로 파이썬은 개발자와 비 개발자 구분 없이 주목받고 있습니다.


데이터 분석과 자동화 시스템을 만들기 위해 파이선을 찾기도 합니다.


초등학교, 중학교 학생들도 코딩을 배울 정도로 코딩에 대한 중요성이 높아졌습니다.


의무교육도 될 것이란 말도 들립니다. 코딩을 많은 사람이 하게 될 것 같습니다.




댓글(0) 먼댓글(0) 좋아요(1)
좋아요
북마크하기찜하기 thankstoThanksTo