-
-
쉽게 시작하는 캐글 데이터 분석 - 캐글 대회 참여 방법부터 캐글 그랜드마스터 인터뷰까지!
시노다 히로유키 지음, 조태호 옮김 / 길벗 / 2021년 9월
평점 :
* 이 책은 어떤 책인가?
'쉽게 시작하는 캐글 데이터 분석'은 제목에 걸맞게 예측모델 및 데이터 분석 경진대회 플랫폼인 '캐글'에 대해 주로 다루고 있다. 아래의 목차에서도 살펴볼 수 있듯이 첫 번째 장에서는 캐글이란 무엇인지 친절하게 설명하고 있어 해당 플랫폼이 낯선 초보자들도 쉽게 접근할 수 있도록 한다. 또한 데이터 분석 환경 구축부터 실제 경진대회 도전 과정까지 서술하여 데이터 분석이 처음인 사람들도 처음부터 차근차근 따라할 수 있도록 되어 있다.
또한 이 책에서 주목할 점은 캐글 마스터들의 인터뷰를 수록하고 있다는 것이다. 쉽게 접하기 어려운 캐글 마스터들의 마인드셋, 데이터 분석 관련 팁 등을 엿볼 수 있어서 매우 흥미로웠다.
* 이 책의 장점은 무엇인가?
- 캐글이 경진대회 플랫폼인데다 해외 사이트라 어렵게 느끼는 사람들도 많이 있을 것이라 생각되는데 이 책에서는 정말 기초적인 것부터 차근 차근 알려주기 때문에 입문자들도 어려움 없이 캐글에 도전해 볼 수 있다.
- 캐글의 대표적인 두 경진대회 데이터에 대해 시각화와 전처리 과정을 세세하게 알려주기 때문에 데이터 분석을 진행하는 과정에서의 기본적인 사고과정을 따라가 볼 수 있다. 분석 알고리즘을 가르쳐 주는 책들은 많아도 실제로 데이터 분석가들이 분석을 진행하는 방식, 과정들을 알려주는 책은 드물기 때문에 초심자라면 이 책의 코드들을 따라해 보는 것만으로도 도움이 될 것이라 생각한다.
예를 들어 나의 경우에는 이 책에서 다루고 있는 '타이타닉 생존자 예측' 데이터를 이전에 직접 분석해 보았음에도 불구하고 책의 코드와 분석 과정을 따라가 보면서 새로운 시각에서 데이터를 바라볼 수 있었다. 이 책을 통해 학습하는 분들도 혼자서 먼저 데이터 분석을 진행한 뒤에 책을 보면서 자신의 분석과 책 속의 분석이 어떻게 다른지, 같은 내용이라도 코드는 어떻게 짜는 것이 더 깔끔한지 비교해 본다면 학습에 더욱 도움이 될 것이라 생각한다.
- 물론 머신러닝과 관련되어 더 심화된 내용은 당연히 다른 책을 추가로 공부해야겠지만, 경진대회 데이터 분석에서 사용되는 머신러닝 방법론에 대해 간략하게 설명을 해주고 있기 때문에 머신러닝을 아직 제대로 배우지 않은 사람이라 하더라도 부담없이 읽을 수 있다.
* 이 책을 추천하고 싶은 대상은 누구인가?
- 기본적인 파이썬 코드를 학습한 상태에서 본격적으로 데이터 분석에 입문해 보고자 하는 초보자
(물론 분석에 사용되는 코드가 모두 적혀 있어서 따라하기만 하면 된다. 그럼에도 불구하고 파이썬, 판다스에 대한 이해가 없으면 그냥 타자 연습 밖에 되지 않을 것이기 때문에 코딩에 대한 기초 지식은 필수라고 할 수 있다)
- 데이터 분석을 배우고 있지만 아직 경진대회 경험이 없는 사람
('캐글'에 대해 이전에 전혀 들어본 적이 없는 사람이라 할지라도 이 책을 통해 경진대회 플랫폼 및 대회 수상 방법에 대한 감을 잡을 수 있다. 그만큼 친절하게 설명이 되어 있는 책이다.)
- 캐글에 대해 궁금한 사람들 모두 다 :)