데이터 전처리 대전 - 데이터 분석을 위한 파이썬, SQL, R 실천 기술
모토하시 도모미쓰 지음, 윤준 옮김 / 한빛미디어 / 2019년 11월
평점 :
절판


데이터와 정보에 대해 아시나요?

서로 다른 성격을 가집니다.


데이터는 이름, 성별, 나이도 될 수 있습니다.


하지만 그 데이터만 가지고는 큰 의미기 없습니다.


데이터가 가공되었을 때 의미 있는 데이터가 되는데요.

이를 정보성 데이터라 할 수 있습니다.


가공되지 않은 데이터를 전처리해서 의미 있는 결과를 만들어야 합니다.


또 데이터 하면 SQL이 떠오릅니다.


SQL은 데이터를 생성, 읽기, 수정, 삭제 할 수 있습니다.


큰 틀은 변하지 않아 한번 제대로 해두면 데이터 처리가 수월해집니다.


데이터 전처리할 때 사용하는 언어로는 파이썬과 R이 있는데요.

이를 잘 알려주는 책을 소개하고자 합니다.


소개해 드릴 책은 '데이터 전처리 대전'입니다.


데이터 초보자분들도 쉽게 학습 할 수 있는 내용입니다.


데이터 분석은 어떻게 하고 어떠한 결과가 나오는지 궁금하신 분들에게 이 책을 추천합니다.





1. 통계학과 머신러닝

통계학과 머신러닝이 무엇인지 아시나요?


데이터를 전처리하려면 프로그래밍 언어도 알고 있어야 하는데요.

데이터 전처리 공정에 통계학과 머신러닝도 필요합니다.


이 책은 특정 언어의 스킬을 알려주는 책이 아닙니다.


통계학과 머신러닝을 포괄적으로 알려줍니다.


초급 데이터과학자도 따라가기 쉽게 구성되어 있습니다.





2. 예제를 통한 학습

예제를 따라 하며 어떻게 동작하는지 이해할 수 있습니다.


예제를 따라 하기 전 내용을 읽고 이해하면 학습에 도움이 됩니다.


급하게 코드만 본다고 이해가 되진 않습니다.


한 번에 이해가 안 된다면 여러 번 읽어 보시기 바랍니다.


저자의 데이터 전처리 경험과 노하우가 담긴 예제입니다.


앞으로 전처리를 다루는 데 도움을 얻을 수 있을 겁니다.





Ps

데이터 분석을 하려고 파이썬을 많이들 공부합니다.


비개발자도 프로그래밍 언어로 파이썬을 많이 시작합니다.


저자는 제조, 소매, 금융 등의 데이터를 분석한 실무자입니다.


데이터 분석에 관심 있는 분들에게 이 책을 추천합니다.


댓글(0) 먼댓글(0) 좋아요(3)
좋아요
북마크하기찜하기 thankstoThanksTo