판다스로 쉽게 배우는 데이터 분석과 시각화
조승근 지음 / 광문각출판미디어 / 2024년 2월
평점 :
장바구니담기


우리는 살면서 수많은 데이터를 마주하게 됩니다. 과거에 살던 사람들이 한 평생 걸려서 만날 만한 데이터의 양을 지금 현대에 사는 우리는 거의 하루 만에 만난다고 하는 말이 있을 정도죠. 


하지만 이렇게 데이터가 있다고 하더라도 이를 잘 활용하지 못한다면 이는 그저 공간을 차지하는 소모재 그 이상도 이하도 아니게 됩니다. 데이터가 쌓여서 축적이 되면 우리는 그걸 데이터베이스라고 불리고, 이러한 데이터베이스는 정제와 가공을 통해 우리가 원하는 방식으로 표현해야 할 필요성이 있는데요.



사실 데이터베이스를 활용할 수 있는 다양한 도구들이 이미 많이 개발되어 있습니다. 예를 들면, 지금 이 책 <판다스로 쉽게 배우는 데이터분석과 시각화>의 파이썬은 물론이고, 태블로나 클릭센스처럼 시각화에 집중하는 도구들도 있기 때문이죠.


그럼에도 불구하고 이 책에 기재되어 있는 것처럼 파이썬을 추천하고 있는 이유를 보면 파이썬이 다른 언어들을 통틀어서 사람들이 가장 많이 찾고 있는 도구이자 pandas, Numpy 등 다양한 라이브러리들이 개발되어 있어 사용 방식만 알면 비교적 손쉽게 데이터 분석에 접근할 수 있기 때문입니다.



제가 이 책 내에서 주목한 부분은 바로 이 데이터 시각화 부분인데요. 보고서를 작성할 때, 단순히 줄글로 작성하게 되면 접근성도 떨어지고 공간을 많이 차지할 수밖에 없게 되는데 이 때 데이터 시각화를 통해 표현하는 것이 많은 도움이 됩니다.



파이썬 내에 존재하는 쉬운 라이브러리들 중 대표적인 것에는 matplotlib과 Seaborn이 있는데요. 각각의 라이브러리마다 표현하고자 하는 그래프가 달라질 수 있으니 이 책 <판다스로 쉽게 배우는 데이터분석과 시각화>에 있는 내용을 바탕으로 하나하나 보는 것도 좋을 것 같아요.



우리가 마주하는 데이터들을 손쉽게 관리하고 배우기 위해서 파이썬의 활용도를 높이고, 이를 바탕으로 유용한 그래프들을 그려 데이터 시각화까지 익혀 보는 것은 어떨까요? 친절하게 설명되어 있는 이 책, <판다스로 쉽게 배우는 데이터분석과 시각화>와 함께 말입니다.

*북유럽 카페의 소개로 출판사로부터 도서를 제공받아 솔직하게 읽고 작성한 리뷰입니다.



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo