-
-
Let's 태블로, 쉽게 따라하는 데이터 시각화
최정민.류민호 지음 / 생능북스 / 2023년 4월
평점 :
품절
R, 파이썬에 대한 광풍이 거세다. 전국민 코딩 열풍으로 젊은세대뿐만 아니라 IT나 관련업계에선 많은 사람들이 이 두가지 중의 하나는 대부분 잘 다룰 수 있게 되었다.
두 언어 모두 여러가지로 굉장히 강력한 툴이지만, 특히 많이 활용되는 것중의 하나는 아마도 데이터 시각화라는데 대부분 이견이 없을 것이다. 특히 많은 데이터의 경우 기존에 엑셀 그래프 등에서 확인할 수 없었던 feature를 이 두 언어로 시각화한다면 쉽게 관측할 수 있기 때문에 더 활용도가 높 은 것 같다.
하지만 역시 데이터 정제, nan 등의 결측치나 이상치 제거, 그룹핑, 필터링 등등 시각화 전단계에서 데이터에 대한 전처리는 아무리 쉽게, 사용자 위주로 만들었다고 해도 사용자 입장에서 노가다성 이벤트임에는 틀림없다. 그리고 이 두 언어용으로 많은 시각화 툴이 개발되어 있다고는 하나, 역시나 제한적으로 점, 선, 면(영역) 그래프 들에 대한 것이 대부분이다. 인구통계학이나 사회학처럼 좀더 계층적이거나 부류가 다양한 경우 이러한 단순그래프로는 특징을 잘 표현해 내는것이 쉽지 않다.
태블로는 그러한 맹점을 잘 노린 프로그램 같다. 나는 아직 사용해 보진 않았고 이 책을 통해 처음 접하긴 했지만, 보면 볼수록 한번 해보고 싶은 툴이나는 생각을 했다. 특히 원본데이터는 건드리지 않으면서도 결측치 처리 등 데이터 작업은 쉽게 되어 있다는 점에서 내 궁금증을 자극했다.
하지만 이 책의 진가는 다른데 있다. 시각화를 위한 '태블로'라는 툴에 대한 관심과 설명은 당연한 것일테고, 데이터 시각화 전문가 입장에서 시각화의 개념과 목적, 전략 등 기초부터 차근차근 설명해주는 점. 그리고 시각화 전에 생각해 보아야 할 개념인 차원과 측정값, 연속/불연속형 데이터, 데이터의 레벨 등에 대해 따로 장을 두어 설명한 점은 굉장히 도움이 많이 되었다. 특히 나도 부분적으로만 알고 있거나 어디선가 듣긴 했지만 막상 데이터 시각화할때는 이 개념들을 어떻게 고려해야 할지 잘 알지 못했는데, 이 책에서 명확히 설명해주어 가슴에 확실히 정리해 기억할 수 있었다. 특히 데이터가 연속형이냐 불연속형이냐에 따라 시각화의 방향은 굉장히 달라질 수 있다는 점은 최근에 일하면서 깊이 깨달았던 부분이라 책을 읽으며 크게 공감이 되었다.
또한 이중 축, 필터, 지도 시각화 등 다양한 기법은 굳이 태블로가 아니어도 다른 툴에서도 활용가능한 방법 같아 유의깊게 보았던 것 같다.
책이 굉장히 쉽고 읽기 편하게 직관적으로 잘 구성, 편집되어 더 머릿속에 쏙쏙 들어왔다. 시각화에 관심이 많거나 본격적으로 태블로를 사용해 보고 싶은 분들께 일독을 권하고 싶다.