바로 시작하는 태블로 - 데이터 시각화를 위한 가장 확실한 도구
조준희.명완식 지음 / 길벗 / 2022년 8월
평점 :
장바구니담기




드디어 태블로를 시작헀다. 시각화의 꽃이라는 바로 그 BI 툴

시작한 욕구는 간단하다.

첫 번째로 요즘 데이터분석. 그것도 딥러닝같은 CV나 자연어 등 상대적으로 깊은 영역과는 달리 간단한 머신러닝정도를 사용하는 데이터분석영역에 있어 BI 툴의 사용 능력을 굉장히 중요하게 보기 때문이다. 대학생때는 몰랐지만 인턴이나 취업해서 데이터 분석을 하다 느낀점은 생각보다 내가 만나는 사람들의 데이터 혹은 숫자의 해석능력이 뛰어나지 않다는 점. 어떻게 보면 당연한 듯 싶다. 숫자를 업으로 살아가는 사람과 그렇지 않은 사람들과의 차이점은 있을 수 밖에 없으니까.. 그런점에서 이 괴상한 숫자들의 조합을 통해 사람들을 설득하기 위해서는 논리력과 동시에 간단하게 풀어쓰는 능력이 필요하고 그 두가지 요소의 핵심이 바로 시각화다. 태블로의 경우 그 측면에서 가장 많이 쓰고 쉽다는 점에서 배우는 것을 시작 하게 되었다. 예전 교육 받을 때 power bi 도 써봤는데 그 떄는 관심이 없어서 그랬는지 어려웠음...

두 번째로 R의 ggplot 에서 한계를 많이 느꼈기 때문... 이쁘긴한데 이걸 한글이나 피피티로 옮기다 보면 너무 투박해져서 문제 게다가 태블로의 대시보드의 실시간 업데이트? 너무 편리해보였음 ctrl + enter 더이상 광클안해도 됨

상기 이유로 태블로에 대한 도전 욕구가 생겼고 바로 시작하는 태블로 서평이벤트에 지원해서 출판사로부터 이렇게 책을 무료로 제공 받아 공부하고 서평을 쓰게 되었다.




막대차트

책을 읽어보니 이 책은 정말 태블로를 처음 시작하는 사람에게 알맞은 책이다.

원래는 9월 첫 째주에 이 책을 받고 공부하고 9월 셋째주에 태블로 신병훈련소에서 활동하려 했는데 책이 늦게와서 신병훈련소에 먼저 들어가고 이 책을 받게 되었다. 훈련소 활동 막상해보니 태블로 공홈에 있는 영상보고 이거 해오세요~ 식으로 끝나는데 사실상 거의 이 책이랑 구글링으로 해결했음.

머릿속에 있는 차트를 구현하기만 하면 되는데 뭐부터 해야하지...? 라는 의도에 적합한 책임. 태블로 데이터 페스타에서는 간단한 머신러닝 까지되던데 EDA도 못하는데 첨부터 그런걸 구현하려고 했던 내가 바보였음.


처음 할 때, 코딩으로 그리다 가장 낯설었던 점이 바로 저기 마크인데 R에서의 group by나 fill, col 등의 내용이 들어가는 곳인데 갑자기 저걸 활용해서 차트 그리라고 해서 혼자 한창 만지다가 결국 이책보고 해결했다.

엄청 상세하게 나와있어 너무 좋음

예시도 나와있는 것도 맘에 드는 부분




공부해서 만든 대시보드



오늘 회사 프로젝트때 만든 시각화 차트

책은 정말 다양한 차트를 그릴 수 있게 친절하고 자세하게 설명을 잘해놨음. 보통 책을 보면 구글링도 같이 하게되는데 책하나만 보고도 다 따라 할 수 있게 만들어 놓은 점이 좋음. 아쉬운점은 시각화 그 자체에만 초점이 맞춰져 있다는 것.... 대시보드나 머신러닝까지 다뤘으면 좋겠지만 그럼 책이 1000p가 넘어가야 해서 어쩔수 없긴 하겠다.

그래서 완전 처음 태블로에 입문하는 사람이 처음 보는 책으로 추천함. 태블로를 좀 다뤄봤던 사람에게는 너무 쉬운내용이라 필요 없을 듯



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
Do it! SQL 입문 - 비전공자도 개발자도 쉽게 배우는 기초 문법 + 실용 예제 Do it! 시리즈
강성욱 지음 / 이지스퍼블리싱 / 2022년 7월
평점 :
장바구니담기


데이터 분석 직무로 입사해 다양한 데이터를 다루고 있지만 현 회사는 자사 제품이나 서비스를 보유하고 있기보다는 컨설팅 쪽에 가까워 자체 데이터를 가지고 있지 않다. 쭉 근무를 해보니 데이터 없는 데이터 분석가는 그다지 할 수 있는게 많지 않기에 내 다음목표는 이러한 한계가 극복된 곳에서 일하고 싶다는 쪽으로 설정되었고, 이를 위해 꼭 필수적으로 익혀야 할 것이 자체적으로 데이터를 추출할 수 있는 SQL 능력이라 생각되었기에 SQL 공부를 시작헀다.

공부 시작 전 어떤 경로로 공부를 할까 고민했었다. 인강이나 스터디도 있었지만 가격이 너무 비싸고 스터디는 적절한 곳을 찾지못해 책으로 공

부를 하기로 결정했다. 그러다 우연히 Do it 시리즈 서평이벤트를 발견하여 책을 신청하고 공부를 하고 있다.

Do it 시리즈는 본인에겐 굉장히 익숙하고 또한 반가운 책이기도 하다. 3년 전, 데이터 분석쪽에 관심이 생겨 처음 공부를 시작했을 무렵 두번째로 봤던 책이기 때문이다. 두 번째가 기억에 남는 이유는 첫 번째 책을 읽고는 도대체 뭔소린지 이해를 할 수 없었기 때문이다. R 을 예시로 들자면, 프로그래밍을 처음시작하는데 리스트에 밸류를 박고 인덱싱을 통해 데이터를 추출해서 apply sapply를 통해 분석결과를 내놓을수 있다... 이런식으로 시작하더라. 책을 보는데 현타가 쎄게와서 이 길은 내 길이 아닌것 같다라고 통계학과였던 인턴 동기한테 찡찡거렸는데 그 때 그 동기가 추천해줬던 책이 'do it! 쉽게 배우는 R 데이터 분석' 책이었다. dplyr 문법으로 입문자에 눈높이에 맞춰 설명해주는데 어찌나 반갑던지... 암튼 이 책 또한 같은 맥락에서 좋은 책이다. 공부를 하며 느낀 장점은 다음과 같은데


장점 1. 글이 많지 않다. 빽뺵하지 않다. 여유로운 읽기 가능. 그림이 많다.

첫 번째는 책에서 글이 큰 비중을 차지하지 않는다. 철학과를 나왔지만 글로 꽉찬 책을 보면 한숨부터 나오는데 이게 굉장히 중요한 포인튼데 보통 이 책을 읽는 독자들의 경우 프로그래밍 혹은 SQL 쪽에 익숙하지 않은 경우가 많은데 글로만 주저리주저리 떠들면 뭔말인진 알 순 있어도 막상 실제 쳐볼려고하면 암것도 생각나는게 없다.

내가 프로그래밍에 굉장한 경험이 있는건 아니지만 보통 어떤 분석을 할때 이렇게 해서 이렇게 하면 이렇게 결과가 나오겠다 정도는 인식을 하고가야(머리속으로 그림을 그려야) 문제가 생겨도 해결할 수가 있는데 글만 있으면 글만떠오르지 해결 할 수 있는 실마리를 찾을 수 없다. 그런 측면에서 독자인 초보자나 비전공자 등에 초점을 잘 맞췄다는 생각이 든다.

장점 2. 많은 예시와 문법



개인적으로 코딩 공부할 때 중요한건 내가 어떤 작업을 하고 있을 때 '어 그거 거기서 봤는데' 이거라고 생각한다. 위에서 얘기한 것과 비슷한 맥락인데 뭔가 해야하는데 한번도 해보거나 본 적없는 과정이 나오게되면 뭘 찾을수도 없음.. 그래서 한번이라도 눈으로 봤던게 굉장히 중요하다. 하지만 한권에 책에 넣을수 있는 개념은 한정되어있기 때문에 저자가 뭘 넣느냐에 따라 책장 깊은속에 쳐박힌 책이 될수있고 노트북옆에 꺼내두는 책이 될수 있는데 이건 후자에 가깝다고 할 수있다. 실제 SQL을 사용하며 업무를 하고 있진 않지만 R을 사용할때 많이 사용하는 개념이 많이 있기 때문에...

3. 쿼리작성 같은 실질적인 꿀팁.

마지막으로 사실 이런게 제일 좋았다.


예전에 row 개수가 2천만개 정도되는 데이터를 R로 분석할 때가 있었는데 간단한 그룹바이와 써머라이즈 구문을 쓰고 결과를 도출하려하니 작업당 5분이 걸리더라... 간단한 EDA만 하려헀는데 시간이 너무 걸려 아 이건 무조건 컴퓨터 문제다! 돈을 더 질러야 한다 식의 결론으로 귀결됐는데 이 책과같은경우 그런 부분도 콕집어서 알려주고 주의를 주는점이 굉장히 맘에 들었다. 처음보는 사람이야 기본문법 익히는데 정신없겠지만 두세번 보고 조금 익숙해진 사람은 그런 부분도 어느정도 신경을 쓰기 시작해야 하니까...

결론적으로 입문자나 처음 공부할때 옆에 끼고 공부할 책으로는 괜찮은 듯 하다...!

[서평이벤트로 책을 지원받아 쓴 리뷰임]



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo