사례 분석으로 배우는 데이터 시각화 - 막대 차트부터 대시보드까지 태블로로 실습하며 배우는 인사이트 도출법
황재진.윤영진 지음 / 한빛미디어 / 2022년 6월
평점 :
장바구니담기


데이터 시각화는 정말 중요하다. 남에게 보여주기 위해서, 내가 하고자 하는 말을 전달하기 위해서 중요하다는 것은 당연하다. 이 뿐 아니라 나 스스로, 데이터를 이해하기 위해서도 시각화는 필수적이다. 뭐 이것은 사실 폭 좁은 이야기긴 하지만, 이쪽 분야에서도 좋은 저널과 좋은 학회일수록 기가 막힌 데이터 시각화를 보여주는 경우가 많다. 

 

데이터 시각화는 사실 배우기가 애매하다. 나는 그냥 인터넷을 돌아다니면서 괜찮은 것들이 있으면 참고를 하면서 배웠던 것 같다. 사실 데이터 시각화를 배우는 데에 있어서 어떤 체계가 있을 것이라는 생각은 하지 않았는데, 이런 책이 있다. 읽어보았는데, 꽤 내용이 있던 것 같다. 특히 사례 분석이라는 것이 좋았는데, 나는 항상 이론보다는 실전파여서 직접 뭘 해봐야 배운다고 느끼는 사람이라 마음에 들었다.

책을 만든 사람은 두 명이다. 학벌이 꽤 좋다.

책은 5개의 챕터로 이루어져 있다.

  • 데이터 시각화 알아보기: 데이터 시각화란 무엇일까요?
  • 데이터 시각화 준비하기: 데이터 시각화 사전 작업과 도구 알아보기
  • 데이터 시각화 시작하기: 차트 유형별 데이터 시각화 기법 알아보기
  • 데이터 시각화 끌어올리기: 대시보드와 스토리 만들기
  • 데이터 시각화 적용하기: 데이터 시각화로 사례 분석하기

다섯번째 챕터가 실전이다. 데이터를 시각화하여 이 사회에 어떤 일이 이루어지고 있는지 알아낸다.

예를 들어 서울특별시 공공 자전거 현황 분석에서는, 사람들이 언제, 어디서 자전거를 탈 지 수요를 예측하기 위한 뒷받침 자료를 만들 수가 있다. 아니면 전국 종량제 쓰레기봉투의 가격이 다른지, 다르다면 얼마나 왜 다른지, 가격을 어떻게 책정해야 하는지를 찾는다.

이를 보면서 이 책에서는, 단순히 데이터를 예쁘고 이해하기 쉽게 보여주는 것뿐 아니라 시각화를 통해 어떤 연구가 진행될 수 있음을 확실하게 전달하고 있음을 느꼈다. 

요즈음에는 인터넷에 정말 많은 데이터들이 쉽게 접근할 수 있도록 되어 있고 이를 적절하고 효율적으로 활용하는 것이 큰 능력이라고 생각한다. 그리고 이 능력은 운전 면허와 같이 당연히 가지고 있어야 하는 기본적인 능력이 될 것 같다. 

이 책에서 나온 예시들은 사실 나의 현재 상황과는 맞지 않지만, 이 책에서 나오는 여러 지식이나 접근 방식은 큰 도움이 될 것 같다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
파이썬 기반 금융 인공지능 - 파이썬과 케라스를 활용한 금융 시계열 데이터 기반 알고리즘 트레이딩 전략
이브스 힐피쉬 지음, 김도형 옮김 / 한빛미디어 / 2022년 9월
평점 :
장바구니담기


이브 힐피시라는 저자가 주로 파이썬을 활용해서 퀀트 투자를 하는 사람인 것 같다.

 

지난 번 책에서는 금융 분석을 하고 인공지능 얘기는 뒷부분에서 짤막하게 다루어졌다면, 이번에는 인공지능이 주된 내용이다. 사실 금융 인공지능을 만든다고 해도 금융에서 주로 사용되는 개념들은 알고 잇어야 하는데, 이번 책에서는 그런 내용은 조금 적었던 것 같다.

책의 앞뒤는 위와 같이 생겼다.

오레일리의 책에는 항상 어떤 동물이 그려져 있는데,

이번에는 둑방쥐라고 한다. 

 

이 책은 엄청나게 긴데 (>400페이지) 그만큼 목차도 굉장히 길고 다양한 내용이 있다.

목차만 해도 정말 많은데, 그 중에 큰 주제만 가져와봤다.

처음에는 인공지능이 무엇인지에 대한 설명부터, 금융 인공지능을 만들기 위해 필요한 금융 쪽 개념들과 실전 인공지능 구현을 한 후, 테스트해보는 큰 흐름을 가지고 있다. 이론적인 내용 말고도 마지막에는 이 인공지능을 활용한 투자에 대한 전망과, 좀 더 자세한 인공지능에 대한 설명이 있다.

특히 전망 분야가 조금 재미있어보였다.

만약 기계가 모든 투자를 하게 된다면 결국 사람이 투자를 하던 시대와 비슷하게 기계들끼리의 경쟁이 일어날 것이라는 내용이다. 그렇게 될 경우 어떻게 하면 좋은, 똑똑한 인공지능을 만들 수 있을지와 그러한 사회가 될 때 어떤 사회적인 규범이 새롭게 생겨나고 고민되어야 하는지를 설명한다.


최근 인공 지능이 발전함에 따라 정말 많은 분야에서 사용되고 있는데, 돈과 직접적으로 닿아있는 퀀트 투자는 정말 매력적인 것 같다. 나도 몇 번 시도해보고 잘 안 되긴 했었는데, 만약 퀀트 투자, 그 중에서도 인공 지능을 활용하고 싶다면 읽어보면 좋을 것 같다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
데이터로 전문가처럼 말하기 - 효율적 의사 전달을 위한 데이터 시각화와 비즈니스 스토리텔링의 기술
칼 올친 지음, 이한호 옮김 / 한빛미디어 / 2022년 8월
평점 :
장바구니담기


회사에서도 그렇겠지만 (다녀보지는 않았지만), 대학원에서도 데이터를 정말 잘 다뤄야 한다. 다룬다는 것이 데이터를 처리하는 것도 그렇지만, 이번에는 보여주는 것을 말한다. 데이터를 잘 정리하고, 이를 이해하기 쉽게 우리가 원하는 의도를 전달할 수 있도록 시각화하는 것이 정말 중요하다. 특히 논문을 작성하는 과정이나, 연구 결과를 남에게 발표할 때 중요하다.

나도 논문을 현재 정리하면서 논문에 들어갈 figure를 만드는 일을 많이 하고 있어서 이 책이 특히 관심이 갔다. 데이터를 잘 뽑는 것은 실험의 영역이지만, 이를 어떤 플롯을 사용해서 비주얼라이즈 할지, 어떤 색깔을 사용하여 우리의 연구를 강조할지, 여러 패널이 있을 때 각각의 크기는 어떻게 할지 등 정말 다양한 고민거리가 생긴다. 그리고 이 과정에서 그림을 그리다 보면 어떤 실험을 추가로 할지 생각이 나기도 한다.

이 책에서는 이런 여러 과정들이 모두 포함되어 있다. 데이터를 비주얼라이즈 하는 여러 가지 방법을 보여주기도 하고 색에 관한 내용들도 나온다. 사실 나는 색이라는 것에 엄청 관심을 가지고 중요하다고 생각하는 사람인데, 그 내용을 다루고 있어서 좋았다. 

 

책의 앞면과 뒷면은 다음과 같다.

오레일리라고 하는 출판사의 책을 한빛미디어에서 번역한건데, 아마 컴퓨터에 관심 좀 있으면 오레일리는 다 아실 것이라고 생각한다. 오레일리 책은 항상 표지에 고퀄의 동물 사진이 들어가 있는 것이 특징이다.

 

이 책에 대한 설명은 위와 같은데, 데이터 기반 커뮤니케이션이 이 책의 주제이다. 즉, 데이터를 바탕으로 어떤 의견을 어떻게 효과적으로 전달할 수 있을지에 대한 책이다. 이는 사실 연구에서 뿐 아니라 기업이나 대학 생활에서도 정말 정말 중요한 것일 테다. 

 

목차는 위와 같고, 이 책은 크게 

  • 커뮤니케이션과 데이터
  • 데이터 시각화 요소
  • 실무에서 데이터 커뮤니케이션의 활용

이렇게 3개로 나뉜다. 

첫번째 파트에서는 데이터가 무엇인지에 대한 입문에 해당하는 내용이고, 두 번째가 이제 데이터를 어떻게 보여줄지에 대한 내용, 세 번째가 효율적인 커뮤니케이션을 위한 팁에 해당한다.

두 번째 파트가 중요한 이론적인 내용이라면, 세 번째 파트에서는 좀 더 실무에 다가가 유용한 팁을 주는 느낌이 있었다. 

 

두 번째 파트에 있었던 색 적용이라는 내용이다. 데이터를 비주얼라이즈 하면 색의 선택이 정말 고민이 많이 된다. 전체적으로 대비를 주어야 하고, 우리가 원하는 것을 강조를 해야 하고.. 이런 것들은 쉽게 알 수 있지만, 그것에서 조금만 더 깊게 들어가고 자세한 이론적 내용은 잘 모르기 마련이다. 그 궁금증에 대한 갈증을 이 책이 잘 해결해주었다고 생각한다. 나도 지금 그림을 그리면서 색을 계속 이것저것 시도해보고 있는데... 색이라는 것이 정말 기초적이면서 효과적이고, 또 다루기 어려운 것 같다. 좋은 논문의 figure는 너무 예쁜데, 그에 비해 내 figure는 뭔가 왠지 모르게 엉성해 보인다. 

그 외에도 생각해보지 못했던 여러 시각화 방법들도 있어서 영감을 얻기 좋았다. 대단한 논문들은 그에 맞게 독창적이면서 주장하고자 하는 바를 효과적으로 전달하는 그래프가 하나씩 있었던 것 같다. 이 책을 보면서 나도 아이디어를 얻고 있다.

 


데이터가 넘치고 넘쳐나는 요즘 시대에, 이를 잘 정리하고 효과적으로 보여주는 능력은 어느 곳에 있더라도 중요한 것 같다. 그런데 이는 배우기가 은근히 어렵다. 가끔 웹페이지에서 꿀팁이 있는 경우는 있지만, 그때 한 번 보고 잊어버리거나 그것으로 배운 지식이 나에게 잘 남지는 않았던  것 같다. 오히려 책으로 처음부터 끝까지 이렇게 정리가 되어 있는 것이 오히려 좋을 것 같고, 뿐만 아니라 이 책에는 정말 데이터 시각화와 전달에 대한 자세한 내용과 팁이 들어 있어서 정말 좋은 것 같다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
맛있는 디자인 프리미어 프로 & 애프터 이펙트 CC 2022 - 누구나 쉽게 배워 제대로 써먹는 그래픽 입문서 맛있는 디자인 시리즈
김덕영 외 지음 / 한빛미디어 / 2022년 1월
평점 :
구판절판


대학교 대학원을 다니다 보면 은근 포토샵, 프리미어와 같은 어도비 프로그램들을 다룰 때가 있습니다. 저는 원래도 이런 프로그램을 다루는 것에 관심도 있었고 많이 찾아봤어서 좀 더 열심히 사용한 것 같습니다.

대학원에 있는 현재, 꽤 어도비 프로그램들을 자주 사용합니다. 저는 일러스트레이터랑 프리미어를 주로 사용하는 것 같습니다. 논문에 들어갈 때 그림이나 피피티에 들어갈 삽화를 그릴 때 주로 일러스트레이터를 이용하고 논문에 서플리멘터리 영상을 만들 때에도 매트랩으로 어느 정도 만들고 프리미어로 후처리를 합니다. 꼭 연구와 관련된 것이 아니더라도 조교 일을 할 때 실습 영상을 만들어야 된다거나, 과에서 행정일 중에 가끔씩 동영상 편집을 해야 하는 경우가 있습니다.

이런 일들이 해보면 엄청 손이 많이 가고 노가다인 경우가 많은데, 뭔가 제 안의 창작 욕구는 자꾸 저런 일들을 나서서 하게 만들더라고요. 이번에 받은 책은 동영상 편집의 큰 두 개의 프로그램인 프리미어 프로와 애프터 이펙트입니다.

 

초보자의 시점에서 조금 요약을 해보자면,

프리미어가 전반적인 동영상 편집, 예를 들어 여러 동영상들을 이어주거나 자막을 다는 것들에 특화가 되어 있다면 

애프터 이펙트는 여러 효과를 넣어주는 역할을 합니다. 애프터 이펙트가 뭔가 좀 더 신기하고 재미있는 느낌이 있습니다.

 

그래서 어릴 때에도 애프터 이펙트로 만든 재밌는 영상을 따라 만들곤 했는데, 너무 어렵고 저의 한계가 느껴져서 접었던 기억이 나네요. 아무튼 정말 신기하고 복잡한 효과들이 많이 있고, 프리미어에도 애프터 이펙트의 기능이 조금씩 들어오고 애프터 이펙트에도 프리미어의 기능들이 조금씩 들어오는 것으로 알고 있습니다.

 

책은 다음과 같이 생겼습니다.

특히 책 뒤에 있는, "무작정 따라 해서는 실력이 늘지 않습니다."라고 하는데 제가 사실 무작정 따라 하다가 안 하게 된 케이스인 것 같긴 합니다.

이게 기능이 너무 많아서 무작정 따라 해서 남의 영상을 비슷하게 만들 수는 있어도 그 기능을 나중에 다시 사용하지는 못하더라고요.

 

책은 이제 두 개의 독립적인 프로그램을 다루는 책으로 크게 Part 1과 2로 나뉘어 있습니다. 분량도 거의 비슷한 것 같고, 전체적인 테마도 비슷해서 하나하나씩 따로 봐도 좋고 처음부터 모두 읽어도 상관없을 것 같습니다.

 

위와 같이 파트 1과 파트 2가 있고 목차는 저런 식으로 되어 있습니다.

 

어도비 애들은 원래 프로그램이 년도별로 이름이 다르게 해서 다른 프로그램으로 있었는데, 얼마 전부터 크리에이티브 클라우드(CC)라고 해서 뭔가 어도비 프로그램들을 통합적으로 관리할 수 있고 계속 연도별로 업데이트를 해주는 식으로 바뀌었습니다.

연세대도 그렇고 카이스트도 이제 학교에서 CC 계정을 하나씩 만들어주어서 어도비에 있는 웬만한 프로그램들을 모두 사용할 수 있는데, 이래서 정말 학생이라는 신분이 좋은 것 같습니다. 이게 직접 구독하면 돈이 꽤 비싸거든요.

이 책은 이제 최신 버전인 CC 2022년도를 위한 책으로 프리미어와 애프터 이펙트 둘 다 새로운 기능이 무엇이 생겼는지 위 사진처럼 한 장으로 정리해놓았습니다. 사실 저를 포함한 초보자 분들은 모든 게 신기능이라 잘 모르겠지만 이전 버전의 프로그램을 계속 사용하고 계셨던 분들에게는 꽤 유용할 것 같네요.

 

최근에 조교 일 관련해서 동영상을 만들어야 하는 일이 있었는데, 마침 이 책을 보게 되어 유용하게 잘 사용했습니다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
파이썬을 활용한 베이지안 통계 - 동전 던지기부터 월드컵까지 다양하게 배우는 데이터분석, 2판
앨런 B. 다우니 지음, 권정민 옮김 / 한빛미디어 / 2022년 6월
평점 :
장바구니담기


머신 러닝이 정말 마법처럼 보일 수 있지만 실제 논문을 보게 되면 꽤나 수학적인 것을 알 수 있다. 꽤 가끔 베이즈, 베이지안이라는 단어를 볼 수 있다. 머신 러닝에는 미적분도 많이 사용되지만, 확률과 통계 지식이 정말 많이 사용된다. 그중 우리가 주로 볼 수 있는 것은 베이즈 정리이다. 아마 이때 베이즈라는 이름을 알게 될 수 있을 것이다. 좀 더 자세히는, Variational AutoEncoder (VAE)를 공부할 때 베이즈 정리, posterior, prior 등등의 용어들을 볼 수 있다. 그리고 베이즈 정리는 아니지만, 노이즈를 다루게 되면 확률과 통계 지식이 많이 필요하게 된다. 디노이징 논문을 보다 보면 알 수 있다.

본 책에서는 베이지안 통계를 다루는데, 파이썬을 이용한다. 베이지안 통계는 베이즈 정리에 기반한 이론인데, 베이즈 정리는 두 확률 변수의 posterior와 prior 사이의 관계를 나타내는 정리이다. 좀 더 쉽게, 다른 방향으로 말하면, 어떤 새로운 관측들이 있을 때 내가 가지고 있던 가설이 얼마나 더 맞게 되었는지, 아니면 더 신뢰할 수 없게 되었는지를 알 수 있는 정리이다. 사실 처음 배우면 꽤 이해하기 어려운 내용들이다. 나같은 경우도 수업에서도 들었고 논문을 읽으며 찾아보기도 했는데 그렇게 해서야 얼추 이해가 되었다. 아직도 정말 백 퍼센트 완벽한 수준은 아니다. 이 책은 그래도 읽어볼 만한 것 같은데, 정말 내용이 알차다. 이 책은 내가 연구할 때 꽤 도움이 될 것 같아서 시간을 좀 내 제대로 한 번 읽어보려고 한다.

 

책은 다음과 같이 생겼다. 오레일리 책들의 디자인은 꽤 수집욕을 불러일으킨다.

 

책에 대한 설명인데, 수학 기호 대신 코드를 사용하여 설명한다는 점이 인상깊었다. 사실 논문들을 읽다 보면, 결국에는 그렇게 어려운 내용이 아닌데 복잡한 수식들로 도저히 읽지 못하게 만드는 경우가 있다. 이 책에서는 코드와 이산적 개념으로 설명한다고 하며, 프로그래밍을 할 줄 아는 사람들에게 더 이해하기 쉬울 것이라고 말하는데 약간의 감동이 있었다.

다만 맨 밑 줄에 "하지만 우리는 사이파이를 사용하므로, 각 분포의 특성을 알 필요는 없다"고 하는데 조금 별로였다. 뭐 연구를 할 사람들이 아니라면 Scipy와 같은 패키지만 적극 활용하여 실험을 돌려보면 좋겠지만, Scipy 내부가 정확히 어떻게 돌아가는지 이해를 못 하면서 책에 써져 있는 코드만 따라 하는 것은 좀 부정적이다.

 

목차는 다음과 같다.

  1. 확률
  2. 베이즈 정리
  3. 분포
  4. 비율 추정
  5. 수량 추정
  6. 공산과 가산
  7. 최솟값, 최댓값 그리고 혼합 분포
  8. 포아송 과정
  9. 의사결정분석
  10. 검정
  11. 비교
  12. 분류
  13. 추론
  14. 생존 분석
  15. 표식과 재포획
  16. 로지스틱 회귀
  17. 회귀
  18. 켤레사전분포
  19. MCMC
  20. 근사 베이지안 계산

 

각 챕터마다 다음과 같이 한 페이지로 간략하게 설명을 해주는데 이론으로 들어가기 전 갈피를 잡을 수 있어서 좋았다.

 

몇 가지 느낀 점은 대부분 영어를 안 쓰고 한국어로 되어 있는데 또 그렇게 어색하지는 않은 것 같다. 그리고 MCMC나 Approximate Bayesian까지 다루는 것을 보면 나름 전문적인 내용도 담고 있기에 정말 좋았다. 

그리고 거의 대부분의 챕터에서 이론을 설명할 때 어떤 예시 문제와 함께 설명을 한다. 그 문제는 물론 설명하고자 하는 이론이 사용되는 것인데, 이 덕분에 막연히 이론적이라고 보일 수 있는 내용이 실생활과 좀 연관 지어지는 것 같다. 그리고 페이스북 면접 문제들도 종종 있어서 직업을 구할 때에도 도움이 될 것 같다. 이 베이즈 정리가 별 거 아닌 것 같으면서도 정말 중요하고 기본적인 이론이라서 개발자를 뽑을 때 많이 물어보는 것 같다.

 


정말 나에게 딱 필요한 책이었다. 베이즈 정리가 스스로 공부한다고 하면 은근 막연한데, 이 책으로 공부할 만한 것 같다.

머신 러닝과 데이터 사이언스에서 필수적으로 요구되는 지식인 베이즈 정리를 이 분야 사람들, 그리고 아직 자세히 모르는 사람들이 쉽게 이해할 수 있도록 만들어 놓았다. 논문들로 공부를 하기보다 이 책을 읽고 난 후 논문을 읽어보면 훨씬 깊게 이해할 수 있을 것이다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo