Do it! 코드 없이 배우는 데이터 분석 with 오렌지3 Do it! 시리즈
권서림 지음 / 이지스퍼블리싱 / 2024년 12월
평점 :
장바구니담기


이지스퍼블리싱 서평단으로 선정되어 도서를 지원받아 쓴 글입니다


오렌지에 남다른 애정을 갖고 있어서 오렌지 책이 나올 때마다 모두 살펴본다. 그런데 지금까지 마음에 들었던 책은 딱 한 권 뿐이었다. "오렌지 쉬워요. 이렇게만 따라만 하면 결과가 짜잔 나와요" 식의 책은 항상 부족했다. 오렌지는 그렇게 쉽지만은 않다.

애정하는 이지스퍼블리싱에서 나온 책이라서 꼼꼼하게 봤다. 우선은 분량이나 어투에서 "쉽죠? 날 따라해봐요 요렇게~"가 아니라서 안심이 되었다. 그런 책은 이미 많이 나와 있으므로 또 나올 필요는 없을 것 같다.




목차는 데이터 분석의 필요성, 분석 절차, 오렌지 설치하기, 데이터 전처리, 탐색적 데이터 분석으로 흐름을 그대로 따라가고, 오렌지의 장점이라고 할 수 있는 회귀, 분류, 군집화, 이미지 분석, 텍스트 분석으로 이어진다. 익숙한 흐름이다. 처음부터 차근차근 따라서 공부하기 좋은 구성으로 되어 있다. 설명도 비교적 친절한 편이다. [질문 있어요] 코너를 통해 조금 자세히 알아야 할 내용에 대해서 설명을 붙였고, 단원마다 퀴즈를 통해 복습을 하게 되어 있다. 그래도 풀리지 않는 의문들은 [Do it! 스터디룸] 카페를 통해 해결할 수 있다.



단순히 위젯을 "이렇게 이렇게 연결하면 이런 결과가 나와요" 하고 보여주지 않고 알고리즘들에 대한 설명도 적절한 그림과 함께 제시되어 있다. 이런 점들은 오렌지로 머신러닝에 대한 기초를 다지고 텍스트코딩으로 넘어가려는 목적을 가진 독자들에게도 도움이 될 것이다.


한편 아쉬운 점도 보인다. 모델을 학습시킨 후, 실제로 적용할 때는 Predictions 위젯을 사용하게 되고, 적용 시에 입력되는 데이터에는 타깃값이 없다. 타깃값을 모르기 때문에 그 값을 예측하는 목적으로 이 모델을 사용하기 때문이다. 따라서 Predictions 결과창에는 평가지표가 나오지 않는 것이 보통이다. 평가지표는 타깃값을 이미 알고 있어야만 구할 수 있는 값이므로... 그런 내용에 대해서는 처음에 아주 살짝 설명하고, 이후에는 끝까지 Test and Score로 대체한 것은 좀 아쉽다. 그리고 오렌지에서 이미지를 다룰 때에는 embedding 과정을 거치며 이는 픽셀의 RGB값을 사용하기 보다는 보다 고차원적인 측징을 추출해 낸다.




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo