-
-
아빠가 들려주는 R 통계 - 샤방샤방 R Shiny 통계
김지형 지음 / 북앤에듀 / 2020년 1월
평점 :

통계는 읽어내야 하지만, 매번 버거운 대상이었습니다. 아직도 가깝지 않기에 다시 공부를 시작하기로 한 지금, 이번엔 제대로 공부해보자는 마음 하나로 시작한 이번 책. '아빠가 들려주는' R 통계였습니다. 제게 아빠라는 존재가 푸근하게 설명해 주는 면도 있고, 보통 서적에서 아빠가 들려준다고 하면 아이에게 풀어주는 류의 책을 보아서 그런지 이번 책도 통계의 입문이나 큰 흐름 정도만 파악할 수 있겠다며 편한 마음으로 읽으려 했어요. 그랬는데 아빠가 들려주기는 하지만, 친절하게 저와 같은 왕초보를 위해 하나부터 열까지, 다 알려주시지만 하하... 입문 수준에 머무를 줄 알았던 통계는 입문은 입문이되 조금 더 전문적인 내용이 담겨있더라고요.
책 두께를 보고는, 논문이나 기사 등에서만 보던 통계 자료가 따닥 따닥 붙어있을 거 같은 느낌으로 시작했는데 또 막상 읽어보니 의외로 이해가 되네? 하면서 쭉 읽었는데요. 읽다 보니 막혀서 일단 앞 부분만 선생님께서 적어주신 사이트에 접속해서 통계 수를 입력해볼까 했는데 읽기만 하는 것과는 다르게 더 재밌기도 하고, 이해도 잘 되는 듯했어요. 그렇게 기뻐하다가 다시 막혔던 부분으로 돌아왔는데 이번에는 읽기 먼저 하는 걸 방법을 바꿔서 이해가 안 돼도 입력을 먼저 하고 컴퓨터 상에서 봐 봤는데 의외로 이 방법이 더 적합하더라고요.
그렇게 열심히는 봤지만, 훑어본 것에 가까웠던 내용들을 약간 적어보면
다른 학습지를 푼 두 학급을 두고, 더 나은 학습지를 찾는 실험이 있었습니다.
그중 b 학급의 성적이 높았어요. 그럼 a 학급이 푼 학습지와 b 학급이 푼 학습지 중 어느 학습지를 사용해야 할까요?
당연히 b 학급의 학습지겠죠?
정답입니다~라고 하고 싶지만, 우린 월드컵처럼 우승을 따지는 게 아니라, 어느 학습지를 사용하는 게 더 나을지를 찾는 거라고 해요. 고로, 성적을 보고 판단하는 게 아니라
a 학급과 b 학급의 신뢰구간과 p-value를 봐야 하는 거죠.
이 실험에서 95%의 신뢰구간은 0을 포함하고 있습니다. 결국 제로 값이 있다는 건, 차이가 별로 없다는 뜻.
결론 도출이 불가능한 상태죠.
p-value에서도 마찬가지로 0.07919의 p-value는 0.05보다 큰데 이 경우에도 결론을 낼 수 없다고 해요.
b 학급이 더 좋을 거 같지만, 실제로는 사람 수가 적어서 결론이 나지 않는 경우도 많죠.
당연하다고 생각했던 게 그게 아니라는 데서 정신이 번쩍 들었지만, 글이 친절하군이라는 생각과 함께 차분 차분 읽으니 가지고는 있었지만 잘 활용하지 않았던 관점이 뜨이더라고요.
그 외에도 닷에서 세모로 바꾸기, 네모 박스가 바이올린 박스로 바뀌는 것 등도해보면서 이미지는 이미지구나 하며 쉬어가기도 했답니다. 개인적으론 큼직한 네모 박스로 나뉘는 이등분이 가장 좋았어요. 물론 그 이후에 더 세밀하게 설정해야 하는 값들을 더 많이 사용하게 되겠지만요. 중간중간 잘 모르겠다면 이것만 이해해도 됩니다 와 같은 독자의 마음을 헤아려주시는 부분에서도 괜히 위로받으며 읽었답니다.
왕초보 편 처음에 이 부분만 읽고 끝날 사람도 있다는 말씀이 있었는데, 그게 저였나 봐요... 그래도 나름 뒷부분도 읽긴 했지만 정말 입문 수준에 머무르고 다시 공부를 시작하면서 이쪽 분야에 더 깊어졌을 때 다시 열어볼 책이 된 거 같아요. 다행히 세세하게 설명해 주시는 이 책을 만나서 다음 통계 자료 제작 때는 저번보단 더 편하게 만들 수 있지 않을까 하는 기대감으로 오늘의 기록도 끝입니다.
*출판사로부터 도서를 제공받았습니다.