시험, 생활, 교양 상식으로 나눠서 배우는 통계학대백과사전 - 실생활에 꼭 필요한 통계에 접근하는 공식, 정리, 규칙 113가지
이시이 도시아키 지음, 안동현 옮김 / 동양북스(동양문고) / 2022년 3월
평점 :
장바구니담기


   이 책의 특징과 읽는 방법에 대해서 서문에 상세히 설명하고 있다. 통계학 초보자, 중급자, 상급자 어떤 수준의 사람에게도 활용 가능한 책이다. 난이도, 실용, 시험에 따른 분류도 해 두어서 참고하면서 읽으면 도움이 될 듯하다.

   품질 관리를 접해 보았다면 QC7가지 도구에 대해서는 들어보았을 것이다. 파레토 그림, 특성 요인도, 체크시트, 히스토그램, 산점도, 그래프, 관리도이다. 히스토그램을 사용하여 프랑스의 징병검사를 피하기 위해 허위 신고한 사람을 밝혀냈다고 한다. 치수 측정의 데이터도 보통 정규분포를 나타나게 마련이지만 특이한 형태가 나올 경우 잘못 생산하였거나 측정이 잘못되었을 수 있다.

   평균, 분산, 표준편차에 대해서는 실제로 계산을 해 보면 이해가 빠를 것이다. 데이터의 합계를 데이터 크기로 나눈 것을 평균, 각 값과 평균과의 차이를 편차, 편차 제곱의 평균을 분산, 분산의 제곱 근을 표준편차라고 한다. 편차의 전체함은 항상 0이고, 분산은 데이터의 흩어짐 정도를 나타낸다.

   엑셀에서 데이터가 있을 경우 데이터를 드래그하고 나서 삽입, 추천 차트를 누르면 적당한 종류의 그래프를 추천해 주어 표현이 가능하다. 원그래프, 막대그래프, 꺾은선 그래프, 레이더 그래프, 이중 도넛 그래프 등 어떤 데이터를 나타낼 때 적당한지 파악하여 요긴하게 사용할 수 있도록 하면 좋을 것이다.

   2개의 데이터 사이에 관계성이 있을 때 이를 상관이라 한다. 상관관계가 강하더라도 변량 2개가 반드시 인과관계가 있는 것은 아니고, 상관계수로 측정할 수 있는 관계성은 직선적인 관계성에 한정된다는 주의사항이 있는 것을 알아두어야겠다.

   확률은 관측 수가 많을수록 예측이 정확해진다는 것을 증명한 야코프 베르누이, 이항분포의 근사로서 정규분포를 구하여 수학적 기반을 다진 오거스터스 드 모르간, 확률 해석이론의 라플라스에 이르러서야 고전 확률론이 완성된다. 도박에서 돈을 벌고 싶다면 배당률부터 확인할 수 있어야 한다. 포커패의 확률에 따른 표는 어떤 것이 높은 것인지 확실하게 알 수 있다. 노페어(50.12%), 원패어(42.26%), 투페어(4.75%), 쓰리 카드(2.11%), 스트레이트(0.39%), 플러시(0.20%), 풀하우스(0.14%), 포커(0.02%), 스트레이트 플러시(0.00139%), 로얄 스트레이트 플러시(0.00015%)

   데이터가 많아질수록 평균에 가까워지는 것이 큰 수의 법칙이고, 확률분포는 정규분포에 가까워지는 것이 중심극한정리이다. 대략 개체의 수가 30개를 이루면 그들의 특성이 정규분포를 따르게 된다. 대략 30명 정도의 의견과 반응만 살펴봐도 트렌드를 읽어내는데 무리가 없을 것이다. 조건부 확률 관련하여 몬티 홀 문제가 나온다. 답은 선택을 바꾸는 쪽이 확률이 높아진다. 계산식은 약간 복잡한듯하다.

   이 책은 통계학의 모든 내용을 다룬다고 보면 된다. 추정, 검정, 회귀분석, 베이즈 통계 등 통계를 모른다면 생소한 용어들이 나오기도 하지만 전체적인 통계학의 내용을 알 수 있는 책이라 생각한다.

[출판사로부터 도서만 제공받았습니다]


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo