통계학 超 입문
다카하시 요이치 지음, 오시연 옮김 / 지상사 / 2020년 1월
평점 :
장바구니담기




통계라는 것은 우리 일상에서 너무나 많이 사용되고 있고 우리가 일일히 자각하지 못할 만큼 자주 사용되고 있다. 원래 통계학이란 학문은 수학에 속하고 수식을 활용해서 이해하는 것을 전제로 한다. 선거때마다 선거 출구조사나 매일 보는 TV 프로그램 시청률 등이 통계학을 이용한 것이다. 통계학은 전수 조사를 하지 않고 약간의 샘플 데이터만 있으면 전수 조사한 결과와 거의 비슷한 수치를 산출하게 된다. 이를 통계학이라고 하는데 통계학자는 편향되지 않은 샘플을 추출하는 것이 무엇보다 중요하다고 할 수 있다. 보통 통계를 계산할 때 '무작위'로 추출한다고 하는데 어떤 작위도 있어서는 안 되기에 무작위라고 한다. 하지만 어떻게 무작위가 가능할까? 무작위가 아무렇게나 뽑는다는 것이 아니라 아무 작위 없이 하는 것은 정말 어렵다.


가장 대중적인 통계학이라고 하면 주사위를 꼽을 수 있다. 주사위 히스토그램이라고 할 수 있는데 막대 그래프다. 통계학 용어를 사용해서는 세로축이 도수, 가로축이 계급값이 된다. 히스토그램은 주사위를 예로 들어 설명하기 가장 쉬운데 주사위를 굴려 어느 한 면만 자꾸 나올 일이 없는 정교한 주사위가 통계학에 적합하다.



통계학은 단 한 번의 측정으로 얻은 값이 통계로 정할 수 있는 값이라고 할 수 없다. 원하는 값을 통계학으로 구하고 싶다면 최대한 정확하게 추계하려면 지속적으로 동일한 실험을 통해 모든 결과에 대해 그 편찻값의 추이를 확인해야 한다. 조사 대상이 되는 전체 집단을 통계학에서는 모집단이라고 부르는데 이 모집단이 같아야 각 편찻값의 추이가 확실하게 나타나게 된다.  


또 통계학에서는 '정규분포'가 중요한데 어떤 현상을 분석하고 데이터를 모아보면 그 데이터의 내용이 띄엄띄엄 있는 경우가 있다. 이렇게 데이터가 골고루 수집되지 않거나 정합성을 띠지 않는 경우가 많은데 적합하지 않은 데이터이다. 정규분포가 되는 데이터는 평균값을 경계로 그 앞뒤에 동일한 형태로 데이터가 퍼져간다. 이렇게 데이터가 정규분포이기만 해도 여러 가지 계산이나 분석을 수월하게 할 수 있다. 통계학에서 많이 사용되는 TV 시청률이나 선거 출구조사가 현대에서는 크게 의미를 가지지 않을 수도 있다. 하나의 예측이고 결과와는 다른 통계를 낼 수도 있지만 이런 통계로 예측을 하고 생활에 도움이 될 수 있는 일을 준비할 수 있거나 원하는 결과를 얻을 수 있게 할 수 있다. <통계학 초 입문>은 통계학에 대해 쉽게 이해할 수 있게 설명과 그림을 통해 알려주고 있다.




댓글(0) 먼댓글(0) 좋아요(2)
좋아요
북마크하기찜하기 thankstoThanksTo