문과 출신도 쉽게 배우는 통계학
타카하시 신.고 가즈키 지음, 오시연 옮김 / 지상사 / 2022년 2월
평점 :
장바구니담기



당신의 연봉은 안녕하신가요?

우리 나라 평균 근로소득과 비교해 보셨나요?

TV나 인터넷에서 '올해의 연봉 평균값'에 관련된 기사를 종종 보게 된다.

그러면 나도 모르게 약간의 기대를 한다.

오르지 않는 내 연봉. 그래도 평균은 되겠지?

하지만 기대와 달리 기사를 보고 나면 맘이 좀 상한다.

아 평균도 안되는 인생.

《문과 출신도 쉽게 배우는 통계학 》책을 보고 알게되었지만,

아마 인구의 반 이상은 나처럼 맘이 상했지 않았을까 싶다.

왜?

평균이라면? 반반 아닌가?

결론부터 말하면 아니다. 이 책을 보니, 이 평균에 대한 오해가 많았다.

아래 통계청 발표자료를 보자.

<2020년 평균 근로·사업소득, 중앙값, 통계청>

특성별(1)

2020

평균소득 (만원)

중앙값 (만원)

3,692

2,400

40-44세

3,912

2,948

45-49세

4,044

2,700

50-54세

4,026

2,515

55-59세

3,597

2,234

출처: 평균 근로·사업소득, 중앙값/ 수록기간: 년 2016 ~ 2020 / 자료갱신일: 2022-01-06/ 「중장년층행정통계」, 통계청


평균소득과 중앙값을 왜 같이 보여주는지 알고 있었던 사람이 과연 몇 명이나 있을까?

평균은 알고 있다시피, 데이터의 모든 값을 더하고 그 데이터의 개수만큼을 나눠 값을 구한다.

하지만 이 평균값에는 굉장한 약점이 있다.

일부의 데이터가 너무 크거나 너무 작은 것들이 혼재되어 있는 경우 그것에 치우쳐 끌려다닐 수 있다. 이 약점을 보완하기 위해 '중앙값'을 쓰는데 데이터를 작은 순서로 나열하고 딱 가운데 오는 값을 중앙값이라고 한다. 이 중앙값은 데이터의 분위기를 더 잘 파악할 수 있기 때문에 평균값과 함께 중앙값을 같이 발표한다.

위에서 발표한 자료의 평균값이 높은 이유는 고소득자의 임금이 편중되어 있기 때문이고, 전체 데이터를 놓고 가운데를 꼽은 중앙값이 우리가 실제 느낄 수 있는 평균값이 될 수 있다.

알 수는 없지만, 알아야 할 것 같은 애증의 '통계학'

게다가 요즘 '빅데이터'까지 들어오면서 우리 수포자들의 가슴이 더 조여온다.

그러나 이 책을 읽다 보면 적어도

그런 막연한 두려움은 치료받을 수 있으며,

뉴스나 자료를 접할때 통계학에 관한 상식은 장착할 수 있을 것이라 확신한다.

※ 출판사에서 도서를 무상으로 제공받아 솔직하게 작성하였습니다.



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo