-
-
만화로 쉽게 배우는 통계학 ㅣ 만화로 쉽게 배우는 시리즈
타카하시 신 지음, 김선민 옮김 / 성안당 / 2008년 12월
평점 :
구판절판
[2007. 2. 28 탐구생활 - 독서일기]
이 이야기를 시작하기 전에 먼저 통계학이 무엇인지 알아보자. 통계학이란, 어떤 일에 대해 각각 점수를 매겨 통계를 내는 것이 통계학이다. 여기서 조사를 해야하는 단체가 모집단, 이 모집단에서 일부분을 추출해서 조사를 하는 단체가 바로 표본이다. 수많은 사람을 전부 조사할 수는 없으므로 대부분의 조사가 표본으로 이루어진다. 그럼 통계학에 대해 정확히 알아볼까?
이 통계학에서도 가장 중요한 것이 바로 평균값이다. 평균값이란 각 수치를 전부 더해서 인원수로 나누어 평균을 구하는 것이다. 그런데 이 평균을 구할 수 있는것과 없는 것이 있는데 평균을 구할 수 있는 것은 바로 수량 데이터라고 한다. 대신 구할 수 없는 것은 카테고리 데이터라고 한다. 이 카테고리 데이터에는 책 소감, 날씨, 성별등이 들어가고 수량 데이터에는 나이, 횟수, 가격, 기온등이 들어갈 수 잇다. 대신 이 카테고리 데이터를 등급별로 숫자를 매긴다면 수량 데이터에 들어갈 수 있다. 이 수량 데이터의 특징은 각 사이의 간격이 뚜렷한 숫자로 이루어졌으나 카테고리 데이터는 추상적 표현같은 것으로 이루어진다는 것이다. 그럼, 평균을 구하는 문제를 하나 내 볼까?
1. A와 B, C, D, E가 있다고 가정해보자. 이 다섯명은 농구 시합을 해서 A는 4점, B는 6점, C는 10점, D는 2점 그리고 E는 8점이다. 그러면 1인 평균은 얼마일까? 해답은 되도록이면 보지 말도록 하자. 해답은 맨 밑에 제시하겠다.
그런데 이 1번 문제와 같이 평균을 구하면 다른 문제의 경우 문제가 생길 수 있다. 예를 들어 여러 집단의 각 평균을 구했을 때 한개가 지나치게 커지거나 작아지는 경우가 생길수도 있기 때문이다. 이 경우에는 중앙값을 구하게 된다. 중앙값은 홀수 갯수가 있을 때는 가운데가 중앙값이고 짝수 갯수가 있을 경우에는 두 수의 합을 구해서 다시 2로 나누는 것이다. 만약 합이 홀수라도 걱정마라. 그 때는 소수로 표현하면 되니까. 그럼 다시 문제 하나!
2. A팀과 B팀 그리고 C팀의 평균을 구했지만 B팀의 평균이 A팀과 C팀보다 지나치게 높았다. 그래서 이 B팀의 중앙값을 구했는데, B팀에 있는 점수는 46점, 50점, 39점, 104점, 82점, 92점일 때 중앙값을 구하라. 해답은 역시 맨 아래에 있다.
맨 마지막으로 표준편차에 대해 공부하겠다. 이 표준편차는 2번 문제와 관계가 있지만 그건 나중에 말하겠다. 표준 편차는 각 점수의 차의 표준이다. 그러므로 이 표준편차는 각 점수에서 평균을 빼 그 제곱수를 각각 더해 인원수로 나눈 것이다. 그것의 값의 루트가 바로 표준편차이다. 그런데 세가지 중에서 식이 가장 어렵다. 그럼 이 어려운 문제의 예를 하나 들어볼까?
3. 1번 문제의 A, B, C, D, E의 점수와 똑같다. A는 4점, B는 6점, C는 10점, D는 2점, E는 8점이다. 그럼 각 인원의 표준편차를 구하라.(아참, 루트를 구할 때 계산기를 써라.)
만약 지금까지 내가 낸 문제를 모두 맞추게 된다면 당신은 나의 말을 정확히 알아들은 것이다. 그렇다면 더욱더 어려운 수학에 대해 이해할 수 있게 된다. 통계학의 기본은 바로 위에 나온 내용들이다. 이 내용들을 알고 더욱 어려운 수학에 접근해보자.