
통계학의 분산과 오차범위를 계산하는 방식이 잘 이해되지 않아 무척 어려움을 겪었습니다. 복잡한 통계학을 만화로 쉽게 이해할 수 있게
해준다니 기대되었습니다.
통계의 전체 특성을 나타내는 대푯값은 평균값, 중앙값, 최빈값 등 무엇을 나타내려는 분석 자료인지에 따라 달라집니다.
용돈을
예로 들어 세 사람의 평균은 3만 엔이지만 한 사람이 7만 엔이어서 평균이 4만 엔이 되는 경우, 지나치게 높거나 낮은 걸 극단값이라고 합니다.
평균값은 극단적인 값이 있는 경우엔 데이터를 크기 순서로 나열했을 때 맨 가운데 있는 중앙값을 구합니다.p.33

평균값이 170cm이고 표준편차가 6cm인 경우 190cm이상이 차지하는 비율을 구하는 문제에서 190cm의 표준점수를 구하고
평균값에서 190cm까지가 차지하는 비율을 표준점수 3.33을 사용해 표준정규분포표에서 구할 수 있습니다. 평균값보다 위의 비율은 50%이고
50-표준정규분포표의 비율로 0.04%라는 답을 얻습니다. p.73


산포도는 데이터들의 관계성을 알아내는 방법이고 상관계수 r로 상관관계가 양인지 음인지 직선 관계에 얼마나 가까운지에 따라 관계성을
알 수 있어요. p.119

우체통 수가 늘어나면 교통사고도 늘어난다는 건 인구와 관련되지만 서로 직접 상관은 없는 허위상관이 됩니다. p.150
상관계수를 구할 때는 반드시 산포도 확인하고 극단값을 포함해 많은 데이터가 있을 수록 좋고 허위상관에 주의해야합니다. 경험이나
직감도 중요해요. p.153

선배에게서 통계학을 배우는 내용의 만화로 통계학 용어와 의미를 재미있게 설명해요. 데이터는 성적표, 기획안의 선택문제, 광고의 기대효과
설문 등으로 다양합니다. 어떤 그래프를 적용하고 무엇을 기준으로 계산해야할지도 알려줘요. 통계학의 기초를 비롯해서 액셀함수로 계산하는 방법도
있습니다. 합계, 평균, 편차, 분산, 표준편차 등을 구할 수 있어요. 원하는 결과를 얻기위한 데이터 분석에 유용합니다.
* 이 리뷰는 네이버 이북카페를 통해 출판사 서평단에 선정되어 도서를 제공받아
작성되었습니다.