59가지 통계학 궁금증 완전 정복 - 데이터 분석가가 궁금해 할 통계의 모든 것
황성원 지음 / 길벗 / 2025년 5월
평점 :
장바구니담기


[출판사로부터 도서를 제공받아, 작성자의 주관적인 견해를 토대로 작성하였습니다.]

 

통계학은 확률과 통계라는 제목으로 중학교 또는 고등학교 수학에서 처음으로 용어와 개념을 처음 접하게 된다. 수학의 일부분이고 온갖 수식으로 장식되어 있어 통계학은 어렵다라는 개념이 뇌에 박히기 쉽다. 하지만 AI(인공지능)가 우리가 살고 있는 이 세상에 본격적으로 등장하면서, AI의 근간이 되는 통계학은 점점 중요한 학문이 되어 가고 있다.

 

이 책의 저자는 통계학으로 스위스 취리히 연방 공과대학교에서 석사 학위를 받았고, 영국 케임브리지대 유전학과에서 박사 학위를 받았다. 유전학과 통계학은 얼핏 보면 관련이 없을 것 같지만 유전학의 많은 문제들을 해결하는 학문이 통계학임을 알게 된다면, 관련성이 대단히 높을 것임은 자명하다. 영국 케임브리지대 의학 연구 위원회 생물통계연구소에서 박사 후 연구원으로 활동하고 있다. 이런 와중에도 아래 링크와 같이 블로그와 유튜브를 통해 통계학과 관련된 많은 콘텐츠를 생산하고 있다.


 

 

‘59가지 통계학 궁금증 완전 정복

이 책은 크게 4가지 분야로 나눌 수 있다.

Chapter 1통계학을 배우면서 드는 기본적인 궁금증으로서, 통계학이 무엇인지부터 시작해서 상호 작용 효과, 차원, 라소와 릿지 정규화, 중심극한정리 대 큰 수의 법칙, 서로 다른 평균의 개념, 표준화와 정규화, 정규 분포, 분산, 공분산행렬과 상관 행렬 등의 개념이 들어 있는 Chapter이다. 가히 기초 통계학 용어를 다 포함하고 있어 다음 Chapter로 넘어가려면 반드시 개념을 알고 넘어가야 하는 필수 Chapter이기도 하다.

 

100쪽 표준화의 개념

 

Chapter 2추론 통계를 배우면서 드는 궁금증이다. Chapter는 우도와 통계학의 다른 개념들과의 관계와 샘플링과 리샘플링이 주요 핵심 개념이다.


142쪽 로그-우도와 최댓값 문제

 

Chapter 3가설 검정을 배우면서 드는 궁금증이다. 가장 짧은 Chapter이며, 가설검정과 최대우도추정 방법의 관계, 귀무가설 대 대립가설, P-Value, t-검정에 대하여 배우게 될 것이다.


Chapter 4회귀 분석을 배우면서 드는 궁금증이다. 선형 모델과 다른 통계학 용어와의 관계, 편차와 오차와 잔차, 선형회귀, 로지스틱 회귀 분석, 성능평가와 ROC 곡선, 정밀도와 재현율의 관계에 대하여 알게 될 것이다.


지우고 4_1 238쪽 로지스틱 함수와 모델

 

이 책은 과연?

통계학에 관한 전체 개념을 다루고 있다. 개념을 글로만 풀어낸 것은 아니고 위 사진들과 같이 색이 들어간 그래프, 도표를 통해 쉽게 개념을 풀어내려고 하였다. 그러면서도 충실하게 수식을 통해서도 개념을 풀어내고 있다. 수식이 나오면 통계학에 대한 개념을 제대로 이해하고 있는 사람이 아니면 어려워할 수도 있겠다라는 생각이 들기도 한다.

게다가 기본 개념에 관해서도 설명하고 있지만 응용 분야에 대해서도 나름 설명을 한다. 응용력을 높이는 중요한 효과를 가져다줄 수 있다. 하지만 개념이 익숙하지 않으면 어렵게 느낄 수 있다.

 

저자가 생각하기에 너무 어려운 개념이거나 설명이 필요하다면 이 책과 별도로 자신의 네이버 블로그에 설명을 해놓는 경우가 있다. 이 책을 보면 가끔 각주에 저자의 네이버 블로그가 설명되어 있다.


149p 각주의 저자 네이버 블로그 소개


저자 네이버 블로그 링크 https://blog.naver.com/sw4r

 

또한 유튜브도 운영하고 있다. 이 책의 개념을 전부 동영상으로 담아두었기 때문에 찾아가서 시청해 보는 것도 이 책을 이해하는 데 도움이 될 것이다.

 

저자 유튜브 링크 - https://www.youtube.com/@paintingscientist

 

마치며

이 책을 보는 순간 나는 너무 당황하였다. 저자는 통계학에 대한 개념을 좀 더 쉽게 다루기 위해 문답 방식으로 서술하고, 화려한 그래프도 쓰고, 용어나 기본 개념에 관한 것도 쉽고 자세하게 풀어서 서술하고 있다. 하지만 나는 너무 낯설었다. 난생처음 보는 것 같고, 심지어는 무슨 이야기인지 모를 것 같았다.

 

위와 같은 이유로, 나에게는 이 책이 엄청난 도전으로 다가왔다. 높은 산맥을 올라야 하는 나를 보는 것 같았다. 하지만 나의 약점에 대해서 이제 파악이 되었다. 결국 반복해야 하고, 손으로 수식과 개념을 정리하면서 공부하는 방법밖에는 없다고 결론을 내렸다.

 

혹시 이 책을 보면서 이해가 되고 내용이 들어온다면, 어느 정도 기본은 다져졌다고 할 수 있겠다. 통계학에 대해 너무 어렵다고 느끼면 저자의 유튜브 동영상, 네이버 블로그와 함께 이 책을 정복하기 바란다. 책이 작긴 하지만 있을 것은 다 있는, 강한 책이기 때문이다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo