인생은 주사위 던지기가 아니다 : 하 - 합리적 의사 결정을 위한 베이즈적 사고 인생은 주사위 던지기가 아니다
류쉐펑 지음, 유연지 옮김, 김지혜 감수 / 미디어숲 / 2026년 3월
평점 :
장바구니담기


'이 리뷰는 컬처블룸을 통해 출판사에서 도서를 제공 받아, 직접 읽고 작성한 리뷰입니다.'





통계로 세상을 이해하기







책을 선택한 이유


우리가 사용하는 숫자는 아라비아 숫자라 부른다.


인도에서 발명된 숫자지만 중동 이슬람 제국에 전해지고,

널리 퍼뜨렸기 때문에 아라비아 숫자라고 부르는 것이다.


인도는 아라비아 숫자를 만들어 낸 전통적인 수학강국이다.


세계 IT 산업을 선도하는 실리콘밸리 는 인도계의 활약이 두드러진다.


마이크로소프트 의 사티아 나델라, 알파벳 의 순다르 피차이,

IBM의 아르빈드 크리슈나, 어도비 의 샨타누 나라옌

등 굴지의 기업들의 CEO를 차지하고 있다.


인도의 인재들이 미국의 최첨단 IT 기업 수장을 맡는다는 것은

수학의 중요성을 잘 보여준다.


통계는 수학적 원리로 세상의 현상을 판단한다.


베이즈 정리는 사후 확률을 추론하는 통계학에서 시작되어

심리학, 신경과학, 인지과학 등의 분야에 사용되는 수학적 정리다.


베이즈 정리를 통한 합리적 의사 결정 방법을 알아보기 위해

"인생은 주사위 던지기가 아니다(하)"를 선택한다.





"인생은 주사위 던지기가 아니다(하)"는

베이즈 정리를 이용한 사후 확률, 계층형 모델 을 이용한 예측,

비속 살해 범죄의 발생 확률, 질병 진단에서 사용되는 베이즈 정리,

음모론이 사실일 확률을 다룬다.




새로운 관측 정보를 얻을 때마다 기존의 모든 관측 정보를 반영하여

사후 확률을 업데이트 할 수 있다.


베이즈 정리에 기반한 증분 처리 방식, 온라인 베이즈 추론은

매번 사후 확률을 처음부터 다시 계산하는 것이 아니라,


이전에 얻은 사후 확률을 기반으로 새로운 데이터 를 반영하여

사후 확률을 지속적으로 업데이트 하는 방식이다.


베이즈 정리에서의 사후 확률은 과거의 모든 관측 정보를 포함하고 있다.



온라인 알고리즘은 지속적으로 유입되는 데이터 를 실시간으로 처리하는

일련의 과정으로 스트리밍 알고리즘 이라고도 한다.


오프라인 알고리즘 은 새로운 데이터 가 유입될 때마다 기존 데이터 에 포함시켜

처음부터 다시 계산을 수행하는 방식으로 배치 알고리즘 이라고도 불린다.



온라인 알고리즘은 이전의 평균값과 새로운 데이터 만 이용해

평균값을 업데이트 할 수 있어,


계산 비용이 크게 줄어들고, 적은 저장 공간으로도 효율적 계산이 가능하다.



알고리즘 은 검색창에 키워드 를 입력하면 키워드 와 관련이 있거나

동일한 주제를 다루는 웹 문서를 찾아 준다.


알고리즘 은 특잇값 분해, SVD라는 연산을 수행한다.


단위행력과 대각행렬을 활용하면 LSI의 특정 규칙에 따라

문서를 주제별로 클러스터링 할 수 있다.


증분 SVD 알고리즘 은 데이터 가 순차적으로 들어오는 상황에서

이전의 SVD 결과를 업데이트 하며 실시간으로 SVD를 수행한다.


먼저 빠르게 한 번 실행한 후 여러 차례 반복하며 개선하여 결과를 만든다.

이것이 온라인 알고리즘 의 핵심 원리다.



소프트웨어 개발 방법은 크게 두가지로 나뉜다.


폭포수 모델은 정해진 순서대로 체계적인 관리와 통제가 이루어진다.


애자일 모델 은 개발 과정이 짧은 주기의 반복적 사이클 로 구성된다.

사용자의 피드백 을 즉각적으로 반영하여 점진적으로 결과물을 개선해 나간다.



최소 기능 제품, MVP는 제품의 핵심 아이디어 를 전달할 수 있는

최소한의 기능만을 갖춘 초기 버전 을 의미한다.


실제 사용자의 피드백 을 받고, 시장의 변화 속도를 따라가면서,

경쟁자보다 빠르게 시장을 선점하는 효과를 기대할 수 있다.



베이즈 정리는 새로운 증거가 나타날 때마다 특정 사건에 대한

인식을 지속적으로 업데이트 해야 함을 의미한다.



베이즈 공식을 이용해 직접 사후 확률을 계산할 수 있는 방법은

분류, 생략, 통계, 조정의 단계다.



여러 개의 중요한 관측값을 사전 확률에 반영하려고 할 경우,

관련 통계 데이터 를 찾기 어려울 수 있다.


사전 확률에 반영할 관측값의 개수를 줄이면, 관측 조건을 만족하는

표본의 수가 증가하며, 더 쉽게 통계 자료를 확보하고 확률도 더 정확해진다.



사전 확률에 반영한 모든 관측값을 충족하는 표본 수를 늘리고 싶다면,

관측 대상을 정의하는 범위를 확장하는 방법도 있다.


계층형 모델 이란 동일한 관측 대상을 여러 범위와 관점에서

분석하고 정보를 수집하는 방법을 의미한다.


계층형 모델 의 핵심 개념은 중요한 관측값을 사전 확률에 반영하고,

통계 데이터 를 찾아 사전 확률로 설정한다.


사전 확률을 궁극적으로 알고 싶은 사후 확률의 대체 값으로 활용한다.



계층형 모델 을 이용한 예측은 객관적 데이터 에 근거하지 않기 때문에 신뢰도가 떨어진다.


가장 신뢰할 수 있는 방법은 계층형 모델 을 활용하여

관측된 정보를 체계적으로 분류하고,


객관적인 통계 데이터 를 기반으로 기본적인 사전 확률을 설정한 후,

추가적인 정보에 따라 조정하는 방식이다.




잘못된 독립성 가정 은 조건부 독립인 사건을

완전히 독립적인 사건으로 확률을 계산한다.


우도를 사후 확률로 착각하는 것은 논리적 오류다.


사후 확률과 우도를 계산할 때 분모에 들어가는 값이 전혀 다르다.

우도를 사후 확률로 착각하면 우도가 낮다는 이유만으로

사후 확률도 낮다고 단정하는 오류를 범한다.



이상적인 모집단의 데이터 를 찾기란 매우 어렵고,

있다고 해도 표본 수가 너무 적어 데이터 편향이 발생할 가능성이 높다.


정보량이 큰 관측값을 제외한 채 모집단의 통계를 계산하면,

결과는 실제값과 큰 차이를 보일 수 있다.


분석 대상의 일부 특징만을 가진 모집단에서 통계를 산출할 경우,

해당 데이터 에는 편향이 존재할 가능성이 크다.



의사가 병을 진단하는 과정은 본질적으로 베이즈 정리를 활용한

정보 추론 과정이다.


발생 확률이 극히 낮은 질병은 즉시 배제한다.

비교적 발생 확률이 낮더라도 조기에 진단하지 못하면

위험한 질병의 경우에는 진단 목록에 제외하지 않는다.


가능성이 높은 질병부터 낮은 질병까지 순서대로 정리한 후,

우선적으로 진단이 필요한 질병을 결정한다.


모든 질병의 사후 확률을 더하면 언제나 1이 되어야 한다.

일부 질병이 배제되면 남아 있는 질병의 사후 확률은 자연히 커지게 된다.



의사들은 가능성이 있는 질병을 하나씩 배제하면서 환자의 질병을 확진한다.


의사는 배타적인 정보를 찾는 데 집중한다.

배타적인 정보를 많이 확보할수록, 더욱 정확한 진단을 내릴 수 있다.



증거의 성능과 증거를 확보하는 데 필요한 대가는 서로 정비례한다.


비용이 저렴하고 누락률이 낮은 검사 방법으로 대부분의 부적합 대상을 빠르게 걸러 내고,

비용은 많이 들지만 더 정확한 검사 방법을 사용하여 잘못된 판정을 제거한다.




충격적인 주장일수록 더욱 신뢰할만한 강력한 증거가 뒷받침되어야 한다.


믿기 어려운 주장을 사람들이 신뢰하게 만들려면

주장을 뒷받침할 수 있는 결정적 증거가 필요하다.


출처가 모호하거나 아예 명시되지 않은 경우는 반드시 의심해야 한다.

개별 사례를 전체 통계인 것처럼 활용하는 증거는 사람을 쉽게 현혹시킨다.


발생 가능성이 낮고 예상을 빗나간 사건일수록 더 쉽게 주목을 받는다.


미디어 가 관심을 끌기 위해 충격적이거나 공감을 불러일으키는 정보를 제공하면

인식을 왜곡시키고, 세상을 바라보는 시각을 크게 흔들어 놓는다.



뉴스 미디어 의 편향된 보도 방식은 상식의 오류에 빠지게 만든다.

상식의 오류란 결국 잘못된 사전 확률을 가지게 되는 것이다.


잘못된 정보나 편향된 사고를 비판 없이 받아들여

사실과 동떨어진 인식을 가진 사람은


자신의 잘못된 인지를 강화하는 정보만 접하게 되고,

처음의 잘못된 믿음이 확고해지면서 완전히 왜곡된 세계관을 형성하게 된다.



음모론이란 수수가 비밀리에 모의하여 사건의 진행 과정과 결과를 조작하고,

자신에게 유리한 방향으로 이끌어 가는 것을 의미한다.



음모를 알고 있는 사람이 많을수록 비밀 유지가 어려워진다.

음모론이 실제로 성립할 가능성은 극도로 낮다.


음모론을 믿는 사람은 확률적으로 결론을 내리는 것이 아니라,

관찰된 증거에 가장 잘 들어맞는 설명을 받아들이는 사고방식을 따른다.


대부분의 음모론에서 제기하는 증거는 대부분 조작된 것으로 신빙성이 전혀 없는 증거다.



세상은 수많은 변수와 불확실성이 지배한다.

수학적 사고는 불확실한 세상을 바르게 볼 수 있는 지혜를 제공한다.


베이즈 정리는 조건부 확률을 통해, 사건의 원인을 밝혀낸다.

베이즈 정리는 불확실한 상황에서 합리적 의사 결정을 하도록 돕는다.


계층형 모델 은 관측값을 정의하는 범위를 점진적으로 확장하여,

데이터 를 확보하고 데이터 를 효과적으로 활용할 수 있게 한다.



세상은 불확실하다.


확실한 것은 없지만 결정하지 않으면 살아갈 수 없다.

정답이 없으므로 스스로 해법을 찾아가야 한다.


베이즈 정리는 사실을 객관적으로 바라보게 하면서,

주어진 상황에서 최선의 선택을 할 수 있도록 한다.


"인생은 주사위 던지기가 아니다(하)"는 베이지 정리 와 계층형모델 을 설명하고,

베이즈 정리를 현실의 문제 해결에 적용하는 방법을 알아본다.


"인생은 주사위 던지기가 아니다(하)"는

베이지 정리 와 계층형모델 의 수학적 계산뿐만 아니라,

정리가 가진 의미가 무엇인지, 어떻게 활용되는지를 알아본다.


샐리 클라크 살인 사건의 진실에 대한 확률적 계산,

의사의 질병 진단 과정에 쓰이는 베이즈 정리의 개념,


비행 중에 심하게 흔들리는 비행기가 안전할 확률,

루신의 쓴 비문이 단순한 오류일 확률,


조지 소로스 헤지펀드 의 영란은행 공격 시 활용된 확률,

졸업을 앞둔 학생의 취업 확률,


고등학생이 좋은 대학에 진학할 확률, 노년기 심장 수술 성공률,


해산물과 레몬은 함께 먹으면 안된다는 주장,

체리씨에 독성이 있다는 주장의 진위,


과거 제도 장원의 성공 확률과 과거 낙제자가 성공할 확률,

음모론이 진실일 확률 등 흥미있는 주제들에 대하여

베이즈 정리를 이용해 가능성을 계산해 본다.



수학적 시각은 세상을 바르게 바라보는 시각이다.


세상이 복잡하고 이해되지 않는다고 해서

객관적으로 세상을 바라보지 않는 것은 위험하다.


상식이나 편견에 몰입되지 않고 객관적이고 논리적으로

세상을 바라보는 것이 그나마 위험을 줄일 수 있을 것이다.


수학적 사고 방식은 불안정한 세계에서 진실을 찾을 수 있는 유용한 지침이다.


"인생은 주사위 던지기가 아니다(하)"은

수학적 확률을 이용한 사고 방식을 통해 편향된 사고에 빠지지 않고,

데이터 의 의미를 정확히 이해하고 활용하도록 하면서,

더 나은 판단을 선택하면서 성공적인 삶을 살아갈 수 있도록 한다.


미디어숲 과 컬처블룸 서평단에서 "인생은 주사위 던지기가 아니다(하)"를 증정해주셨다.

감사드린다.


#인생은주사위던지기가아니다 #미디어숲 #유연지 #류쉐펑 #刘雪峰 #김지혜 #서평

#베이즈정리 #계층형모델 #컬처블룸 #컬처블룸서평단


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo