처음 처음 | 이전 이전 | 1 | 2 | 3 |다음 다음 | 마지막 마지막

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


7. 미래 예측 - 시간과 공간의 단편


"적분이 남긴 영속적인 유산은 우주를 잘게 썬 모습으로 보는 것이다. 뉴턴과 그 후계자들은 자연 자체가 잘게 썬 조각들의 형태로 펼쳐진다는 사실을 발견했다. 지난 300년 동안 발견된 물리학 법칙은 입자 운동을 기술하는 것이건 열이나 전기 혹은 물의 흐름을 기술하는 것이건 간에, 사실상 전부 다 이 특징을 지닌 것으로 드러났다. 지배적인 법칙과 함께 각각 시간과 공간 조각이 지닌 조건이 다음 번 조각에서 어떤 일이 일어날지 결정한다. 여기에 담긴 의미는 아주 심오하다. 인류 역사상 처음으로 합리적 예측이 가능해졌다.

 

 

8. 전기장과 자기장의 아름다운 대칭


맥스웰은 빛의 본질이 전자기파라는 사실을 확인함으로써 서로 관련 없어 보이던 세 가지 현상(전기, 자기, 빛)을 하나로 통일했다. 맥스웰은 전기장과 자기장은 연못 위에서 퍼져나가는 잔물결처럼 파동 형태로 전파할 수 있다는 결론을 얻었다. 다만, 전기장과 자기장은 공생 관계의 생물에 더 가까웠다. 전기장과 자기장은 서로를 유지하는 관계에 있다. 전기장 진동은 자기장을 만들어내고, 자기장은 다시 전기장을 만들어내며 각자 상대를 앞으로 나아가도록 끌어주는데, 어느 쪽도 혼자만으로는 그렇게 할 수 없다.

 

 

맥스웰 방정식은 네 가지 기본 법칙을 표현한 것이다. 하나는 전기장의 발산(증가하는 속도)을, 또 하나는 전기장의 컬(회전 강도)을 표현하고, 나머지 둘은 각각 자기장의 발산과 컬을 표현한다. 발산 방정식은 전기장과 자기장이 그 원천, 즉 대전 입자와 그것을 만들어낸 전류와 어떤 관계가 있는지 나타낸다. 컬 방정식은 전기장과 자기장이 어떻게 상호 작용하고 시간이 지남에 따라 어떻게 변하는지 기술한다. 그러면서 이 방정식들은 아름다운 대칭으로 표현된다. 한 장(場)의 ‘시간’에 따른 변화율이 ‘다른’ 장의 ‘공간’에 따른 변화율과 서로 어떤 관계가 있는지 컬을 통해 계량화해 보여준다.

 

 

9. 무엇이 정상일까?


멱함수 분포의 특징은 그 꼬리가 적어도 정규분포의 미약한 꼬리에 비해 두껍다(무겁다 또는 길다)는 것이다. 따라서 아주 큰 이상치는 비록 여전히 드물긴 하지만, 정규분포 종형 곡선에 나타나는 것보다는 훨씬 보편적으로 나타난다.

 


다우존스 지수가 단 하루 22%나 폭락하는 것은 주식 시장의 통상적 변동성 수준과 비교 시 표준편차보다 20배 이상 떨어진 것에 해당한다. 전통적인 종형 곡선에 따르면 이런 사건이 일어나는 것은 거의 불가능에 가깝다. 그 확률은 10^50분의 1보다 낮다. 그런데도 그런 일이 실제로 일어난 것은 바로 주가 요동은 정규분포를 따르지 않기 때문이다. 주가 요동은 꼬리가 두꺼운 분포로 훨씬 잘 설명할 수 있다.

 


지진이나 산불, 홍수도 마찬가지인데, 전쟁이나 테러 공격으로 인한 사망자수에도 똑 같은 수학적 패턴이 적용되며, 소설에 쓰인 단어 빈도와 평생 동안 한 사람이 관계하는 섹스 파트너 수처럼 비교적 온건한 사건에도 적용된다. 두드러진 꼬리를 묘사하기 위해 사용된 형용사들은 원래 칭찬 의미로 붙인 것이 아니지만, 그러한 분포들은 그런 칭호를 자랑스럽게 여기게 되었다. 두껍고, 무겁고, 긴? 그렇다. 자, 그렇다면 이제 누가 정상일까? (정규분포는 영어로 normal distribution이라 하는데, normal은 정상이란 뜻이다 - 옮긴이)

 

 

10. 베이즈 정리(조건부 확률)를 쉽게 이해하는 법


베이즈 정리 대신 더 쉬워 보이면서 유효한 방법이 있다. 그 비법은 비율이나 가능성, 확률 같은 추상적 개념 대신 자연 빈도(단순히 사건들을 세는 것)로 생각하는 것이다. 즉 조건부확률 문제를 자연 빈도를 바탕으로 다루는 것이다. 사고 방식을 이렇게 바꾸는 순간, 짙은 안개가 저절로 스르르 걷힌다.

 

 

전통적인 베이즈 정리 문제는 이렇다. ‘여성 중 어떤 사람이 유방암에 걸릴 확률은 0.8%다. 유방암에 걸린 여성의 유방 촬영 사진 결과가 양성으로 나올 확률은 90%다. 유방암에 걸리지 않은 여성의 유방 촬영 사진 결과가 양성으로 나올 확률은 7%다. 어떤 여성의 유방 촬영 사진 결과가 양성으로 나왔다면, 그 여성이 실제 유방암에 걸렸을 확률은 얼마인가?’

 

 

이 문제로는 대부분의 사람들이 답을 내놓는데 어려움을 겪는다. 자연 빈도로 표현을 바꿔보자. ‘유방암에 걸리는 여성은 1000명 당 8명이다. 유방암에 걸린 8명의 여성 중 7명은 유방 촬영 사진 결과가 양성으로 나타난다. 유방암에 걸리지 않은 나머지 992명 중 약 70명은 유방 촬영 사진 결과가 양성으로 나타난다. 선별 검사에서 유발 촬영 사진 결과가 양성으로 나타난 여성 표본을 상상해보라. 이 중에서 실제 유방암에 걸린 사람은 몇 명일까?’

 

 

유방 촬영 사진 결과가 양성으로 나타난 여성은 7+70=77명이고, 그 중 실제로 유방암에 걸린 사람은 7명뿐이므로, 유발촬영 사진 결과가 양성으로 나온 여성 중 유방암에 걸린 사람 비율은 77명 당 7명이므로 약 9%가 된다.

 

 

11. 로그의 정도(程度) 현혹


로그 진수가 100에서 1000과 100000으로 한 번에 10배씩 곱셈으로 증가할 때, 로그값은 2에서 3과 4로 덧셈으로 증가한다. 우리가 음악을 들을 때 뇌도 이와 비슷한 마술을 보여준다. 음계를 이루는 각음(도, 레, 미, 파, 솔, 라, 시, 도)의 진동수는 우리 귀에 똑 같은 단계씩 증가하는 것처럼 들린다. 하지만 객관적으로는 그 진동수는 ‘배수 단위’로 증가한다. 따라서 우리는 소리 음을 로그값으로 인식하는 셈이다.

 

 

지진의 세기를 나타내는 리히터 규모에서부터 산성도를 측정하는 pH에 이르기까지 로그가 나타나는 모든 장소에서 큰 수를 다루기 쉬운 작은 수로 압축하는 마술을 보여준다. (그렇기에 리히터 지진 강도 4는 강도 2의 2배가 아니다.) 로그는 아주 넓은 범위에 걸쳐 변하는 양을 훨씬 다루기 쉬운 양으로 축소하는 도구로 아주 이상적이다. 예를 들면, 100과 1억은 100만 배 차이가 나는데, 그 사이 간격이 얼마나 큰지 감을 잡기 어렵다. 하지만 로그값은 단 4배 차이만 난다. 일상 대화에서도 예를 들어 100,000 달러에서 990,000 달러 사이 연봉을 모두 뭉뚱그려 여섯 자리 연봉이라고 이야기할 때, 우리는 로그를 대략적으로 사용하는 셈이다. 6은 연봉들의 로그값과 대충 비슷한데, 정확하게는 5에서 6 사이다.

 

 

12. 자연의 표상, 오일러의 수


오일러의 수 즉, 자연 상수 e(=2.718281828…)는 100%의 성장률을 가지고 연속 성장할 때, 최대로 성장할 수 있는 비율을 말하는데, 아주 작은 사건들이 많이 모여 누적 효과를 내는 어떤 것이 변할 때 자주 나타난다. 나무도 자연 상수에 따라 성장하는데, 어느 정도 성장한 후 특정 값으로 수렴하는 지수적 성장을 한다. 

 

 

방사성 붕괴가 일어나는 우라늄 덩어리를 생각해보자. 매 순간 각각 원자는 붕괴할 확률이 얼마큼씩 있다. 각각 원자가 붕괴할지 않을지 그리고 언제 붕괴할지는 예측할 수 없으며, 각각 사건이 전체에 미치는 효과는 아주 미미하다. 그럼에도 전체적으로 볼 때 이렇게 일어나는 수조 개의 사건은 부드럽고 예측 가능하고 지수함수적으로 붕괴하는 방사능을 만들어낸다."

 

 

 

 

 

 

 

어떤 무한집합은 어떤 무한집합(자연수 집합)보다 크다. 구체적으로 말하면, 0과 1 사이 실수 집합은 셀 수 없다. 즉 실수 집합은 자연수 집합과 일대일 대응 시킬 수 없다. 자연수 전체 집합과 일대일 대응이 이루어지는 집합을 가산 집합이라고 하고, 그렇지 않은 집합을 비가산 집합이라 한다. 짝수 전체 집합, 유리수 전체 집합은 가산 집합이고, 실수 전체 집합은 비가산 집합이다. 비가산 집합은 가산 집합보다 크다.


댓글(0) 먼댓글(0) 좋아요(9)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1. 양극화된 상태의 균형


"음수에 음수를 곱하면 양수가 된다. 매우 이해하기 어려운 진실이다. 이러한 추상적 개념이 현실 세계에 실제로 쓰이는 예가 있을까? 아마도 우리에게 가장 익숙한 사례는 사회와 정치 부문에서 흔히 접하는 ‘내 적의 적은 친구’라는 표현 아닐까 싶다. 세 사람 관계에서 부정적(마이너스) 관계 2개와 긍정적(플러스) 관계 1개로 이루어진 관계가 균형 잡힌 관계로 간주되는데, 이 관계에서는 어떤 불협화도 발생하지 않는다. 균형 논리는 곱셈 논리와 일치한다. 균형 잡힌 관계 삼각형에서는 어느 두 변을 곱한 부호는 양수이건 음수이건 항상 세 번째 변의 부호와 일치한다.

 

 

한 걸음 더 나아가, 많은 사람이 서로를 아는 긴밀한 관계의 네트워크에서 어떤 것이 가장 안정적 상태일까? 네트워크가 적대적인 두 파벌로 쪼개져 풀 수 없는 갈등 상태에 빠진 경우가 가장 안정적이다. 한 파벌의 모든 구성원이 서로 친밀하지만, 다른 파벌 구성원과는 매우 적대적인 경우다(어디서 많이 들어본 이여기 같지 않은가?). 더 놀라운 사실은, 낙원만큼 안정된 상태는 이 양극화된 상태뿐이라는 것이다. 특히 세 파벌로 쪼개진 상태에서는 균형 잡힌 상태에 있을 수가 없다.

 

 

학자들은 이 개념을 사용해 제1차 세계대전으로 치달은 상황을 분석해보았다. 1907년 유럽은 돌이킬 수 없게 적대적인 두 블록으로 양분되었다. 이것은 기술적으로는 균형 잡힌 상태지만, 한편으로는 전쟁 직전 아슬아슬한 상태이기도 하다. 물론 이 이론은 너무 단순해서 지정학적 역학의 미묘한 관계를 모두 다 설명할 수 없다. 요점은 우리가 관찰하는 것 중 어떤 부분은 ‘내 적의 적’이라는 원시적인 논리에서 비롯된 결과라는 점이며, ‘그’ 부분을 음수의 곱셈으로 완벽하게 표현할 수 있다는 것이다.

 

 

2. 교환법칙의 불가능성


자연에서는 수학의 교환법칙이 성립하지 않는다. 세계가 보는 모습대로 존재하는 이유는 바로 깊은 차원에서 교환법칙이 성립하지 않기 때문이다. 좀 더 구체적으로 말하면 양자역학이 발전하던 초기 하이젠베르크는 자연이 p X q = q X p가 성립하지 않고, 기묘한 논리를 따른다는 사실을 발견했다. 여기서 p는 양자 입자의 운동량을, q는 그 위치를 나타낸다. 만약 교환법칙이 붕괴되지 않는다면, 즉 교환법칙이 성립한다면, 하이젠베르크의 불확정성 원리도 없을 것이고, 원자는 붕괴하여 세상에는 아무것도 존재하지 않을 것이다. 물질이 단단한 이유는 교환법칙이 성립하지 않기 때문이다.

 

 

3. 관계의 내부논리


많은 사람은 수 사이 관계를 이해하는 데 더 어려움을 겪는데, 관계는 수보다 훨씬 추상적이기 때문이다. 하지만 관계는 수보다 훨씬 강력한 힘을 발휘한다. 관계는 주변 세계의 내부 논리를 표현한다. 원인과 결과, 공급과 수요, 입력과 출력, 투여량과 반응, 이 모든 것은 한 쌍의 수들과 그 사이에 성립하는 관계를 포함한다. 문장제(文章題)는 우리를 이런 종류의 사고로 인도한다.

 

 

이 문제를 한번 풀어보라. 세 사람이 울타리 3개를 페인트칠하는 데 3 시간이 걸린다고 하자. 그러면 한 사람이 울타리 1개를 페인트칠하는 데에는 몇 시간 걸릴까?

 

 

문제를 듣자마자 ‘한 시간’이라는 답이 튀어나오기 쉽다. 문제 표현 자체가 그쪽으로 유도하기 때문이다. 첫 번째 문장에서 세 사람, 울타리 세 개, 3 시간은 우리 주의를 어떤 리듬에 맞추도록 유도한다. 그래서 다음 문장이 한 사람, 울타리 1개, (  ) 시간으로 비슷한 패턴을 반복하면, 빈칸에 1을 채우고 싶은 충동이 든다. 이러한 병렬 구문은 언어학적으로 옳아 보이지만 수학적으로 틀린 답을 유도한다. 정답은 3 시간이다. 이 문제의 핵심은 세 사람이 서로에 영향을 미치지 않고 각자 독립적으로 행동한다는 점이다. 우리 무의식은 이 차이를 알아채지 못하는 것 같다. 적어도 잘못된 결론을 내릴 때에는 그러는 것 같다.

 

 

4. 논리보다 창의


유클리드는 정의와 공준, 그리고 자명한 진리(공리)를 가지고 시작하여 완전 무결한 논리를 통해 하나의 진리에서 다음 진리로 나아가면서 가정과 증명으로 이루어진 체계를 세웠디. 그런데 유클리드의 합리성을 존중한 이 설명에 빠진 게 하나 있는데, 그것은 바로 기하학이 지닌 직관적 측면의 진가를 인정하는 것이다.

 

 

영감이 없다면 증명도 있을 수 없고, 또 그보다 앞서 증명할 정리도 없을 것이다. 음악을 작곡하거나 시를 쓰는 것처럼 기하학도 무에서 뭔가를 만들어내는 과정이 필요하다. 다른 창조적 예술과 마찬가지로 수학에서도 뮤즈의 불가사의함이 있다. 논리가 아무 도움이 되지 않는 순간, 문제를 푸는 데 능숙한 사람은 긴장을 풀고 퍼즐을 이리저리 만지작거리면서 감을 잡는 게 더 나은 방법이라는 사실을 안다.

 


5. 평형상태가 안정성을 잃을 때


삼각법은 삼각형의 변과 각이 계량적으로 서로 어떤 관계가 있는지 알아내는 기본 도구다. 삼각법은 삼각형뿐 아니라 원까지 계량화하여 바다 파도에서부터 뇌파에 이르기까지 반복되는 형태라면 어떤 것이라도 분석할 수 있는 길을 열었다. 삼각법은 순환 수학을 푸는 열쇠 역할을 한다.

 

 

삼각법이 원과 삼각형, 파동을 서로 어떻게 연결하는지 보자. 물체가 원을 그리며 움직일 때 위치는 삼각형의 변과 각으로 표시할 수 있으며, 이는 파동인 사인파로 나타난다. 그러면 sin a는 물체 높이가 얼마인지 알려준다. 더 정확하게 말하면, sin a는 물체가 a의 각도를 이루는 위치에 있을 때 중심을 기준으로 측정 물체의 고도로 정의된다.

 

 

이렇게 원운동이 사인파로 변하는 일은 우리 일상 생활에서 많이 나타난다. 형광등 불빛은 전력망의 어디에선가 발전기가 1초당 60사이클로 회전하면서 회전 운동을 교류로 바꾸고 있음을 말해준다. 즉 교류는 전기가 만들어내는 사인파다. 목소리 성대를 진동시켜 소리를 만들 때 사인파가 생기고, 내 귀속 털 세포들이 음파를 수신해 흔들릴 때 사인파가 생긴다. 연못에 생겨나는 잔물결, 모래 언덕에 생긴 물결 모양, 얼룩말 줄무늬, 이 모든 것은 자연의 기본적 패턴 생성 메커니즘이 겉으로 드러난 것이다. 즉 단조로운 균일성의 배경에서 사인파 구조가 창발하는 것이다. 아무 특징 없는 평행 상태가 안정성을 잃을 때마다 맨 먼저 나타나는 패턴은 사인파이거나 사인파들의 결합이다.

 

 

사인파는 자연의 기본 구성 요소다. 양자역학은 실제 원자들을, 거기서 더 나아가 모든 물질을 사인파 집단으로 기술한다. 심지어 우주론적 규모에서도 사인파는 존재하는 모든 것의 씨앗을 이룬다. 천문학자들은 우주배경복사의 스펙트럼(사인파의 패턴)을 조사하여 측정 결과가 우주 탄생과 진화를 설명하는 최선 이론인 인플레이션 우주론의 예측 결과와 일치한다는 사실을 발견했다. 즉 아무 특징도 없는 빅뱅에서 원시적인 사인파(물질과 에너지 밀도에 생겨난 잔물결)가 자연 발생적으로 나타나 우주를 이루는 재료를 만들어냈다.

 

 

6. 자연에서 미분값이 0이라는 의미


(포물선을 그리며 움직이는) 물체는 가장 높은 곳에 있거나 가장 낮은 곳에 있을 때 가장 느리게 변한다. 여기서 성립하는 일반적인 원리가 있다. 겨울 중에서도 가장 어두운 시기가 찾아왔을 때, 낮 길이는 아주 짧기만 한 게 아니다. 하루가 지날 때마다 늘어나는 낮 길이에는 거의 변화가 없다. 그러다가 봄이 시작되면, 하루 길이가 아주 빠르게 늘어난다. 극점에 이르렀을 때 변화는 가장 느려질 수밖에 없는데, 그 순간 미분값이 0이기 때문이다. 순간적으로 모든 것은 정지 상태에 놓인다.

 

 

마루와 골에서 미분값이 0이 되는 이 성질은 어떤 함수가 극대값이나 극소값에 이르는 지점이 어디인지 알아낼 수 있다. 어떤 일을 가장 효율적으로 하는 방법이나 가장 적은 비용을 들이는 방법 혹은 가장 빨리 하는 방법을 찾으려고 할 때 함수의 극대값이나 극소값이 그 답을 제공할 수 있다.

 

 

미분과 관련된 스넬의 법칙은 빛이 공기 중에서 물 속으로 들어갈 때 어떻게 구부러지는지 알려준다. 빛은 물 속을 지나갈 때에는 공기 중을 지나갈 때보다 속도가 느려지는데, 그에 따라 여행 시간을 최소화하기 위해 경로가 구부러진다. 마찬가지로, 빛은 공기 중에서 유리나 플라스틱으로 들어갈 때에도 구부러진다. 정말로 기묘한 것은 빛이 마치 가능한 모든 경로를 고려하고 그 중에서 최선 경로를 택하는 것처럼 행동한다는 사실이다. 자연도 미분을 하는 것처럼 보인다."


댓글(0) 먼댓글(0) 좋아요(11)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
수학이 필요한 순간 - 인간은 얼마나 깊게 생각할 수 있는가
김민형 지음 / 인플루엔셜(주) / 2018년 8월
평점 :
장바구니담기





이 책 서문처럼 ‘감사의 글’을 반어법으로 재미있게 쓴 글을 본적 없다. 피식거리며 동시에 따뜻한 미소를 짓게 한다. “이 책을 쓴 계기는 나의 허영심 탓만은 아니고 내 이야기가 재미있다고 자꾸 부추겨주진 출판사 두 분 잘못이 크다. 그 외에도 잘못한 사람들이 꽤 있다. 누구보다도 나를 잘못 교육시킨 부모님, 나의 무책임을 보호해주는 아내, 그리고 나의 잘못된 교육을 받아주는 아들들이 특히 탓할 만하다. 나의 말도 안 되는 질문과 대화를 너그럽게 허용하는 동료들도 비판받아 마땅하다. 그들은 이 책에 나오는 헛소리를 다양한 각도에 너무 여러 번 허용해주었기에 나와 독자의 질책을 감수해야만 한다.
책을 열자마자 서문을 읽어야 하는 의무는 나도 항상 지겹기에 다시 한 번 독자에게 사과하며 이만 줄인다.”


저자가 책을 쓴 동기가 무엇이든 내게는 무척 어려운 책이다. 저자가 숫자를 최대한 피하려고 노력한 흔적이 여기저기 보이지만, 그나마 조금 제시한 숫자들에 깊이 수렁에 빠진 느낌이다. 하지만 그 수렁에서 내가 건진 것이 전혀 없는 것은 아니다. 수학을 포함하여 ‘학문’이란 과연 무엇인가라는 점이다. 저자는 세상에서 가장 어려운 질문이 ‘x는 무엇인가?’라고 말하지만, 수학자답게 그 대답을 가장 잘 한 것 같다.


우리 일상이 그렇듯, “어떤 답을 우리가 만족스러운 답으로 받아들이느냐 자체가 분명치 않은 경우가 더 많다. 따라서 이론을 전개하는 과정에서 ‘적당한 답의 틀’(satisfactory framework for finding the answer)을 만드는 것 자체가 중요하다. 예를 들면 ‘인생이란 무엇인가’라는 질문은 답을 모르는 것 이상으로 난해하다. 답을 모를 뿐 아니라, 어떤 종류의 답을 원하는지도 모르기 때문이다. 즉 답 자체를 모르는 상황과, 답을 표현할 만한 적절한 사상의 틀이 없는 상황, 두 종류의 난해함이 부딪힌 것이다. 이럴 때는 ‘적당한 답의 틀’인 ‘우리를 행복하게 만드는 것이 무엇이냐’를 구체적으로 따져보면서 이를 성취하려면 어떻게 해야 하는지 찾아볼 수 있다.”


수학의 답은 항상 명료하기에 가장 구체적인 학문으로 여겨지지만, 수 자체가 이미 세상을 추상화했다는 점을 잊을 때가 많다. 모든 “학문적 이론은 ‘세상에 있는 것’을 다루는 개념이다. 세상의 다양한 현상의 유사성을 파악하려면 어느 정도 추상성이 필요하다. 추상적인 개념적 도구를 사용해 세상을 체계적으로 또 정밀하게 설명하려는 의도가 바로 학문(수학)이라고 할 수 있다.”


모든 학문은 ‘공리’를 전제한다. 공리로 “하나의 사실에 대해 증명하지 않고 기정사실로 받아들일 때, 이를 기초로 다른 이야기를 진행할 수 있다. 공리를 받아들이지 않는다면 앞으로 전개될 내용도 전혀 받아들일 이유가 없으며, 이 공리가 맞다고 상정하면 앞으로 나올 결론들도 맞다고 여길 수 있다.


공리는 마치 진리가 있을 것 같지만 사실 없는 경우에도 그것을 찾기 위해 어떤 가정을 하고 체계화하는 것이다. 그래서 공리를 표명하는 것 자체가 굉장히 중요하다. 정확히 무엇을 비판해야 하는가에 대한 조명도 되고, 어떤 식으로 바뀌어야 되는가에 대한 연구도 하고, 법칙을 재정비할 수 있게 된다. 건전한 학문의 시각이란 이처럼 ‘근사’(approximation)해가는 과정이다. 완벽하게 할 수 없다고 포기하기 보다는, 제한적 조건 속에서 이해할 수 있는 현상이 있다는 점을 받아들이는 것이다. 나중에 뒤집어지더라고 현재의 조건 안에서 이해해나가는 것이다.”


대부분 수학자들이 그런 것처럼, 학자들은 자신 학문을 할 때 “구체적인 공리가 무엇인지 모르는 경우가 대부분이다. 학자들은 공부하고자 하는 구조의 성질을 이것저것 아는 것이지, 체계적인 공리에 대해서 생각하는 일은 것의 없다. 공리에 대해서 생각할 때도, ‘어느 공리가 합당한가’가 제일 중요한 질문이다. 이처럼 질문 자체가 의미 있어야 한다. 왜냐하면 질문이 의미 있어야, 그 질문의 결과가 의미 있는 결과인지 아닌지 판단할 수 있기 때문이다.”

 

 

 

 


댓글(0) 먼댓글(0) 좋아요(17)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 




생물학자 스티브 제이 굴드는 1982년 거의 치료가 불가능한 암 진단으로, 앞으로 더 살 수 있는 기간이 중앙값(medain)으로 8개월밖에 남지 않았다고 판결을 받았다. 1985년 그의 기고문 <중앙값은 메시지 역할을 하지 못한다: the median isn’t the message>에서 어느 불확실한 변수의 평균값이 아닌 전체 확률분포함수를 관찰하고 고찰하는 것이 어떻게 그에게 다시 새로운 삶에 대한 희망을 가져다주었으며, 결국에는 생명을 연장시키는 데 어떻게 도움을 주었는지 기술하고 있다.


중앙값은 전체 표본 값을 반반으로 나누게 하는 통계값이기에 굴드는 최소한 그가 8개월 이상 더 살 수 있을 확률이 50%가 될 수 있을 것이라고 판단하였다. 더욱이 그는 여러 관련 문헌들을 참고한 후, 사망에 이르는 시간의 확률분포함수가 오른쪽으로 완만한 경사진 형태라는 사실을 알게 되었다. 이러한 상황에 의지하여, 굴드는 암 투병 중 삶에 대한 긍정적 태도를 지속적으로 유지하여, 암투병에 승리했는데, 지금은 이러한 긍정적 태도가 암 투병에 승리하는 데 중요한 요소로 인식되고 있다. 굴드는 그의 저서 <풀 하우스>에서 그의 경험을 담담하게 회상하고 있다.


‘나는 통계학과 생물학 역사에 대한 지식을 갖고 있었기에 불확실성 변수에 대한 변화량은 추상적인 측정값이고, 어느 누구에게도 적용될 수 없으며, 그리고 대부분의 경우 개인적인 경우들과는 관계가 없는 평균값 사용에 주의를 하게 되었다.’


굴드는 암과는 전혀 상관없는 다른 질병으로 세상을 떠나기 전 처음 암이 발견된 후 20년을 더 살았다. 우리는 굴드의 일화를 염두에 둘 필요가 있다. 10명 중 8명에게는 전혀 효과가 없지만, 남은 2명의 생명을 36개월 동안 더 연장해 주는 가상적인 치료약을 고려해 보자. 만약 여러분이 환자라면, 이 치료약을 사용했을 때 연장된 평균 수명 7.2시간이 보장된다고 정말로 생각하는가? 이에 대한 답은 그렇지 않고, 평균값은 5명 중 1명이 3년을 더 살 수 있다는 것으로 해석되어야 하기에, 이 기간 동안 여러분은 딸들의 결혼식에 참여할 수도 있고, 경우에 따라서는 외손녀들도 볼 수 있을지 모른다.”


이 책 <평균의 함정>은 “의사결정 문제를 신중하게 생각할 때나 그렇지 않고 직관적으로 생각할 때 올바른 판단을 할 수 있는 능력을 갖출 수 있게 한다.” “불확실한 현상을 평균값으로 표시하면 무엇이 잘못되게 되는가? 당신이 여객기를 납치하고 10억 달러를 받은 후 아무 문제없이 사라질 수 있을 확률이 1,000만분의 1이라하면, 기대값(평균 금액)은 100만 달러가 된다. 하지만 여객기 납치로 확실하게 100만 달러를 벌 수 있을 것이라고 단정 짓는 사람은 아무도 없을 것이다. 이처럼 여러분은 불확실한 상황을 단 하나의 숫자인 평균값으로만 생각하는 습관을 버리고 확률분포로 파악하는 습관을 갖도록 해야 한다.”


프로젝트는 왜 항상 지체되는가? “예를 들어 개발 기간이 4~8개월인 소프트웨어 개발 프로젝트 10개가 동시에 진행될 경우 당신은 상사에게 프로젝트 종료를 평균 6개월 후라고 보고하면 안 된다. 그럴 확률은 매우 낮다. 모든 작업이 평균 개발 6개월 내에 완성될 확률은 동전 10개를 동시에 던져 동전 10개 모두가 앞면이 나올 확률과 같기에 프로젝트가 6개월 내에 성공적으로 개발될 확률은 대략 1/1,024 밖에 되지 않는다.


“불확실한 상황을 평균으로 표시하면 위험을 옳게 파악할 수 없게 된다.” “함수값으로 계산된 평균값은 변수 각각 평균값을 함수에 직접 대입해서 얻은 평균값보다 항상 크게 나타나기 때문이다.”

 

 



댓글(0) 먼댓글(0) 좋아요(18)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 

 

 

 

 

 

 

 

 

 

 

 

 

 


통계학 핵심은 정보를 더 많이 알면 알수록 결과를 더 확신할 수 있다는 의미다. 하지만 문제는 얼마나 더 확신할 수 있느냐라는 점이다. 가령 “일반 통계 기법에서 신뢰 수준은 관찰 증가에 정비례로 커지는 것이 아니다. 표본 규모가 n배 증가하면 지식은 n이 아니라, n의 제곱근만큼만 증가한다. 빨간 공과 검은 공이 담긴 항아리에서 공을 20회 꺼낸 뒤 빨간 공과 검은 공 비율의 신뢰 수준은, 공을 절반인 10회 꺼낸 뒤 신뢰 수준의 단지 2의 제곱근인 1.41배수만 증가할 뿐이다.” <행운에 속지 마라>(나심 니콜라스 탈레브, 중앙북스, 2016)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

사실상 조건부 확률이 신뢰 수준을 높이지만, 우리는 무조건 확률과 조건부 확률을 잘 구분하지 못한다. 남편이 아내를 살해한 사건에 대해 “어떤 하바드 대학 교수는 아내를 ‘학대’ 하는 남편 가운데 아내를 살해하는 사람은 그렇게 많지 않다고 주장했다. 이것은 남편의 아내 살인에 대한 무조건 확률에 가깝다. 사건을 정확하게 보려면, 남편이 아내를 실제 ‘구타’했다는 구체성으로 아내 살해의 비중을 계산해야 한다.”<춤추는 술고래의 수학 이야기>(레오나르드 믈로디노프, 까치, 2009)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

“결국 에측이나 추론은 명확하지 않은 사항을 알기 위해 증거를 바탕으로 추리하여 그 사실을 밝혀내려는 행위라고 본다면, 조건부 확률은 추론 원리에 충실한 방법이라고 볼 수 있다. 조건부 확률은 유형을 한정하기 위해 추가적인 정보를 얻어 일부 가능성을 제거하고 그 나머지 현실로 결과가 어떻게 발생하는지 파악하는 것이다. 조건부 확률은 세상에 일어나는 결과는 발생 가능성이 높은 원인 때문에 일어난다는 최우원리(最優原理)를 기반으로 한다. ”<세상에서 가장 쉬운 베이즈통계학 입문>(고지마 히로유키, 지상사, 2017)

 

 

조건부 확률의 대표적 이론이 베이즈 정리다. 현재 베이즈 정리는 암호 해독과 핵 잠수함 추적, 산재 보험 설정, 암의 원인 규명, 대선 결과 예측, 스팸 이메일 필터링, 질병 예측, 수익 계산 등 다양한 분야에서 사용된다. 베이즈 정리(Bayes’ Theorem)를 만든 토마스 베이즈는 1701년 영국에서 태어난 신학자였다. 베이즈 정리를 정확하게 이해하기 위해서는 우선 베이즈 철학을 아는 것이 중요하다.

 

 

“신학자인 베이즈는 ‘신이 진정 자비심이 넘치는 존재라면 어떻게 이 세상에 고통과 사학함이 존재할 수 있는지’ 고민했다. 그가 내린 결론은 ‘인간은 불완전하기에 완벽한 신이 설계한 우주와 자연을 온전히 이해할 수 없다는 것이다. 그렇지만 어떻게 하면 조금이라도 알 수 있을지 고민했고, 인간이 자연의 진리를 점차 알게 되면 궁극적으로 진리에 다가갈 수 있다고 믿은 것이다. 이는 완벽한 자연과 불완전한 인간 사이의 괴리를 인정하고, 지식과 무지 사이의 영역을 확률로 본 것이다.”<신호와 소음>(네이트 실버, 더퀘스트, 2014)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

따라서 베이즈 이론은 어떤 원인을 조금이라도 알 경우 사건 가능성을 더 정확히 알아내는 방법에 관한 것이다. 예를 들면, “무작위로 선택한 남편이 정신병에 걸렸을 확률과 무작위로 선택한 아내가 남편 마음을 읽어낼 확률은 모두 극히 낮다. 하지만 정신병에 걸린 남편을 둔 아내가 남편 마음을 읽어낼 확률은 훨씬 높아진다. 
 


베이즈 이론은 만약 B가 일어난다면 A가 일어날 확률이 만약 A가 일어난다면 B가 일어날 확률과 다르다는 사실 또한 보여준다. 가령 남편이 만약 바람을 피우면 밤늦게 다닐 확률이 남편이 밤늦게 다니면 바람 피울 확률보다 높다는 걸 보여준다.  또 다른 예로 애인이 회신을 미룬다고 애인 관심이 줄어들 확률은, 만약 애인 관심이 줄어든다면 회신을 미룰 확률보다 훨씬 더 낮다는 상식을 증명해 준다. 사실 많은 음모론은 이런 단순한 논리 오해로 결정된다. 만약 거대한 음모 결과로 어떤 사태가 일어날 확률을, 만약 어떤 사태가 일어나면 거대한 음모가 존재하게 될 확률과 혼동하도록 만든다.

 

 

베이즈 정리는 ‘우리가 어떤 대상에 갖고 있던 초기 믿음을 객관적이고 새로운 정보로 업데이트할 때 보다 개선된 새로운 사실을 알 수 있다’는 걸 알려준다. 예를 들면, 아이가 둘인 가정에서, 만약 두 아이 중 한 아이가 딸이라면 두 아이 모두가 딸일 확률은 3분의 1이된다. (아들, 딸) (딸, 아들) (딸, 딸) 가능성 중 (딸, 딸)일 확률이다. 그렇지만 아이가 둘인 가정에서, 한 명의 딸 이름이 케리라면 두 아이가 모두 딸일 확률은 2분의 1로 높아진다. 딸 이름이 케리라는 사실이 확률을 변화시킨 것이다.
 


‘이름이 케리인 딸’을 딸-K라 표시하고, ‘이름이 캐리가 아닌 딸’을 딸-NK라고 표시하면, 표본 공간은 (아들, 딸-K) (딸-K, 아들) (딸-K, 딸-NK) (딸-NK, 딸-K) (딸-K 딸-K)이다. 그런데 정부 발표에 따르면 두 딸 이름 모두가 캐리가 될 확률은 100만 분의 1이라고 한다. 어느 딸의 이름이 캐리라는 사실을 알게 된 것은 어떤 의미에서 우리는 대단한 정보를 얻은 셈이다. 두 딸 이름이 모두 캐리일 가능성은 너무 낮아 그런 가능성을 무시하는 것은 정당하게 된다. 그렇게 되면 표본 공간은 (아들, 딸-K) (딸-K, 아들) (딸-K, 딸-NK) (딸-NK, 딸-K)만 남게 되고, 두 아이가 모두 딸일 확률은 2분의 1로 높아진다.”<춤추는 술고래의 수학 이야기>(레오나르드 믈로디노프, 까치, 2009)

 

 

베이즈 이론으로 우리는 주관적 관찰 현상에서 근원적인 확률을 알아낼 수 있다. 예를 들면, “결혼한 당신이 집에서 못 보던 여자 속옷을 발견했을 때 남편이 바람 피울 가능성을 예측해보자. 당신은 남편이 바람 피운다는 전제에서 낯선 속옷이 발견될 확률을 50%로 보고, 남편이 바람을 피우지 않는다는 전제에서 여자 속옷이 발견될 확률을 5%로 추정했다. 이를 당신이 속한 사회의 모든 남편이 바람을 피울 확률(4%) - 예로써 연구 통계치 등 - 을 베이즈 공식에 적용하면 당신 남편이 현재 바람 피울 가능성은 29%로 나온다. 당신 남편이 바람 피웠을 가능성이 50%가 아닌 29%로 낮게 나온 주요 원인은 사회 전체가 건전(4%) 하기 때문에 이것이 반영된 것이다. 반대로 사회가 건전하지 않다면 당신 남편이 바람 피웠을 확률은 급속히 올라간다. 한 마디로 주관적 상황을 객관적 사실로 보정하여 예측한 것이며, 현재의 특정 상황과 그 상황의 전체 구조를 동시에 반영하는 것이 베이즈 정리의 요체다.

 

 

베이즈 정리의 가장 유명한 예를 보면 이렇다. 어떤 40대 여성이 엑스레이로 유방암 검사를 받았는데 양성 판정이 나왔다. 확정 판정을 위한 추가 조직 검사를 받기 전에 그녀는 인터넷을 찾아 보았다. 그녀는 실제 유방암에 걸린 40대 여성이 양성 판정을 받는 경우가 무려 79%라는 것을 알았다. 또한 유방암이 아닌데도 검사 실수로 양성판정을 받을 오류 가능성이 10%밖에 안될 정도로 확률이 매우 낮다는 것도 알게 되었다. 이럴 경우 모든 여성은 몹시 불안해한다. 하지만 불안해할 필요가 없다. 그 이유는 더 큰 그림(전체 구조)을 보지 못했기 때문이다. 전 세계 40대 여성이 유방암에 걸릴 실제 확률은 1.4%라는 객관적, 구조적 사실을 베이즈 정리 공식에 넣어 반영하면, 여성이 양성 판정을 받더라도 실제 유방암이 아닐 확률이 90%나 된다.” <신호와 소음>(네이트 실버, 더퀘스트, 2014)

 

 

예상보다 이렇게 확률이 낮은 이유는 원래 암에 걸린 사람 자체가 매우 드물기 때문이다. 건강한 사람이 압도적으로 많을뿐더러 건강한 사람을 양성으로 진단하는 사례 또한 무시할 수 없을 만큼 많기 때문이다. 한편 이 사례를 이해할 수 있는 미국 성인은 3퍼센트밖에 되지 않는다고 한다. 그만큼 우리 직관과 다르기 때문이다. 사람은 부분으로 전체를 파악하지 못하며, 이해하지 못하면 직관은 틀릴 수 있고, 현실을 항상 왜곡해서 볼 수 있다.


댓글(0) 먼댓글(0) 좋아요(12)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
처음 처음 | 이전 이전 | 1 | 2 | 3 |다음 다음 | 마지막 마지막