신호와 소음 - 불확실성 시대, 미래를 포착하는 예측의 비밀, 개정판
네이트 실버 지음, 이경식 옮김 / 더퀘스트 / 2021년 1월
평점 :
장바구니담기


▶ 두껍습니다.

말미의 <주석>을 제외하고도 735쪽이 되어서야 마침표를 찍는 책입니다. 통계를 다루고 있는 책인만큼, 소설을 읽을 때와 같은 속도를 낼 수도 없지요. 게다가, 사례들의 거의 대부분이 미국/미국 문화와 관련된 것들이어 (특히 체스 게임에 대한 자세한 설명 부분은 거의 건너뛰었을만큼) '피부에 와닿는' 듯한 느낌 같은 건 아예 없습니다. 그럼에도 불구하고, 

▶ 명확합니다.

저자가 이 책을 통해 독자들에게 말하고자/보여주고자 하는 메시지만큼은 매우 명확합니다. (심히 뭉뚱그려진 요약입니다만) 저자의 표현을 빌자면 "확률적으로 생각하라. …… 속도를 늦추고 의심하라."(p38)로 대변될 수 있지요. (이 책의 제목에도 사용되었고) 설명 과정에서 사용되는, '신호'와 '소음'이라는 단어의 정의(definition) 역시 (통계학에 문외한일지라도) 이해하는 데 전혀 지장이 없을만큼 심플합니다.

나는 신호통계적이거나 예측적인 문제 뒤에 놓인 진리를 가리키는 암시로 정의하고, 소음신호라고 착각하게 하는 무작위 패턴으로 정의한다.(p677) …… 신호는 진리다. 소음은 우리가 진리에 다가서지 못하게끔 우리의 정신을 산만하게 한다. 이 책은 이것들에 관한 이야기다.(p69)

▶ 그런데, 난감합니다.

책의 두께도 두께거니와, 다루고 있는 내용이나 범위가 방대하다보니 이 책을 적당한 길이로 요약하는 건 예의 제 능력 밖의 일이자 스타일에도 맞지 않습니다. (혹시나 싶어, 요약의 대가인 조진래 기자가 혹 이 책을 다루었나 검색해보니 없더군요.) 거의 항상 그러해왔었듯, 저의 관심사를 중심으로 몇 가지 인상적이었던 부분만을 발췌해 정리해볼까 합니다. (오는 11월인가부터 사용이 중지된다는 기존 방식의 에디터에서 제가 유용하게 사용했던 각주 기능이, 이 스마트 에디터인가에는 없을 거라네요. 새로운 세상에 적응하고자 하는 첫 노력이 결부된 첫 시도이기도 합니다. --;;)


측(forecasting)이라는 단어는, 비록 오늘날에는 별 차이 없이 일상에서 사용되는 경우가 많지만 원래, 점쟁이를 주어로 주로 삼는 동사였었던 '예언(predict)'이라는 단어와는 (적어도 통계학적으로는) 구분되는 의미를 지니고 있습니다. 그렇다면 (통계를 다루고 있는) 이 책에서 사용되고 있는 '예측'이라는 단어의 뜻을 어떻게 이해하여야 할까요?

"우주의 작동에 불규칙한 면이 있다는 사실은 우리를 불편하게 한다. 우리는 현상이 일어나는 이유를 알고, 그 인과관계를 확립하고, 또 배후에 있는 규칙을 이해하기를 원한다." - 데이비드 핸드, 「신은 주사위 놀이를 하지 않는다」중 p28, 더퀘스트, 2016.

데이터를 이용하든 그렇지 않든, 아직 다가오지 않은 미래에 대한 추측은 기본적으로 과거와 현재를 기반으로 할 수 밖에 없습니다. 하지만, 그 과거와 (심지어는) 현재에 대해서도 우리가 알고 있는 내용의 양과 질(정확성)은 사안마다 또 사람마다 대부분 천차만별이기도 하지요. 이 때,

A라는 사건(event)이 미래에 '발생할 것인가 발생하지 않을 것인가'라는 (可不라는) 가장 간단한 경우를 보자면, 그 여부를 예측함에 있어 과거의 사례가 있는 경우도 있을 것이고, 매우 적거나 전혀 없는 경우도 있을 수 있겠죠. 예를 들자면 --- 제가 지금 동전을 10번 던져서 그 결과를 놓고 당신과 내기를 하려 한다면, 그 결과에 대한 경우의 수와 그 각각의 (이론적) 확률은 저나 당신에게 이미 알려져 있는 케이스입니다. (앞 0 & 뒤 10, 앞 1 & 뒤 9, …… 앞 9 & 뒤9, 앞 10 & 뒤 0) 하지만, 오늘 저녁에 제가 헤어진 옛 여자친구를 광화문 사거리에서 우연히 만날 수 있을 것인가에 대한 예측은, 앞서와 같이 참조할 만한 사전(社前)적 분포를 전혀 파악할 수 없는 경우이지요. 통계학에서는 이 두 case를 각각 'risk'와 'uncertainty'로 구분합니다.

그 어떠한 경우든 어쨌든 --- 예측이라는 행위는 기본적으로 (아직 발생되지 않은) '미래'를 향해있는 행위인 것만은 틀림없는 사실입니다. 그러하기에 예측은 100%라는 확실함의 정도를 보장할 수 없으며, '과거'를 대상으로 한 사후(事後)적 해석은 결코 '예측'이라 불리워서는 안 되는 행위이기도 합니다. (이와 관련하여, 유정식의 다음 지적은 기업 실무에서도 반드시 참고해야 할 사안이라 생각합니다. : "전문가나 일반인이 매번 예측에 실패하는 이유는 본디 예측할 수 없는 것을 예측해 내려고, 다시 말해 '맞히려고' 애를 쓰기 때문이다.(p178) …… "요컨데 어떤 일이 일어날지 알아맞히는 게 예측이 아니다. 발생 가능한 여러 케이스를 미리 대비하는 것이 예측이다."(p185) - 유정식, 「나의 첫 경영어 수업」중, 부키, 2020.) 이처럼,

예측은 개념적으로 현재를 포함한 앞으로의 '상황 변화'에 취약할 수 밖에 없습니다. 그러하기에, 이를 보완하는 정성 분석(qualitative analysis), 다시 말해 '인간만이 갖고 있는 능력'의 중요성은, 제 아무리 컴퓨터 기술이 발전한다 해도 결코 무시되어서는 안되는 이유가 되는 것이며, 이에 대한 저자의 의견 역시 동일합니다.

정확한 예측을 하는 열쇠는 순전히 계량적이기만 한 정보에 의존하는 게 아니라 모든 유형의 정보를 적절한 맥락에서 파악하는 좋은 의사결정 과정을 구축하는 것이다.(p201) …… 정보는 맥락에 놓일 때만 비로소 지식이 된다. 맥락을 전제하지 않고서는 신호와 소음을 구분할 수 없다.(pp726~727)

런데, 데이터에 인간의 판단이 개입되는 순간, 몇 가지 문제가 발생됩니다. 이 책은 그러한 문제점들의 수많은 사례들을 다루고 있는데, 그 문제의 원인은 크게 보아 인간의 본성에 기인하는 것과 인간 능력의 한계로부터 초래되는 것들로 구분되어질 수 있습니다.

#1. 인간의 본성 : 편견 / 집착

1440년 요하네스 구텐베르크가 발명한 인쇄술은, 새로은 '기계'의 발명이라는 상황 자체보다는, 그것이 초래한 '정보의 축적과 확산'이라는 관점에서 인류 역사에 큰 획을 그었다라 저자는 적고 있습니다. (참고로, 인쇄술의 발명을 셰익스피어의 문학 작품 해석과 연결하는 저자의 시선은 정말 놀랍고 신선했습니다.)

홍훈 교수의 행동경제학 강의」에서도 보았듯, 인간은 그 어떤 기준에서 보아도 결코 '합리적'이지 못합니다. (다만, 여러 기준에서 합리적이 되려고 노력은 한다고 할 수 있을겁니다.) 예측과 관련하여, 저자 네이트 실버가 제기하고 있는 인간의 비합리성은 '편향/편견'이라는 단어로 집약될 수 있습니다.

'객관적'은 때로 '계량적'과 동의어로 받아들여지는데, 사실은 그렇지 않다. 이 말은 개인적 편향과 편견 너머에 있는 진리를 바라본다는 뜻이다.(p157)

즉, 인간의 본성(이라고까지 일컬어질 수 있겠는)인 편견, 다시 말해 주관성을 극복하지 못하기 때문에, 우리의 예측이 틀리게 된다라는 주장입니다. (분야에 따라서는 이런 경우가 있을 수 있겠으나) 현대에서 데이터의 부족으로 인해 예측 분석의 오류가 발생되는 경우는 거의 없습니다. 이는 달리 표현해 --- 데이터를 더 많이 달라, 그러면 더 정확한 예측을 내놓겠다라는 주장이 (항상 그러한 것은 아니겠지만) 지니고 있는 결함을 지적하고 있다고 볼 수 있겠죠. 관련하여, 

저자는 예측가의 성향을 (UC Berkeley의 필립 테틀록 교수를 인용하여) '고슴도치'와 '여우'라는 두 가지로 구분하고 있는데, 우리가 TV 프로그램에서 흔히 보게되는 패널들은 (적어도 미국에서는) 고슴도치과(科)가 더 환영받(기에 더 많이 출연하)는 경향을 보인다라 말하고 있습니다. 그러나, 그들의 예측 결과가 출연 빈도와 비례하는 것은 아니었죠.

테틀록은 여우가 고슴도치보다 예측을 상당히 잘한다는 사실을 발견했다.(p128) …… 고슴도치의 경우 더 많은 사실을 마음대로 활용할수록 그 사실들을 자기 편견을 강화하는 쪽으로 조작할 가능성이 더 높아진다 … (p132) …… 고슴도치들은 자기 편견을 증거에 갖다 붙임으로써 실제로 존재하는 것이 아니라 자기가 보고자 하는 것을 본다.(p133)

어쨌든, 우리 안에 내재된 편향/편견, 혹은 집착 등으로 인해 우리는 스스로는 거짓말/자신의 주장을 할 수 없는 (데이터가 아닌, 단순히 수학적 의미로서의) 숫자(number)를 곡해하고 맙니다.

예측이 '언제나' 주관적 관점으로 오염된다는 점분명한 사실이다.(p65) …… 더 많은 정보가 오히려 빗나간 예측을 유도할 수 있다. 예측가가 그 많은 정보를 통해 진리를 파악하려 노력하기보다는 자기가 원하는 방향으로 예측하는 데 동원하는 일이 빚어지는 것도 바로 그런 경우다.(p187)

위 인용구에 등장하는 '자기가 원하는 방향'이라는 구절이 의미하는 - 물론 다분히 고의적인 경우도 포함하겠으나, 그같은 (일종의) 사기(fraud)의 경우를 제외한다하더라도 - 인간에게 드리워져있는 '확증 편향(confirmation bias)'의 제약(?)은, 많은 "예측'에서 오류를 낳게 합니다. (이에 대한 지적이 새로운 건 아닙니다. 이 책이 지닌 장점은 '새로운 사실을 알려주는 것'에도 있지만, '기존의 사실을 정리(categorize)'해주고 있는 점도 매우 크다고 생각합니다.)

이러한 '확증 편향'이 단지 예측의 정오(正誤)의 판단에만 영향을 미치는 것이라면 그나마 큰 문제가 아닐 수 있을 겁니다. 하지만 --- (자연에 대한) 우리의 지식이 늘어나고, 그리하여 우리가 자연을 (지배할 수는 없으나) 더 많이 이해하게 될 수 있게 되었다 하여도, 우리가 형성하고 있는 사회의 갖가지 현상들에 대한 지배력이나 이해까지 함께 커지는 것이 아니라는 점, 그건 이같은 편견/편향들이 꽤 심각한 영향을 미쳤기 때문이라는 점이 대두되게 됩니다. 예를 들어,

"사람들이 100년에 한 번씩 오는 대규모 폭풍이 일어날 가능성이 더 높아졌다고 생각한다 해서 그것이 발생할 확률이 변하는 것은 아니죠." - 애덤 쿠하르스키, 「수학자는 행운을 믿지 않는다」 중 p197, 북라이프, 2016.

자연과학에 관해서는 이러합니다. 사람들이 갖고 있는/갖게 되는 주관적 판단이 실제의 객관적 사실에 영향을 미칠 수는 없지요.(그 역(逆)은 성립됩니다.) 하지만, 위 인용구 속의 '대규모 폭풍'을 '대규모의 주가 폭락'으로 치환시키면, 주관적 판단이 객관적 사실에 영향을 미치지 않는다란 주장은 더 이상 성립될 수 없게 됩니다. 이제 우리는, (타인의 판단만이 아닌) 본인 스스로의 판단, 그리고 본인의 그 판단과 상호 작용을 하는 타인들의 판단이 자아내는 결과가 사회적 예측에 (어떤 방식으로든) 영향을 미친다라는 점을 심각하게 인지하여야 하는 겁니다. (현대 통계학이 기반을 하고 있는 정규분포 가정은 서로(의 판단 혹은 행동)가 상호작용을 하는 상황에는 적용되지 않습니다.(여타의 원인들도 있겠습니다만) '자기충족적 예언'과 '자기부정적 예측'이 그 주요한 원인(cause)이자 결과를 자아내는 주요 기제(mechanism)로 작동하기 때문이지요.

인간 활동에 대해 예측할 때 많은 경우, 예측이라는 행위 자체가 예측 대상자들의 행동을 바꾸어놓을 수 있다. 때로 행동의 이런 변화들은 경제 분야에서와 마찬가지로 예측 결과에 영향을 끼칠 수 있다. 이 영향은 예측을 더 정확하게 할 수도 있고 완전히 빗나가게 할 수도 있다. 독감을 비롯한 전염병 예측은 이 두 방향의 영향을 모두 받는다. 예측이 예측 내용을 스스로 실현하는 것을 자기충족적 예측(self-fufilling prediction) 또는 자기충족적 예언(self-fufilling prophecy)이라 한다. …… (이와는 반대로) 자기부정적 예측(self-canceling prediction)은 자기충족적 예측과 정반대다. 예측이 그 자체로 예측 내용을 약화시킨다. …… 독감 예측의 기본 목적은 독감에 대한 대중의 인식 수준을 높여 백신 접종을 하는 등 적극적으로 대응하도록 대중의 행동을 바꾸는 데 있기 때문이다. 가장 효과적이고 실질적인 독감 예측은, 이 예측 덕분에 사람들이 더 건강하게 행동하게 되어 결과적으로 예측이 빗나가는 게 아닐까 싶다.(pp375~380)

이 구절을 읽는 순간, Covid-19에 대한 방역 당국의 예측에 대해 '괜한 호들갑이었다'라는 생각을 잠시나마 가졌었던 저 역시, 이 책에서 지적하고 있는 편견/편향으로부터 결코 자유롭지 못했다라는 걸 새삼 깨닫게 되더군요. 허나 그렇다하여, --- 그러한 방역당국의 '호들갑'에 아무런 문제가 없었노라 말할 수 없을 가능성 또한 책은 제시하고 있습니다.

외삽(extrapolration)[21]은 예측의 매우 기본적인 방법론이다. 그런데 과용되기 일쑤다. 외삽은 기본적으로 현재의 추세가 앞으로도 무한하게 계속 이어지리라는 가정을 전제로 한다. 빗나간 예측으로 유명한 것 다수가 이런 가정을 너무 방만하게 적용한데서 빚어졌다. …… 통계적 관점에서 볼 때 더 큰 문제는 기하급수적 증가가 진행되는 분야에 외삽 방법론을 동원할 때에는 정확한 예측이 사실상 불가능하다는 데 있다. …… 예측 범위가 너무 넓어서 유용한 예측이 되지 못한다는 말이다.(pp368~371)

#2. 인간 능력의 한계

배가 고프면, 평소보다 더 많은 음식을 먹게 될 수 있습니다. 예측 행위도 마찬가지여서, 예측에 자신이 없을수록 더 많은 데이터와 과도할 정도의 복잡한 모델로 그 불안함을 감추려 한다라 저자는 말합니다. 과도한 데이터의 이용은 심심치않게 (어느 정도까지는 말이 되는 듯 보이지만, 결과적으로는 '까마귀 날자 배 떨어지는' 격의) 터무니 없는 오류를 자아내기도 하며, 복잡한 모델의 구축은 '과적합(overfitting)' 문제를 야기하는 우(愚)를 범하곤 한다는 것이죠.

통계학에서는 소음을 신호로 잘못 인식하는 행위를 가리켜 '과적합(overfitting)'이라고 부른다. …… '일반적인' 문제를 푸는 방법으로 '지나치게 특수한' 해법을 제시했다. 이것이 바로 과적합이고, 과적합은 더 나쁜 예측을 유도한다. …… (과적합 문제는) 언뜻 보면 쉽게 피할 수 있는 실수처럼 여겨진다. 하지만 그건 전지전능한 신의 능력으로 데이터 구조를 훤하게 다 꿰뚫고 있을 때라야 가능한 일이다. 실제 현실에서는 그렇지 않다. 우리는 우리가 접할 수 있는 증거에서 그 구조를 추론해야 한다. 이 과정에서 데이터가 한정되어 있고 소음이 많을 때, 그리고 데이터 안에 내재하는 근본 관계에 대해 이해가 부족할 때 사람들은 대개 과적합의 오류를 범한다. 이러한 사정은 지진 예측에서도 마찬가지다.(pp298~303)

독립변수(설명변수)들로부터 종속변수의 관계를 수식으로 나타내고자 할 때, 그 수식의 설명력 정도를 나타내는 결정계수(coefficient of determination : R)이라 부르는데, 0에서 1의 범위를 가지는 이 값은 1에 가까울수록 설명력이 높은 회귀식으로 인정받게 됩니다.만약 제가 롯데 자이언츠 야구단 소속 타자들의 시즌 타율을 예측하는 것으로 석사학위 논문을 쓴다고 할 때, 남들이 생각하는 평범한 변수들 5개를 대입했을 때의 R 값(예를 들어 0.55)보다, 제가 나름대로 추측하여 3개의 설명변수를 추가하여 총 8개의 설명변수로 R값을 뽑았더니 0.8이라는 놀라운 값이 나왔다 할 때, 비록 그 3개의 추가된 변수들이 (누가봐도 타율과의 연관성이 거의 없다라 여겨질) 선수 개개인의 '비행기 탑승 경험 횟수', '가족 구성원의 수', 그리고 '보유 차량의 배기량'이라 할지라도 과연, 0.8을 낳은 그 3개의 추가된 변수를 과감하게 제외하고 0.55의 R값을 보이는 모델을 선택할 수 있겠느냐라 상상해본다면, 그 누구든 추가된 3개 변수에의 미련을 버릴 수 없지 않을까 싶습니다. 하지만! --- 그러한 3개의 변수를 추가한 회귀방정식은 엄연히 '과거'의 데이터를 기반으로 한 결과인 것이고, 십중팔구 미래에 대한 예측에서는 '소음'으로 작동하여 더 형편없는 예측치를 내놓게 되겠죠.

'매개변수가 넷 있다면 나는 코끼리도 만들어낼 수 있다. 매개변수가 하나 더 있다면 난 이 코끼리가 몸을 흔들게도 할 수 있다.' 수학자 존 폰 노이만이 한 말이다. 과적합은 '엎친 데 덮치는' 격이다. 과적합 모델의 연구논문에서는 '더 나은 것'으로 보이지만 실제 현실에서는 '더 나쁜' 성적을 거둔다. 그리고 후자의 특성 때문에 실제 현실에서 예측하는 데 동원될 경우 호된 대가를 치른다. 이 모델은 또한 전자 때문에 겉보기에는 더 인상적이다. 매우 정확하고 뉴스 가치가 있는 예측을 할 수 있으며 과거에 사용된 여러 기법보다 훨씬 나은 듯 보인다. (물론 이는 참담한 실패와 그에 따른 호된 대가를 치를 때까지 뿐이다) 그렇기에 이런 모델은 학술지에도 좀 더 쉽게 발표되고 고객들에게 환영을 받는다. 반면 좀 더 정직한 모델은 시장에서 내쫓긴다. 그러나 과적합 모델은 신호가 아닌 소음에 적합하도록 만들어졌기 때문에 결국 정확성, 다시 말해 과학성을 훼손할 수밖에 없다.(p304)

이처럼, 인간은 자연의 구조에 대해 정확하게 알 수 없기 때문에, '과적합'이라는 실수를 쉽게 벗어내지 못합니다. 저자가 지적하고 있듯, 이는 신에게만 가능한 일이지요. (또한 신이 창조했기에 인간은 가능하나, 인간이 발명한 과학 기술로는 여전히 불가능한 일들도 있지요. 「수학의 쓸모」에서 저자들은 '보청기'를 그 예로 들고 있습니다.이처럼! --- 미국의 국방장관이었던 도널드 럼즈펠드의 발언으로 유명해진 '알려지지 않은 미지(unknown unknowns)'가 점점 더 많아진다라는 사실은 우리에게 '인간의 한계'를 깨닫게 해줍니다.

정보화 시대에 우리가 직면하고 또 우리 도처에 스며 있는 위험 가운데 하나는, 지식의 양이 아무리 넘쳐나더라도 우리가 실제로 아는 것과 우리가 안다고 생각하는 것 사이의 격차는 점점 벌어지고 있다는 것이다.(p115) …… 날씨에서 문제의 상당 부분은 초기 조건에 대한 우리의 지식이 불완전하다는 데서 기인한다. 우리는 기상 시스템의 작동 규칙은 매우 잘 알지만, 구름이나 폭풍우, 허리케인을 이루는 모든 분자의 위치는 완벽하게 알지 못한다. 따라서 우리가 할 수 있는 최선은 확률론적 예측을 하는 것이다. …… 예측이 필요한 것은 꼭 세계 자체가 불확실해서가 아니라, 세계를 완전히 이해하는 것이 우리의 능력 밖이기 때문이다.(pp451~452)

이처럼, 세계를 구성하고 있는 시스템의 참 모습을 알 수 없다라는 (피조물로서 갖게 되는) 근본적 한계 이외에도, 인간은 '정보의 양(量)이 적어도 혹은 많아도 문제적 상황에 맞닥뜨리게 됩니다. (정보가 적은 경우는 너무 당연해서 차치하더라도) 체스나 바둑에서처럼 경우의 수가 두뇌가 감당해낼 수 있는 용량을 초과하게 될 때에도 우리 인간은 올바른 예측을 할 수 없게 되지요.


렇다면, 그러니까 이같은 인간의 편견 혹은 한계를 극복할 수 없다면, 우리는 결코 올바른 예측을 할 수 없는 것일까요? 적어도 단번에 항상 올바른 예측을 할 수는 없을 수 있을지 몰라도, 수많은 시행착오를 거치다보면, 그리고 그 시행착오들을 겸손하게 받아들일 수 있다면 --- 인간도 '더 나은' 예측을 할 수 있다고 저자는 말합니다. 그러기 위해서 우리에게 필요한 것이 바로 '베이지언 추론'이지요. 우리가 맞닥뜨리게 되는 (미래의) 불확실함에 굴복하는 것이 아닌, 동적 대응을 추구한다라는 겁니다. (이 책의 역자인 이경식은 다음과 같은 비유로 베이지언 추론을 훌륭하게 설명해주고 있습니다. - "기존의 통계학이 멈춰 있는 과녁을 맞히는 것이라면 베이즈주의 통계학은 움직이는 과녁을 맞히는 것이다."(p733))

베이즈 정리는 세상은 본질적으로 불확실한 대상이 아니라고 말한다. 그러나 세상에 대해 당신이 갖는 주관적 인식이 사실은 진리에 대한 어림짐작에 지나지 않음을 인정하라고 요구한다.(p722) …… 베이즈 정리는 우리에게 새로운 정보가 나타날 때마다 기존의 예측을 업데이트하라고 주문한다. 시행착오를 반복해야 한다. 구글처럼 진짜 빅데이터를 다루는 기업들은 예측 모델 구축에 그다지 많은 시간을 들이지 않는다. (예측 모델에 지나치게 많은 시간을 들이고 있다는 증거는 바로 자기 모델이 과거 데이터에 얼마나 잘 들어맞는지 설명하는 일에 몰두하는 것이다. …… 어떤 예측 모델이 소음을 놓고서 신호를 포착했다고 생각하게 하는 과적합 오류를 범하기는 아주 쉽다. 예측을 '미래 사건에 엄격하게 적용되는 어떤 것'이라고 확실하게 정의하는 것만이 이런 오류를 저지를 위험을 줄여준다.)(pp727~728)

·

·

·

여러분이 유능한 예측가인지 아닌지 아주 간단하게 알아보려면, 정보가 더 많아질 때 여러분이 하는 예측의 질이 나아지는지 확인하면 된다.(p201)

저자가 제시하고 있는 '베이지언 추론'을 알고 있는 지금과, 알지 못했던 과거에 접하는 위 인용구의 의미가 확연하게 다를 것이라는 점, 그 진정한 차이를 깨닫게 되었다면, 이 두껍고 그러나 명확한, 허나 정리하기엔 참으로 난감한 이 책을 읽어낸 보람을 한껏 즐기셔도 되지 않을까 싶습니다.

저 개인적으로는 무언가 새로운 사실을 배울 수 있었다라기 보다는, 기존의 많은 책들에서 읽었던 내용들을 비교적 일목요연하게 정리해볼 수 있었다라는, 앎의 정도가 이해의 정도를 또한 견인한다라는 점을 배울 수 있었던, 매우 유익한 독서였었습니다. 그 어떠한 목적으로든, 세상을 보다 올바르게 그리고 정확하게 이해하고자 하신다면 좋은 지침서가 되리라 확신합니다. (그러나) 선택은 언제나 당신의 몫으로... ^^

(그나저나, 이 새로운 에디터에 익숙해지려면 꽤나 노력도 하고 시간도 걸릴 것 같습니다. 중간에 각주 하나 추가되면 이후로 번호 수정하는 것도 꽤나 일이네요. 뭐, 이 에디터가 모바일에 최적화되어 있다 하는데, 제가 쓴 글은 모바일로 봐도 별 달라진 게 없어 보입니다. 뭔가 헛고생 한 것 같은데, 글 쓰는 스타일을 바꿔야할지, 플랫폼을 아예 바꿔야하는 건지... --;;)

※ 함께 읽어보면 좋을 책들 : 「수학의 쓸모」 · 「수학자는 행운을 믿지 않는다」 · 「팩트풀니스」 · 「벌거벗은 통계학」 · 「신은 주사위 놀이를 하지 않는다


[1] "나는 <신호와 소음>이라는 이 책의 내용을 자동차에 붙이는 스티커에 들어갈 정도로 압축한다면 무엇이 될까 하는 생각을 종종했다. 그리고 '확률적으로 생각하라'가 가장 적절할 것 같다는 결론을 내렸다. 그런데 이번에는 거기에다 스티커 하나를 더 추가하면 좋겠다는 생각이 든다. 이 스티커의 내용은 이렇다. '속도를 늦추고 의심하라.'" - <개정서문 : 더 나은 확률적 사고를 위한 두 가지 제안> 중 p38.

[2] "여러 상황이 벌어질 확률 분포를 (객관적, 혹은 주관적이든) 알고 있을 경우는 '리스크가 있을 때의 의사 결정'이라고 부른다. 또, 이 확률 분포를 전혀 알 수 없는 경우도 있는데, 이러한 상황을 '불확실한 때의 의사 결정'이라고 한다." - 나카무라 지카라, 「정량×정성 분석 바이블」중 p70, 한스미디어, 2019.

[3] "불확실성은 예측의 본질이다."(p652)

[4] "'현재의 정보를 가지고 과거의 판단을 추론하는 것'은 예측 행위가 아님을 확인해야 한다. 이 같은 식으로 '과거를 예측'하는 것은 그 자체가 모순이며, 따라서 예측이 성공했다고 말할 수 없다."(p294)

[5] 과거의 데이터를 수집·분석하는 '통계' 또는 '정량 분석(quantitive analysis)'과 '예측(forecasting)'은 또한 구분되어 이해해야 합니다. '통계'에 대한 야구 전문기자 레너드 코페트의 다음 지적은 이를 잘 표현하고 있지요. : "염두에 두어야 할 것은 통계는 앞으로 해낼 일의 능률을 재는 잣대가 아니라 이미 지나간 일의 효능을 잰 부산물에 지나지 않는다는 것, 앞날에 대한 예측이 아니라 과거에 대한 서술이라는 것, 그리고 무엇보다도 살아 움직이는 야구라는 경기에서 일부만을 임의로 뽑아내 숫자로 옮겨 놓은 것에 지나지 않는다는 것이다." - 레너드 코페트, 「야구란 무엇인가」 중 p366, 황금가지, 2009.

[6] "예측은 목적이 아니라 수단이다"(p395)라는 저자 네이트 실버의 지적, 그리고 추천사를 쓴 송길영의 "데이터는 결과를 통보해주는 사신(messenager)이 아니라 원인을 알려주는 도구"(p7)라는 지적과도 일맥상통하는 문구입니다.

[7] "정보기술 분야에서 최초의 혁명은 인쇄술과 함께 일어났다. 1440년에 요하네스 구텐베르크가 활판인쇄술을 발명하자 대중도 정보에 접근할 수 있는 시대가 열렸다. …… 인쇄술은 전혀 예상 밖의 것부터 낳았다. 바로 수백 년에 걸친 종교전쟁이다. 인간이 자신의 운명을 예측하고 자기에게 주어진 여러 갈림길 가운데 하나를 선택할 수 있다고 믿게 되면서 인류 역사상 가장 유혈이 낭자한 시대가 전개되었다."(p46) …… "셰익스피어의 연극은 흔히 운명에 초점을 맞춘다. 셰익스피어의 작품이 그토록 비극적인 이유는 바로 주인공들이 원하는 것과 운명 사이의 간극 때문이다. 자기 운명을 그대로 받아들이지 않고 스스로 통제하겠다는 생각은 그 무렵에도 중요한 목표였다. 하지만 그 목적을 이룰 역량까지는 확보하지 못했기 때문에 자기 운명을 시험한 사람들은 보통 원하지 않는 죽음을 맞곤 했다."(p50)

[8] "고슴도치는 거창한 생각, 곧 세상에 대한 지배적 원칙, 물리학 법칙이자 사회의 모든 상호 작용을 실질적으로 뒷받침하는 것처럼 작동하는 거대한 원칙을 믿으며, …… 언제나 큰 녀석 하나를 노리는 사냥꾼"(p127)

[9] "여우는 … 수없이 사소한 생각들을 믿으며 또 문제를 해결하려면 다양한 접근이 필요하다고 여기는, 관심이 사방팔방으로 뻗치는 산만하기 짝이 없는 유형이다. …… 무언가를 부지런히 줍고 다니는 채집자"(p127)

[10] 엄밀하게 말하면, 고슴도치와 여우는 양 극단의 표상이고 현실에서는 이 양 극단 사이의 스펙트럼으로 구분됩니다.

[11] "같은 예측이라도 크고 대담한 예측을 하는 고슴도치에게 텔레비전 출연 기회가 더 많이 돌아간다."(p129)

[12] "수치 자체는 스스로를 변호할 길이 없다. 수치를 대신해 우리가 한다. 우리는 수치에 의미를 부여한다. …… 우리는 더 많은 데이터를 요구하기에 앞서 자기 자신에 대해 더 많은 것을 알 필요가 있다."(p56) 

[13] "실재(實在)하는 인과관계를 반영하는 패턴과 그렇지 않은 패턴을 구분하는 능력 … 과학은 이 능력을 키우기 위한 끊임없는 노력일 따름이라고 할 수 있다. …… 우리 눈에 띄지만 어떤 원인도 없고 단지 우연인 패턴은 보통 미신의 기반을 이룬다. 미신이란 실재로는 없는 인과관계가 존재한다는 믿음이다. 예컨대 도박판에서 주사위를 던지기 전에 입맞춤을 하면 6이 나올 확률이 높아진다는 믿음 … 은 미신이다." …… "일단 형성된 미신은 저절로 강화되는 경향이 있다. …… 사람들은 자신이 품은 이론을 뒷받침하는 증거와 사건에만 주목하고 반례는 무시하곤 한다. 이런 경향을 일컬어 '확증 편향 confirmation bias'이라고 한다. 예컨대 내가 검은 고양이를 본 다음에 돌부리에 걸려 넘어졌다는 사실을 검은 고양이를 보면 불길하다는 증거로 간주하면서, 검은 고양이를 보고도 넘어지지 않은 경우들은 무시하는 것이 확증 편향이다." --- 데이비드 핸드,「신은 주사위 놀이를 하지 않는다」 중 pp30~34, 더퀘스트, 2016.

[14] "세상의 모든 정보를 모두 흡수할 수 있는 사람은 없다. 문제는 우리가 지금 어떤 부분을 받아들이고 그것을 어떻게 선택했는가, 그리고 지금 어떤 부분을 무시하는가 하는 것이다. 우리가 받아들일 가능성이 가장 높은 것은 이야기가 있는 정보, 즉 극적으로 들리는 정보다." - 한스 로슬링 외, 「팩트풀니스」 중 p148, 김영사, 2019.

[15] "인간은 자연현상의 과정과 경로를 예측할 수는 있지만 바꾸어놓을 수는 없다."(p219)

[16] "자연법칙은 그다지 많이 변하지 않는다. …… 인간 지식의 총량이 확대되는 한 우리는 자연의 여러 신호를 점점 더 정확하게 이해하게 될 것이다. 자연의 비밀을 전부 알 수는 영원히 없겠지만 말이다. …… 하지만 세상살이가 점점 더 '예측' 가능할 거라고 결론을 내릴 수는 없다. 어쩌면 그 반대가 맞을지도 모른다. 과학은 자연법칙의 비밀을 밝혔지만 동시에 사회의 조직을 더 복잡하게 하고 있다."(p721)

[17] "주가를 추측할 때 투자자들이 실제로 하는 일은 다른 사람들이 실제로 하는 일은 다른 사람들이 무슨 일을 할지를 예상하는 것이다. 회사가 근본이 탄탄하다고 해서 그 회사의 주가가 반드시 오르는 것은 아니다. 다른 투자자들이 그 회사는 그만큼의 가치가 있다고 생각하기 때문이다." - 애덤 쿠하르스키, 위의 책 pp184~185.

[18] "정규분포는 개별 사건들이 독립적이고 분포에 미치는 영향력이 각각 동일할 경우에 성립된다. 학생들의 신장(키)이 정규분포를 띠는 이유는 키에 대해 학생들이 상호 작용을 하지 않고 학생 한 명이 표본에 추가될 때 분포에 미치는 영향력이 각자 동일하지 때문이다. 하지만 … 개별 사건들이 네트워크로 얽혀 있고 특정 사건의 영향력이 다른 것보다 높다면 정규 분포는 현실을 올바로 표현하지 못한다." - 유정식, 「빌게이츠는 왜 과학책을 읽을까」 중 p19, 부키, 2019.

[19] "(전염병 예측에 대한) 행위자 기반 모델은 … '질병 예측의 자기부정적 특성' 때문에 (제대로 상황을 예측해놓고도) 비판받을 수 있다. 예를 들어 그 모델이 특정한 조치가 매우 효과적일 것으로 제안했다고 치자. 그래서 조치가 내려졌다! 또 이 조치가 효과를 거두어 실제 현실에서 문제의 전염병 확산이 주춤해졌다. 그러면 사람들은 그 조치가 너무 과했던 게 아니었을까 의심한다."(p393)

[20] 니얼 퍼거슨은 그의 저서 「둠 : 재앙의 정치학」에서 일반적으로 재난에의 대응으로는 '호들갑'이 차라리 더 낫다라는 견해를 밝히기도 했습니다. : "재난이란 본질적으로 예측불능이며, 불확실성의 영역에 속한 문제이다. …… (이처럼) 재난을 예측하는 것은 불가능하기 때문에, 비상사태가 터질 경우를 대비해 맞춤형 매뉴얼을 준비한다는 등의 관료적인 행태보다는 차라리 모든 사태에 대해 호들갑에 가까이 대응하는 편이 낫다." - 니얼 퍼거슨, 「둠 : 재앙의 정치학」 중 p16, 21세기북스, 2021.

[21] "이용가능한 자료의 범위가 한정되어 있어 그 범위 이상의 값을 구할 수 없을 때 관측된 값을 이용하여 한계점 이상의 값을 추정하는 것" - 네이버 백과사전

[22] "그 많은 데이터에서 의미 있는 것을 찾기란 쉽지 않은 일이고, 때문에 우리는 말도 안 되는 인과관계를 상상하곤 한다. 미국에서 슈퍼볼 우승팀이 경제성장의 '선행지표'로 유명세를 떨치던 때가 있었다. …… 이 지표는 1997년까지 31년 가운에 28년이나 주식시장의 방향을 정확하게 '예측'했다. ……… 물론 그건 '우연의 일치'였다. …… 사실 당첨 확률이 1억 9,500만분의 1밖에 되지 않는 파워볼 복권이라 해도 매주 누군가는 이 복권에 당첨된다. …… 마찬가지로 수백만개의 통계적 지표 가운에 몇몇은 우연하게도 주식가격이나 GDP 성장률 또는 실업률과 상관관계를 보인다. 슈퍼볼 승자가 아니었더라면 우간다의 닭고기 생산량이 그 지표가 되었을지도 모른다. 이러한 관계는 그저 우연의 일치일 뿐이다."(pp328~330)

[23] "과적합(overfitting)은 어떤 모형이 학습 데이터 안의 무작위적인 노이즈 신호만 기억하고 기본 패턴을 학습하지 못할 때 생긴다. 과적합 모형은 과거를 매우 정확하게 기술할지 모르나 미래를 예측하는 데는 서툴다." - 닉 폴슨 · 제임스 스콧, 「수학의 쓸모」 중 p98, 더퀘스트, 2020.

[24] "종속변수의 총변동은 설명변수에 의해 설명되는 변동분과 설명되지 않는 변동분의 합으로 분해된다. 총변동에서 차지하는 설명되는 변동분의 비율을 R 이라고 한다. R값은 회귀직선의 설명력이 최대일 때 1이 되고, 최소일 때 0이 된다. …… 설명변수가 추가될 때마다 R값이 늘어났으면 늘어났지 줄어들지는 않는다. …… 설명변수의 수가 다른 여러 모형 가운데 하나의 모형을 선정할 때 R값을 여러 모형에 걸쳐 단순 비교할 수 없는 이유가 여기에 있다." - 류근관, 「통계학」 중 p178, 법문사, 2013.

[25] "문제의 사건이 일어난 '다음에' 무관한 신호들 중에서 의미 있는 신호를 찾아내는 일은 훨씬 쉽다. 물론 사건이 일어나고 나면 신호 하나가 마치 수정처럼 훤하게 들여다보인다. 그 신호가 어떤 재앙에 대한 진실을 말하는지 우리는 알 수 있다. 그러나 사건이 일어나기 전에는 다르다. 신호는 모호하며 다른 가능성을 가리키는 온갖 의미로 가득하다. 그 신호는 '소음'으로 가득한 공기 속에, 다시 말해 특정 재난을 예측하는 데 쓸모도 없고 관계도 없는 모든 종류의 정보 속에 담긴 채 관찰자에게 온다."(p679)

[26] "1814년에 라플라스는 다음과 같은 가설을 세웠는데, 거기에 등장하는 상상의 존재를 후대 사람들은 '라플라스의 악마(Laplace's Demon)라 부른다. - '우리는 현재의 우주 상태를 과거의 결과이자 미래의 원인으로 여길 수 있다. 그런데 특정한 순간에 자연을 움직이는 모든 힘과 자연을 구성하는 모든 요소의 위치를 알고 있는 지적 존재가 있다면, 그리고 이 지적 존재의 지성이 모든 자료를 분석할 수 있을 만큼 거대하다면, 이 존재는 우주에서 가장 큰 물체부터 가장 작은 물질인 원자에 이르기까지 모든 것의 운동을 단 하나의 공식으로 정리할 수 있을 것이다. 왜냐하면 이러한 지적인 존재에게 불확실한 것은 아무 것도 없고, 이 지적 존재를 미래를 과거처럼 자기 눈으로 바라볼 것이기 때문이다.'"(pp223~224)

[27] "말소리를 주변 잡음과 구분하는 문제를 살펴보자. 여러분의 뇌는 이 문제에 믿기지 않을 정도로 잘 대처한다. 시끄러운 술집에서 잡담 소리가 가득한데도 여러분은 친구의 말을 대체로 알아들을 수 있다. 신경과학자들은 여러분이 어떻게 그럴 수 있는지 100퍼센트 이해하지 못하는데, 바로 그런 까닭에 보청기를 끼는 사람들이 여태껏 계속해서 잡음에 시달리고 있다." - 닉 폴슨 · 제임스 스콧, 「수학의 쓸모」 중 p184, 더퀘스트, 2020.

[28] "알려진 앎(known knowns)이 있다. 우리가 안다는 사실을 아는 것이다. 알려진 미지(known unknowns)가 있다. 현재 우리가 모른다는 것을 아는 것이다. 또한 알려지지 않은 미지(unknown unknowns)가 있다. 우리가 모른다는 사실조차 알지 못하는 것이다. 그리고 해마다 우리가 더 많은 것을 모른다는 사실이 밝혀지고 있다."(p683)

[29] "체스와 같은 게임에서 정보는 문제가 되지 않는다. 플레이어들에게는 모든 것이 보인다. 말들이 어디 있는지 알고 상대가 어떻게 말을 움직였는지도 안다. 플레이어들이 사건을 관찰할 수 없기 때문이 아니라 이용할 수 있는 정보를 처리하지 못하기 때문에 게임에 운이 작용하게 되는 것이다."- 애덤 쿠하르스키,「수학자는 행운을 믿지 않는다」중 p247, 북라이프, 2016.

[30] 저자는 이를 "조금씩 조금씩 덜 틀리는 법"(p400)을 배워가는 과정이라 표현하고 있습니다.

[31] "'사전믿음 + 사실(데이터) = 수정된 믿음'"(p126) …… "베이즈 규칙은 새로운 정보가 입수됐을 때 기존의 믿음을 어떻게 바꿔야 할지 알려준다."(p133) …… "베이즈 정리는 정보가 증가함에 따라 확률이 변해가는 과정을 조건부 확률을 이용하여 묘사해 준다. 새로운 경험과 새로운 정보는 확률을 계산할 때 새로운 조건을 가져다 준다. 새로운 조건하에서 원하는 사건의 확률을 업데이트할 때 베이즈 정리를 사용한다."(p206) - 닉 폴슨 · 제임스 스콧, 「수학의 쓸모」 중, 더퀘스트, 2020.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo