[1] "나는 <신호와 소음>이라는 이 책의 내용을 자동차에 붙이는 스티커에 들어갈 정도로 압축한다면 무엇이 될까 하는 생각을 종종했다. 그리고 '확률적으로 생각하라'가 가장 적절할 것 같다는 결론을 내렸다. 그런데 이번에는 거기에다 스티커 하나를 더 추가하면 좋겠다는 생각이 든다. 이 스티커의 내용은 이렇다. '속도를 늦추고 의심하라.'" - <개정서문 : 더 나은 확률적 사고를 위한 두 가지 제안> 중 p38.
[2] "여러 상황이 벌어질 확률 분포를 (객관적, 혹은 주관적이든) 알고 있을 경우는 '리스크가 있을 때의 의사 결정'이라고 부른다. 또, 이 확률 분포를 전혀 알 수 없는 경우도 있는데, 이러한 상황을 '불확실한 때의 의사 결정'이라고 한다." - 나카무라 지카라, 「정량×정성 분석 바이블」중 p70, 한스미디어, 2019.
[3] "불확실성은 예측의 본질이다."(p652)
[4] "'현재의 정보를 가지고 과거의 판단을 추론하는 것'은 예측 행위가 아님을 확인해야 한다. 이 같은 식으로 '과거를 예측'하는 것은 그 자체가 모순이며, 따라서 예측이 성공했다고 말할 수 없다."(p294)
[5] 과거의 데이터를 수집·분석하는 '통계' 또는 '정량 분석(quantitive analysis)'과 '예측(forecasting)'은 또한 구분되어 이해해야 합니다. '통계'에 대한 야구 전문기자 레너드 코페트의 다음 지적은 이를 잘 표현하고 있지요. : "염두에 두어야 할 것은 통계는 앞으로 해낼 일의 능률을 재는 잣대가 아니라 이미 지나간 일의 효능을 잰 부산물에 지나지 않는다는 것, 앞날에 대한 예측이 아니라 과거에 대한 서술이라는 것, 그리고 무엇보다도 살아 움직이는 야구라는 경기에서 일부만을 임의로 뽑아내 숫자로 옮겨 놓은 것에 지나지 않는다는 것이다." - 레너드 코페트, 「야구란 무엇인가」 중 p366, 황금가지, 2009.
[6] "예측은 목적이 아니라 수단이다"(p395)라는 저자 네이트 실버의 지적, 그리고 추천사를 쓴 송길영의 "데이터는 결과를 통보해주는 사신(messenager)이 아니라 원인을 알려주는 도구"(p7)라는 지적과도 일맥상통하는 문구입니다.
[7] "정보기술 분야에서 최초의 혁명은 인쇄술과 함께 일어났다. 1440년에 요하네스 구텐베르크가 활판인쇄술을 발명하자 대중도 정보에 접근할 수 있는 시대가 열렸다. …… 인쇄술은 전혀 예상 밖의 것부터 낳았다. 바로 수백 년에 걸친 종교전쟁이다. 인간이 자신의 운명을 예측하고 자기에게 주어진 여러 갈림길 가운데 하나를 선택할 수 있다고 믿게 되면서 인류 역사상 가장 유혈이 낭자한 시대가 전개되었다."(p46) …… "셰익스피어의 연극은 흔히 운명에 초점을 맞춘다. 셰익스피어의 작품이 그토록 비극적인 이유는 바로 주인공들이 원하는 것과 운명 사이의 간극 때문이다. 자기 운명을 그대로 받아들이지 않고 스스로 통제하겠다는 생각은 그 무렵에도 중요한 목표였다. 하지만 그 목적을 이룰 역량까지는 확보하지 못했기 때문에 자기 운명을 시험한 사람들은 보통 원하지 않는 죽음을 맞곤 했다."(p50)
[8] "고슴도치는 거창한 생각, 곧 세상에 대한 지배적 원칙, 물리학 법칙이자 사회의 모든 상호 작용을 실질적으로 뒷받침하는 것처럼 작동하는 거대한 원칙을 믿으며, …… 언제나 큰 녀석 하나를 노리는 사냥꾼"(p127)
[9] "여우는 … 수없이 사소한 생각들을 믿으며 또 문제를 해결하려면 다양한 접근이 필요하다고 여기는, 관심이 사방팔방으로 뻗치는 산만하기 짝이 없는 유형이다. …… 무언가를 부지런히 줍고 다니는 채집자"(p127)
[10] 엄밀하게 말하면, 고슴도치와 여우는 양 극단의 표상이고 현실에서는 이 양 극단 사이의 스펙트럼으로 구분됩니다.
[11] "같은 예측이라도 크고 대담한 예측을 하는 고슴도치에게 텔레비전 출연 기회가 더 많이 돌아간다."(p129)
[12] "수치 자체는 스스로를 변호할 길이 없다. 수치를 대신해 우리가 한다. 우리는 수치에 의미를 부여한다. …… 우리는 더 많은 데이터를 요구하기에 앞서 자기 자신에 대해 더 많은 것을 알 필요가 있다."(p56)
[13] "실재(實在)하는 인과관계를 반영하는 패턴과 그렇지 않은 패턴을 구분하는 능력 … 과학은 이 능력을 키우기 위한 끊임없는 노력일 따름이라고 할 수 있다. …… 우리 눈에 띄지만 어떤 원인도 없고 단지 우연인 패턴은 보통 미신의 기반을 이룬다. 미신이란 실재로는 없는 인과관계가 존재한다는 믿음이다. 예컨대 도박판에서 주사위를 던지기 전에 입맞춤을 하면 6이 나올 확률이 높아진다는 믿음 … 은 미신이다." …… "일단 형성된 미신은 저절로 강화되는 경향이 있다. …… 사람들은 자신이 품은 이론을 뒷받침하는 증거와 사건에만 주목하고 반례는 무시하곤 한다. 이런 경향을 일컬어 '확증 편향 confirmation bias'이라고 한다. 예컨대 내가 검은 고양이를 본 다음에 돌부리에 걸려 넘어졌다는 사실을 검은 고양이를 보면 불길하다는 증거로 간주하면서, 검은 고양이를 보고도 넘어지지 않은 경우들은 무시하는 것이 확증 편향이다." --- 데이비드 핸드,「신은 주사위 놀이를 하지 않는다」 중 pp30~34, 더퀘스트, 2016.
[14] "세상의 모든 정보를 모두 흡수할 수 있는 사람은 없다. 문제는 우리가 지금 어떤 부분을 받아들이고 그것을 어떻게 선택했는가, 그리고 지금 어떤 부분을 무시하는가 하는 것이다. 우리가 받아들일 가능성이 가장 높은 것은 이야기가 있는 정보, 즉 극적으로 들리는 정보다." - 한스 로슬링 외, 「팩트풀니스」 중 p148, 김영사, 2019.
[15] "인간은 자연현상의 과정과 경로를 예측할 수는 있지만 바꾸어놓을 수는 없다."(p219)
[16] "자연법칙은 그다지 많이 변하지 않는다. …… 인간 지식의 총량이 확대되는 한 우리는 자연의 여러 신호를 점점 더 정확하게 이해하게 될 것이다. 자연의 비밀을 전부 알 수는 영원히 없겠지만 말이다. …… 하지만 세상살이가 점점 더 '예측' 가능할 거라고 결론을 내릴 수는 없다. 어쩌면 그 반대가 맞을지도 모른다. 과학은 자연법칙의 비밀을 밝혔지만 동시에 사회의 조직을 더 복잡하게 하고 있다."(p721)
[17] "주가를 추측할 때 투자자들이 실제로 하는 일은 다른 사람들이 실제로 하는 일은 다른 사람들이 무슨 일을 할지를 예상하는 것이다. 회사가 근본이 탄탄하다고 해서 그 회사의 주가가 반드시 오르는 것은 아니다. 다른 투자자들이 그 회사는 그만큼의 가치가 있다고 생각하기 때문이다." - 애덤 쿠하르스키, 위의 책 pp184~185.
[18] "정규분포는 개별 사건들이 독립적이고 분포에 미치는 영향력이 각각 동일할 경우에 성립된다. 학생들의 신장(키)이 정규분포를 띠는 이유는 키에 대해 학생들이 상호 작용을 하지 않고 학생 한 명이 표본에 추가될 때 분포에 미치는 영향력이 각자 동일하지 때문이다. 하지만 … 개별 사건들이 네트워크로 얽혀 있고 특정 사건의 영향력이 다른 것보다 높다면 정규 분포는 현실을 올바로 표현하지 못한다." - 유정식, 「빌게이츠는 왜 과학책을 읽을까」 중 p19, 부키, 2019.
[19] "(전염병 예측에 대한) 행위자 기반 모델은 … '질병 예측의 자기부정적 특성' 때문에 (제대로 상황을 예측해놓고도) 비판받을 수 있다. 예를 들어 그 모델이 특정한 조치가 매우 효과적일 것으로 제안했다고 치자. 그래서 조치가 내려졌다! 또 이 조치가 효과를 거두어 실제 현실에서 문제의 전염병 확산이 주춤해졌다. 그러면 사람들은 그 조치가 너무 과했던 게 아니었을까 의심한다."(p393)
[20] 니얼 퍼거슨은 그의 저서 「둠 : 재앙의 정치학」에서 일반적으로 재난에의 대응으로는 '호들갑'이 차라리 더 낫다라는 견해를 밝히기도 했습니다. : "재난이란 본질적으로 예측불능이며, 불확실성의 영역에 속한 문제이다. …… (이처럼) 재난을 예측하는 것은 불가능하기 때문에, 비상사태가 터질 경우를 대비해 맞춤형 매뉴얼을 준비한다는 등의 관료적인 행태보다는 차라리 모든 사태에 대해 호들갑에 가까이 대응하는 편이 낫다." - 니얼 퍼거슨, 「둠 : 재앙의 정치학」 중 p16, 21세기북스, 2021.
[21] "이용가능한 자료의 범위가 한정되어 있어 그 범위 이상의 값을 구할 수 없을 때 관측된 값을 이용하여 한계점 이상의 값을 추정하는 것" - 네이버 백과사전
[22] "그 많은 데이터에서 의미 있는 것을 찾기란 쉽지 않은 일이고, 때문에 우리는 말도 안 되는 인과관계를 상상하곤 한다. 미국에서 슈퍼볼 우승팀이 경제성장의 '선행지표'로 유명세를 떨치던 때가 있었다. …… 이 지표는 1997년까지 31년 가운에 28년이나 주식시장의 방향을 정확하게 '예측'했다. ……… 물론 그건 '우연의 일치'였다. …… 사실 당첨 확률이 1억 9,500만분의 1밖에 되지 않는 파워볼 복권이라 해도 매주 누군가는 이 복권에 당첨된다. …… 마찬가지로 수백만개의 통계적 지표 가운에 몇몇은 우연하게도 주식가격이나 GDP 성장률 또는 실업률과 상관관계를 보인다. 슈퍼볼 승자가 아니었더라면 우간다의 닭고기 생산량이 그 지표가 되었을지도 모른다. 이러한 관계는 그저 우연의 일치일 뿐이다."(pp328~330)
[23] "과적합(overfitting)은 어떤 모형이 학습 데이터 안의 무작위적인 노이즈 신호만 기억하고 기본 패턴을 학습하지 못할 때 생긴다. 과적합 모형은 과거를 매우 정확하게 기술할지 모르나 미래를 예측하는 데는 서툴다." - 닉 폴슨 · 제임스 스콧, 「수학의 쓸모」 중 p98, 더퀘스트, 2020.
[24] "종속변수의 총변동은 설명변수에 의해 설명되는 변동분과 설명되지 않는 변동분의 합으로 분해된다. 총변동에서 차지하는 설명되는 변동분의 비율을 R 이라고 한다. R값은 회귀직선의 설명력이 최대일 때 1이 되고, 최소일 때 0이 된다. …… 설명변수가 추가될 때마다 R값이 늘어났으면 늘어났지 줄어들지는 않는다. …… 설명변수의 수가 다른 여러 모형 가운데 하나의 모형을 선정할 때 R값을 여러 모형에 걸쳐 단순 비교할 수 없는 이유가 여기에 있다." - 류근관, 「통계학」 중 p178, 법문사, 2013.
[25] "문제의 사건이 일어난 '다음에' 무관한 신호들 중에서 의미 있는 신호를 찾아내는 일은 훨씬 쉽다. 물론 사건이 일어나고 나면 신호 하나가 마치 수정처럼 훤하게 들여다보인다. 그 신호가 어떤 재앙에 대한 진실을 말하는지 우리는 알 수 있다. 그러나 사건이 일어나기 전에는 다르다. 신호는 모호하며 다른 가능성을 가리키는 온갖 의미로 가득하다. 그 신호는 '소음'으로 가득한 공기 속에, 다시 말해 특정 재난을 예측하는 데 쓸모도 없고 관계도 없는 모든 종류의 정보 속에 담긴 채 관찰자에게 온다."(p679)
[26] "1814년에 라플라스는 다음과 같은 가설을 세웠는데, 거기에 등장하는 상상의 존재를 후대 사람들은 '라플라스의 악마(Laplace's Demon)라 부른다. - '우리는 현재의 우주 상태를 과거의 결과이자 미래의 원인으로 여길 수 있다. 그런데 특정한 순간에 자연을 움직이는 모든 힘과 자연을 구성하는 모든 요소의 위치를 알고 있는 지적 존재가 있다면, 그리고 이 지적 존재의 지성이 모든 자료를 분석할 수 있을 만큼 거대하다면, 이 존재는 우주에서 가장 큰 물체부터 가장 작은 물질인 원자에 이르기까지 모든 것의 운동을 단 하나의 공식으로 정리할 수 있을 것이다. 왜냐하면 이러한 지적인 존재에게 불확실한 것은 아무 것도 없고, 이 지적 존재를 미래를 과거처럼 자기 눈으로 바라볼 것이기 때문이다.'"(pp223~224)
[27] "말소리를 주변 잡음과 구분하는 문제를 살펴보자. 여러분의 뇌는 이 문제에 믿기지 않을 정도로 잘 대처한다. 시끄러운 술집에서 잡담 소리가 가득한데도 여러분은 친구의 말을 대체로 알아들을 수 있다. 신경과학자들은 여러분이 어떻게 그럴 수 있는지 100퍼센트 이해하지 못하는데, 바로 그런 까닭에 보청기를 끼는 사람들이 여태껏 계속해서 잡음에 시달리고 있다." - 닉 폴슨 · 제임스 스콧, 「수학의 쓸모」 중 p184, 더퀘스트, 2020.
[28] "알려진 앎(known knowns)이 있다. 우리가 안다는 사실을 아는 것이다. 알려진 미지(known unknowns)가 있다. 현재 우리가 모른다는 것을 아는 것이다. 또한 알려지지 않은 미지(unknown unknowns)가 있다. 우리가 모른다는 사실조차 알지 못하는 것이다. 그리고 해마다 우리가 더 많은 것을 모른다는 사실이 밝혀지고 있다."(p683)
[29] "체스와 같은 게임에서 정보는 문제가 되지 않는다. 플레이어들에게는 모든 것이 보인다. 말들이 어디 있는지 알고 상대가 어떻게 말을 움직였는지도 안다. 플레이어들이 사건을 관찰할 수 없기 때문이 아니라 이용할 수 있는 정보를 처리하지 못하기 때문에 게임에 운이 작용하게 되는 것이다."- 애덤 쿠하르스키,「수학자는 행운을 믿지 않는다」중 p247, 북라이프, 2016.
[30] 저자는 이를 "조금씩 조금씩 덜 틀리는 법"(p400)을 배워가는 과정이라 표현하고 있습니다.
[31] "'사전믿음 + 사실(데이터) = 수정된 믿음'"(p126) …… "베이즈 규칙은 새로운 정보가 입수됐을 때 기존의 믿음을 어떻게 바꿔야 할지 알려준다."(p133) …… "베이즈 정리는 정보가 증가함에 따라 확률이 변해가는 과정을 조건부 확률을 이용하여 묘사해 준다. 새로운 경험과 새로운 정보는 확률을 계산할 때 새로운 조건을 가져다 준다. 새로운 조건하에서 원하는 사건의 확률을 업데이트할 때 베이즈 정리를 사용한다."(p206) - 닉 폴슨 · 제임스 스콧, 「수학의 쓸모」 중, 더퀘스트, 2020.