<한국통계학회소식지>가 '종이 조각들'에서 책으로 모양을 크게 바꾸면서 소식지 안에 'people' 코너를 만들었다. <소식지> 편집위원장의 의뢰에 따라 그 가운데 통계학의 역사에 등장하는 인물에 대한 짧다란 글을 하나 쓰게 되었다. 2006년 10월호 7-10 쪽에 실린 글이다. [조재근 comment]



통계학사 인물 읽기 1
- 칼 피어슨

조 재 근 (경성대학교)



<한국통계학회 소식지> 편집위원장님 말씀에 따르면, 편집진에서는 통계학의 역사에 큰 발자국을 남긴 인물들을 소식지에 연재 형식으로 소개할 구상을 가지고 있다고 한다. 인물 중심이든 획기적인 연구나 사건 중심이든 소식지 지면에서 통계학사에 대한 글을 만나게 될지도 모른다니, 통계학사에 관심을 가진 사람으로서 매우 반가운 일이다.


그런데, 그 코너에 처음으로 글을 쓰게 된 노릇은 아무래도 당황스러울 뿐이다. 통계학사와 필자의 인연이래야 겨우 책을 하나 번역한 정도에 머문다. 그럼에도 불구하고 말 그대로 만용을 부려 거칠고 서툰 글로 첫 소식지 한 구석을 어지럽히게 되었으니, 그저 차후에 부디 깊고 넓은 식견을 갖춘 분이 이 코너를 좋은 글로 채워주시기 바랄 따름이다.


글을 어떤 방향에서 쓸지 필자의 소견을 먼저 밝혀두자. 이 글을 읽는 학회회원들은 대체적으로 수리통계학을 중심으로 통계학을 공부하고 가르치는 분들일 것이다. 그렇다면 회원들이 교과서나 논문에 흔히 등장하는 인물들이나 연구들을 통계학 바깥에서 살필 기회는 다소 드물었을 것 같다. 따라서 여기서는 인물과 연구들을 교과서와 논문 밖으로 나오게 하여 그들을 시대적, 사회적 배경 속에 두고 조금 다면적으로 스케치해보는 기회를 가져보았으면 싶다. 이번 글에서 살펴볼 인물로 고른 사람은 칼 피어슨이다. 그를 택한 이유는 피어슨이 통계학의 founding father라고 일컬어지는 인물 중의 한 사람이면서 시대적으로 가장 앞서기 때문이다.


 



1. 네이먼,
피어슨을 만나다


1916년 봄, 스물두 살의 폴란드계 청년 네이먼은 동유럽에서 가장 오래된 대학 중 하나인 우크라이나 카르코프대학에서 공부하고 있었다. 당시 그는 르벡의 적분과 측도이론을 공부하는 한편, 젊은 유대인 강사에게서 확률론도 배우고 있었는데 훗날 다항식과 부등식으로 교과서에 이름을 남기게 될 그 강사의 이름은 Sergei Natanovich Bernstein이었다. 어느 날 그 강사가 권유한 책을 읽고 네이먼은 큰 충격을 받게 된다. 그가 읽은 책은 러시아어로 번역된 책이었는데 원래는 영어로 씌어진 것으로서 The Grammar of Science라는 제목이 붙어있었고 네이먼이 한 번도 이름을 들어보지 못한 사람이 쓴 것이었다. 그 책은 “한 치도 타협하지 않는 방식으로 기존의 권위라는 권위를 모조리 공격하고” 있었는데, 네이먼으로서는 그때까지 과학에 대해 쓴 것 가운데 그처럼 과격한 내용을 대담하게 쓴 책은 구경조차 할 수 없었던 것이다. 분명 날조라고 밖에 볼 수 없는 내용을 책이라고 낸 자는 마땅히 상당히 스케일이 큰 불한당일 텐데 그 불한당의 이름은 칼 피어슨이라고 적혀있었다.


약 10년 후, 네이먼은 런던으로 가서 그 불한당을 직접 만나게 된다. 그런데 그때쯤에는 이미 ‘과학이란 explanation이 아니라 description’이며 ‘과학 이론이란 단지 하나의 model일 뿐’이라는 The Grammar of Science의 주장은 네이먼의 사고 틀로 자리잡고 있었으며, 칼 피어슨이 있는 University College London(UCL)은 꼭 가서 연구하고 싶은 통계학의 성지가 되어있었다. 또한 피어슨이 편집하는 Biometrika는 네이먼이 목마르게 읽고 싶어하는 학술지가 되어있었으며, 피어슨이라는 이름은 네이먼에게 거의 통계학의 신과 같은 존재가 되어있었다.


그런데 1925년 가을 어렵사리 영국에 건너갔던 네이먼은 채 1년도 지나지 않아 실망만 안고서 영국을 떠나게 된다. 수학적으로 깊이 있는 통계학 연구의 최고봉일 것이라고 믿었던 UCL의 수학 수준은 네이먼이 보기에 기대 이하로 보였으며, 세계 유일의 통계학 교수이자 Biometrika의 종신 편집자인 피어슨은 그러한 권위를 터무니없을 만큼 부당하게 휘두르는 고압적인 노인으로 보였던 것이다. 결국 네이먼이 만난 피어슨은 이미 십 년 전 그를 놀라게 했던 The Grammar of Science의 지은이, 그 이상도 이하도 아니었다. 사실 네이먼이 피어슨을 만난 1925-26년의 시기는 영국 통계학을 선두에서 이끌어가는 지위가 이미 1922년을 전후한 무렵에 피어슨에게서 피셔에게로 넘어가고 난 이후였던 것이다.

 




2. 레닌,
피어슨을 읽다


수학적인 능력으로 굳이 비교한다면 피어슨은 30여 살 아래인 피셔나 네이먼에 뒤진다고 평가된다. 더구나 피셔의 경우, 통계학적 개념이나 이론을 세울 때 앞 시대 통계학자들의 어깨에 올라설 필요조차 없었을 정도로 대단히 보기 드문 천재성을 갖고 있었다. 피어슨이 노년기에 접어든 이후와 죽고 난 뒤, 피셔가 피어슨에게 퍼부은 맹렬한 비난은 피셔의 실력과 천재성 덕분에 더욱 힘을 얻게 되었고 20세기 초반에 피어슨이 누렸던 명성과 권위는 빠르게 퇴색해 갈 수 밖에 없었다. 게다가 correlation coefficient, multiple correlation coefficient, contingency table, chi-square, coefficient of variation, goodness of fit, histogram, homoscedastic, skewness, kurtosis, weighted least squares, mode, moment, random sampling, standard deviation, truncation 등 그가 처음으로 이름 붙여 준 용어들이 너무 잘 알려진 결과, 그것들을 새삼스레 피어슨의 이름과 결부시키기도 어렵게 되어 버렸다. 그리고 그가 심혈을 기울여 만든 ‘곡선족(family of curves)’은 어느 틈에 통계학 교과서에서 물러나 통계학 박물관 속에 갇히게 되었다. 게다가 피어슨을 생물측정학(biometry)의 창시자라고 흔히 말할 때, 그 속에는 유전과 진화에 대한 그릇된 관념을 가지고 생물학자들과 길고 치열한 논쟁을 벌인 결과, 초기 유전학의 발달을 더디게 만들었다는 비난과 조소의 뜻이 담기게 되었다. 그러므로 한때 통계학 세계에서는 단연 으뜸가는 명성을 누렸던 피어슨은 20세기 중, 후반에 이미 돌이켜 거론할 필요조차 없는 이름으로 전락하고 만 것이다. 학문이라는 것이 사다리 오르듯 단선적으로 항상 새롭고 향상된 방향으로 진보만 거듭할 따름이라고 믿는 사람에게는 특히 그러했을 것이다.


이 짧은 글에서 피어슨을 다시 거론하는 것은 그를 되살리기 위해서가 아니다. 대신 약 80년에 걸친 그의 생애를 훑어보다 보면 몇 가지 질문이 떠오르기도 하는데, 어찌 보면 통계학이라는 학문의 정체성(identity)에 닿아있는 듯 보이기도 하는 그 질문들의 무게를 잠시 생각해보려는 것이다. 물론 그 질문들에 대한 답을 제시하기에 이 글이 적절한 자리도 아니고 필자의 역량이 그런 질문에 답을 내놓을 정도에는 한참 못 미치므로, 여기서는 그저 두어 가지 질문들을 제시하는데 그칠 뿐이다.


피어슨은 1857년 생이다. 그가 태어난 지 2년 후에 다윈이 <종의 기원>을 발표하였으니 피어슨 세대는 다윈의 강력한 자장 속에서 젊은 시절을 보내게 되었을 것이다. 또한 마르크스의 <자본론> 제1권이 1867년에 나오는 등 사회주의 운동 역시 젊은 피어슨 세대가 외면하기 어려웠을 것이었다. 또한 그의 3,40대 시기는 60년도 넘는 영국 빅토리아 여왕 시대가 저물고, 말 그대로 모든 것이 술렁이던 fin de siècle, 즉 “세기말”이었다. 학문 세계 역시 큰 변화의 소용돌이 속으로 흘러가고 있었으니 뉴턴 이래 세상 모두를 법칙으로 설명할 수 있으리라는 전망을 유포시킴으로써 모든 학문의 모범이 되어왔던 물리학에서 양자역학과 같은 애매모호한 이야기들이 흘러나오기 시작하던 때가 바로 19세기 말이었다. 그런 와중에서 지금까지 이름조차 없었던 새로운 학문들이 우르르 생겨나 학문 분류체계까지 흔들어놓게 되었으니, 예컨대 사회학, 심리학, 인류학 등과 그때까지 ‘자연사’라고 두리뭉실하게 불리다가 분화해서 생긴 여러 학문 분야들이 그 대표적인 것들이었다. 피어슨이 살았던 시대적 배경은 대략 그러하였다.


통계학의 역사를 연구하는 어느 학자는 1857년에서 1936년에 걸친 피어슨의 생애를 크게 셋으로 나눈 바 있는데 그가 세 시기를 나누는 경계로 제시한 해는 1892년과 1922년이다. 1922년은 앞서 언급했듯 피어슨이 통계학계의 지배적인 지위에서 밀려난 시기이고 1892년이라는 해는 젊은 네이먼을 놀라게 했던 The Grammar of Science의 초판이 나온 해이다. 당시 30대 중반에 이른 피어슨은 한 사람으로서는 도저히 불가능해 보일 만큼이나 많은 분야(수학 이외에 법학, 독일 문학, 미술, 신학, 물리학, 철학 등)를 공부했을 뿐 아니라 사회주의 운동이나 여성의 사회적 지위 향상을 위한 활동, 그리고 우생학을 위한 활동, 여러 가지 강연, 엄청난 양의 글 쓰기에 이르기까지 대단히 활발한 사회 활동을 펼치고 있었다. 수학 교수였던 피어슨은 단지 수학 교수로서 뿐 아니라 과학철학자이자 다양한 사회 활동가로 널리 알려지게 되었으며 과학철학 책인 The Grammar of Science는 그러한 피어슨을 잘 보여주는 한 정점이었다. 이 책의 영향을 받은 사람은 네이먼 말고도 많았는데 특히 피어슨이 쓴 운동, 물질, 에너지에 대한 내용은 아인슈타인이 상대성이론을 만드는데 결정적인 영향을 준 것으로 알려져 있다. 뿐만 아니라 지금은 보기 힘든 난삽한 번역서들이 지난 8,90년대에 쏟아져 나왔을 때 <유물론과 경험비판론>(1908)에서 레닌이 The Grammar of Science에 나타난 피어슨의 철학적 입장을 몇 차례 언급한 것을 볼 수도 있었다. 또한 피어슨의 이 책은 초판이 나온 지 백여 년이 지난 지금도 Dover 출판사에서 계속 나오고 있다.


다른 한편, 1892년이 중요한 이유는 피어슨은 1892년 이전까지는 통계학에 대해 아무 것도 발표하지 않다가 그 다음해부터 통계학 논문을 발표하기 시작하여 이후 몇 십 년 동안 수학적인 통계학의 founding father 역할을 하였기 때문이다. 즉 1892년을 경계로 피어슨은 다양한 분야에서의 폭넓은 활동보다는 통계학이라는 하나의 분야로 초점을 모아가게 된 것이다. 통계학의 역사에서 피어슨의 앞에는 케틀레, 페히너, 그리고 골턴이 있다. 피어슨은 그들로 대표되는 19세기 통계학으로부터 전망과 더불어 한계를 읽어냈을 텐데, 그가 본 전망은 그가 젊은 시절에 접했던 어느 학문보다 뚜렷이 밝은 것이었으며, 그가 본 당대 통계학의 한계는 또한 다른 어떤 것보다 호기심과 의욕을 강하게 자극하는 것이었을 것이다.


우리가 여기서 갖게 되는 의문은 “그처럼 왕성한 지적 욕구를 가진 19세기 지식인이 폭넓은 지적 순례의 과정에서 과연 어떤 이유로 통계학이라는 지극히 변방의 분야에 정착하게 되었겠는가?”라는 문제이다. 과연 그는 정열을 쏟았던 허다한 일들을 모두 아무런 결과도 없이 덮어버리고, 혹은 모두 실패로 치부하고, 통계학이라는 한적한 골짜기로 숨어든 것이었을까? 아니면 그와 정반대로 숱한 일들을 하는 과정에서 얻은 경험과 학식들이 토대가 된 위에서 뚜렷이 지향할 목적을 세우게 되었고 그 목적 자체가, 혹은 그 목적으로 가는 길이 바로 통계학으로 통하는 길이었을까? 또한 The Grammar of Science와 같은 책에서 과학 원리에 대해 피어슨이 내세운 원리들이 그의 통계학 연구에 그대로 실현되었을까? 과연 피어슨이 생각한 통계학의 본질과 역할은 어떠한 것이었을까?


 



3. 왕립통계협회,
피어슨의 생일잔치를 준비하다

사실 피어슨이 통계학에 발을 내딛게 된 동기는 UCL의 동료 교수로서 동물학을 전공한 웰던, 그리고 나중에 피어슨이 전기를 쓰게 되는 골턴과의 교류가 중요한 계기가 되었는데 그들과의 교류는 1892년 무렵부터 시작되었고 그때부터 피어슨은 유전과 진화에 관련한 통계학 논문을 쓰기 시작하면서 통계학적인 방법의 역할을 강조하게 된다. 멘델주의를 둘러싸고 베이트슨과 치열한 논쟁을 벌인 사례라든가 Biometrika를 1901년에 만들어 죽기 직전까지 편집 작업을 한 것이 모두 그 연장이었다. 따라서 20세기 통계학의 역사는 초기 유전학의 역사와 상당 부분 겹치므로 골턴, 피어슨, 피셔에 대해 알아보려면 유전학을 건너뛰고 읽기 어렵다고 볼 수 있다.


여기서 우리가 조금 더 시야를 넓혀 보면, 19세기에서 20세기로 세기가 바뀌면서 통계학이라는 학문이 수학적인 엄밀함을 더하면서 비로소 학문의 세계에 진입하고 성장한 것은, 실험이나 관측 혹은 조사 데이터를 ‘과학적’으로 다루는 이론과 방법에 있어서의 일대 전환이라고 일컬을 만큼 중요한 변화였다. 이를 달리 표현하면 ‘올바른 지식이란 어떤 것인가’, 또한 ‘그러한 지식을 어떻게 얻을 것인가’라는 아주 오래된 주제, 즉 인식론 상의 큰 전환으로 볼 수도 있을 것이다. 결국 피어슨에 대해 살펴보면서 우리가 제기한 질문은 이러한 철학적 주제와 깊숙이 만나는 셈이다.


이처럼 통계학이라는 학문을 교과서나 논문에서보다는 조금 더 넓은 지평 위에 놓고 들여다 볼 수 있다는 점이 우리가 통계학의 역사를 살펴보는 이유 중 하나일 것이다. 그렇게 보면 피어슨처럼 구닥다리로 덮어두었던 통계학자들이, 상관계수나 카이제곱검정법 따위로만 치장된 신물 나는 얼굴 대신 수천 년 이어오던 학문의 큰 강물 속에서 원대한 포부와 고민을 지니고 길을 개척하던 모습으로 새롭게, 따라서 대단히 젊은 모습으로 우리 앞으로 걸어오기도 한다. 내년 2007년 봄, 영국 Royal Statistical Society에서는 영국 수학사학회 및 영국 과학사학회와 공동으로 Karl Pearson sesquicentenary conference, 즉 피어슨 탄생 150주년을 기념하는 컨퍼런스를 열 예정인데 그 날짜가 바로 피어슨이 태어난 3월 27일이라고 한다.


그런데 이처럼 피어슨이 기념되고 있는 반면 그에 대한 평전이 그가 1937년에 죽은 직후 이곤 피어슨이 자신의 아버지에 대한 평전을 쓴 이후 60년도 더 지난 2004년에야 처음으로 나왔다는 사실 (골턴의 평전은 이미 네댓 권에 이른다)은 뜻밖이다. 그나마도 과학사학자가 쓴 그 평전에는 통계학과 관련된 내용은 실망스러울 정도로 적다. 아마 피어슨은 통계학 전공자들이 자신과 자신의 시대에 대해 조금 더 관심을 가져주기를 기다리고 있는지도 모를 일이다.




 

최종수정일: 2006.11.13 [20:34]

210.110.162.12 - Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1)

 

 


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기