확률로 바라본 수학적 일상 - 확률이 이끈 지성, 과학 그리고 인공지능의 세계
장톈룽 지음, 홍민경 옮김, 김지혜 감수 / 미디어숲 / 2025년 8월
평점 :
장바구니담기


이 리뷰는 컬처블룸을 통해 출판사에서 도서를 제공받아, 직접 읽고 작성한 리뷰입니다.


판돈 배분 문제, 확률론의 시작


주사위 던지기 게임 도중 게임을 중지할 경우 남은 판돈을 어떻게 나눌지 고민한 프랑스 귀족 드 메르의 질문은 확률론이라는 위대한 수학 이론의 씨앗이 되었다. 17세기, 블레즈 파스칼과 피에르 드 페르마는 이 '판돈 배분 문제'를 두고 서신을 교환했다. 그들은 기대라는 개념을 도입하여 남은 게임에서 각 플레이어가 이길 기댓값을 계산해냈고 남은 판돈을 어떻게 분배해야 가장 합리적인지 결론을 내렸다. 즉, 위대한 두 수학자는 미래의 불확실성을 수학적으로 예측하는 혁신적인 사고방식을 제시한 것이다. 훗날 확률론의 탄생일을 파스칼과 페르마가 서신을 주고받기 시작한 날로 했다니 참으로 그들의 업적을 기리기에 부족함이 없는 결정이다. 도박 문제에서 시작해 인류의 지식 체계를 확장한 그들의 능력이 정말 놀랍고 감탄스러웠다.​


이처럼 과거 도박의 판돈 문제에서 시작된 확률은, 오늘날 인공지능이 세상을 학습하는 핵심 원리에 이르기까지 우리 삶의 거의 모든 분야에 깊숙이 자리 잡고 있다. 이론물리학 박사이자 중국의 대표적인 과학 교양 작가인 저자 장톈룽의 [확률로 바라본 수학적 일상] 책을 통해 바로 이 확률의 놀라운 여정을 들여다보았다.


수상한 데이터의 첫 숫자, 벤포드 법칙


저자는 확률이 가진 놀라운 힘을 보여주는 사례로 데이터 조작을 감지하는 벤포드 법칙에 대해 설명하였다. 이 법칙은 현실 세계의 다양한 데이터에서 첫 자리가 특정 확률(1이 약 30%, 2가 약 17% 등)로 나타난다는 것을 수학적으로 증명한다. 따라서 이 확률 분포를 벗어난 데이터는 조작되었을 가능성이 높기 때문에, 벤포드 법칙은 실제로 회계 부정이나 탈세 혐의 등을 조사할 때 유용하게 사용된다고 한다. 확률의 규칙이 수많은 데이터를 감시하는 강력한 도구가 된다는 사실이 매우 흥미로웠다. 


여섯 단계의 연결, 세상은 생각보다 좁다


십수 년 전, 서프라이즈라는 TV 프로그램에서 접했던 ‘케빈 베이컨 게임’을 아직 기억하고 있다. 이 게임은 할리우드 배우 케빈 베이컨이 다른 배우들과 얼마나 가깝게 연결되어 있는지를 나타내는 ‘베이컨 넘버’를 겨루는 방식으로, 어떤 사람도 6단계를 넘지 않는다는 사실이 놀랍고 신기했다. 당시에는 그저 재미있는 게임으로만 생각했는데, 책을 통해 이것이 수학적 원리에 기반한 현상이라는 것을 자세히 알게 되어 매우 흥미롭게 읽을 수 있었다.


이 책에서는 이 게임의 개념을 그래프 이론의 ‘지름'이라는 수학적 개념으로 풀어낸다. 지구상의 임의의 두 사람은 평균적으로 여섯 단계만 거치면 모두 연결될 수 있다는 ‘6단계 분리 이론’이 바로 그것이다. 이처럼 수학적으로 계산된 네트워크의 지름을 통해 우리는 세상이 생각보다 훨씬 더 긴밀하게 연결되어 있음을 알 수 있다. 복잡해 보이는 인간 관계망 속에서 정보가 빠르게 퍼져나가는 이유도 이 ‘좁은 세상’ 네트워크의 특성 때문이다. 2016년 페이스북 자료에 따르면 현재의 네트워크 지름은 3.57로 추정된다고 하니, 우리의 연결망은 이제 여섯 다리가 아니라, 세 다리로 좁혀지고 있는지도 모른다. 이처럼 우리는 모두 서로에게 닿을 수 있는 가까운 이웃이라는 사실이 새삼 놀랍고 흥미롭게 다가온다. 동시에, 우리가 던지는 작은 메시지나 행동이 생각보다 훨씬 더 멀리, 빠르게 퍼져나갈 수 있겠다는 걱정이 들기도 했다. 


확률론과 베이즈의 승리: ChatGPT


저자는 ChatGPT에 대해 확률론과 베이즈의 승리라고 표현하며 책을 마무리한다. ChatGPT는 방대한 양의 텍스트 데이터를 학습하여 다음에 나올 단어가 무엇일지를 확률적으로 예측하고, 가장 가능성이 높은 단어를 선택하여 문장을 완성해 나간다. 이는 마치 무작위로 주사위를 던지는 것처럼 보이지만, 사실은 수많은 단어의 조합 중에서 가장 자연스럽고 문맥에 맞는 '확률'을 찾아내는 과정이다. 예를 들어, 가을바람이라는 텍스트가 주어졌을 때, 다음에 올 텍스트로 불다, 따뜻하다, 찾아오다 등이 올 수 있는데 그 중 확률이 가장 높은 따뜻하다를 선택하게 되는 것이다. 이처럼 ChatGPT는 모든 가능한 단어에 확률을 부여하고, 그중 가장 높은 확률을 가진 단어를 선택하여 문장을 생성한다.


여기서 베이즈 정리의 개념이 중요하게 작용한다. 베이즈 정리는 새로운 정보를 통해 기존의 확률을 업데이트하는 방법이다. ChatGPT는 단순한 단어 예측을 넘어, 사용자와의 대화 맥락(새로운 정보)을 지속적으로 반영하며 답변을 생성한다. 결론적으로, ChatGPT는 엄청난 양의 데이터를 통해 언어의 통계적 규칙과 패턴을 학습하고, 확률과 베이즈 정리를 통해 가장 적절한 답변을 생성해 내는 예측 기계라고 할 수 있다. 불확실성 속에서 최적의 해답을 찾아내는 이 기술의 발전은 놀라움을 넘어 경이롭기까지 하다. 우리에게 확률의 중요성을 다시 한번 상기시켜주는 대목이었다.


책을 읽고 난 후


[확률로 바라본 수학적 일상]은 확률이 단순한 수학 문제를 넘어, 우리 삶의 모든 현상에 숨 쉬고 있음을 보여주었다. 도박 판돈 문제부터 인공지능에 이르기까지, 세상을 움직이는 보이지 않는 원리 중의 하나가 확률이라는 것을 깨달을 수 있었다. 이 책 덕분에 복잡하고 예측 불가능해 보이는 세상도 결국은 확률이라는 논리적 틀 안에서 이해하고 예측할 수 있다는 생각을 하게 되었다. 

마지막으로 서포트 벡터머신, 신경망, 딥러닝 등의 개념이 나오기도 하고, 인공지능의 역사에 대해 설명하는 부분도 있어서, 컴퓨터공학을 전공하는 대학생, 또는 전공을 원하는 고등학생들에게 꼭 읽어보라고 권유하고 싶다.  


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo