-
-
수학의 쓸모 - 불확실한 미래에서 보통 사람들도 답을 얻는 방법 ㅣ 쓸모 시리즈 1
닉 폴슨.제임스 스콧 지음, 노태복 옮김 / 더퀘스트 / 2020년 4월
평점 :
AI 시대, 우리에게 여전히 수학이 필요할까요?
네, 수학은 꼭 필요합니다.
<수학의 쓸모>는 우리에게 수학이 왜 필요한지, 일곱 가지의 이야기를 통해 들려줍니다.
우선 넷플릭스가 취향을 읽는 방법을 설명해줍니다.
일찌감치 넷플릭스는 가입자가 영상 콘텐츠를 어떻게 평가할지 알고리즘을 통해 예측하는 소프트웨어에 치중해왔고, AI를 이용하여 온라인 경제를 성공적으로 지배하고 있습니다. 가입자가 검색하지 않아도 알아서 추천해주는 넷플릭스의 방식이 점점 자연스럽게 받아들여지고 있습니다.
이러한 추천 엔진에는 수학의 조건부확률 개념이 들어가 있습니다. AI는 조건부확률을 개인화에 활용하여, 각자가 조건이 되는 사건에서 모은 대량의 데이터 집합으로부터 계산하여 개인별 맞춤 서비스를 가능하게 만들어줍니다.
두 번째는 패턴과 예측 규칙에 관한 이야기인데 수학적 개념보다 한 여성에 대한 이야기가 더 흥미롭습니다.
천문학자들은 우주가 얼마나 큰지, 안드로메다성운이 얼마나 멀리 있는지에 대한 답을 찾지 못했습니다. 그런 와중에 무명의 천문학자 헨리에타 레빗은 수백만 광년의 거리까지 잴 수 있는 새로운 예측 규칙을 찾아냈습니다. 주기를 알면 맥동변광성의 밝기를 예측할 수 있다는 것.
맥동변광성은 밝기가 시간에 따라 매우 규칙적으로 변하는 별을 뜻하는데, 이렇게 밝기가 변하는 이유는 숨 쉴 때 움직이는 폐처럼 별의 대기가 팽창하다가 수축하기 때문입니다. 레빗은 바로 맥동변광성과 관련된 데이터를 지속적으로 수집했고 그 데이터를 그래프로 그렸습니다. 레빗이 다룬 25개의 맥동변광성을 나타낸 1912년의 그래프를 보면 맥동 주기와 밝기의 관계를 나타내는 직선이 있습니다. 이 직선 덕분에 천문학자들은 이전에는 상상도 할 수 없을 만큼 멀리 있는 천체의 거리를 잴 수 있게 됐습니다. 그리고 별의 주기를 레빗의 공식에 집어넣어, 주기에 대응하는 진짜 밝기를 알아냈습니다. 레빗은 1912년 자신의 연구 결과를 고작 세 쪽짜리 논문에 발표했고, 다른 천문학자들은 재빨리 측정도구로 이용하기 시작했습니다.
에드윈 허블은 레빗의 예측 규칙을 염두에 두고서 나선형 성운에서 맥동변광성을 찾기 시작했고 마침내 중대한 발견을 했습니다. 안개 같은 얼룩, 즉 안드로메다성운 안에서 맥동변광성 하나를 찾아냈고, 레빗의 예측 규칙에 대입해 실제 밝기와 지구에서 안드로메다성운까지의 거리를 구했습니다. 그러니까 모든 천문학자에게 우주의 크기를 재는 방법을 알려준 사람은 바로 헨리에타 레빗입니다. 하지만 아무도 레빗이 응당 받아야 할 영예를 표하지 않았습니다. 2012년에 레빗의 발견 100주년은 세계의 주요 천문학 학술지에 표제조차 실리지 않았다고 합니다. 이럴수가!
'여자는 원래 수학이나 과학을 못해'라는 잘못된 편견과 이공계 분야의 여성 차별이 사라질 수 있도록, 우리 스스로 인식의 전환이 필요할 것 같습니다.
세 번째는 확률이 어떻게 달라지는지 알려준 베이즈 규칙이 나옵니다.
베이즈 규칙은 새로운 정보가 입수됐을 때 기존의 믿음을 어떻게 바꿔야 할지 알려줍니다. 사전확률을 사후확률로 바꿔주는 것으로 자율주행차의 운행 원리입니다. 베이즈 규칙에 따르면 올바른 사후확률은 언제나 자율주행차가 도로를 주행하는 방법과 똑같이 데이터를 사전확률과 결합해야만 얻어집니다. 그래서 매일 마주치는 데이터 홍수 속에서 베이즈 규칙을 활용하면 최선의 길을 찾을 수 있습니다.
네 번째는 컴퓨터의 통계와 알고리즘에 관한 이야기로, 컴퓨터 코딩의 여왕 그레이스 호퍼가 등장합니다.
미 해군 여성 예비군에 들어간 호퍼는 해군으로부터 미국 최초의 컴퓨터한테 가라는 명령을 받았고, 이를 완벽히 수행한 덕분에 영어로 컴퓨터에 말을 건 최초의 사람이 되었습니다. 호퍼는 영어로 입력할 수 있는 컴퓨터를 프로그래밍해야 한다고 결론 내렸고, 이로써 프로그래밍언어 혁명이 시작됐습니다.
2013년 12월에는 구글이 홈페이지 로고로 호퍼의 탄생 107주년을 기념했고, 2016년 11월에는 미국 대통령 자유훈장이 수여됐습니다. 그레이스 호퍼는 사람과 기계가 언어를 통해 가까워지게 만든 장본인이라는 점에서 오늘날 AI 시대를 살아가는 우리가 기억해야 할 인물입니다.
다섯 번째는 데이터의 변동성을 이야기합니다. 모든 곳에는 변동성이 있습니다.
AI 시스템이 보편화되면서 대량의 데이터 집합으로부터 이상을 찾으려면 변동성을 측정해야 합니다. 데이터 과학자들은 부정 거래에 반격을 가할 수 있는 AI 시스템 개발을 위해 고군분투하고 있습니다. 오랫동안 주요 은행들은 부정 거래를 찾아내려고 자사의 카드 거래를 실시간 분석해왔는데, 카드 거래가 새벽에 가끔 정지되는 것도 바로 그런 이유 때문이라고 합니다. 프로 스포츠 리그 팀들도 AI를 도입했는데, 이는 팀 셔츠에 광고를 도입한 것과 같은 이유입니다. 바로 큰 돈이 따라온다는 것. 머니볼은 작가 마이클 루이스가 지어낸 용어로 데이터를 바탕으로 스포츠팀을 육성하고 훈련시키는 특별한 방법을 가리킵니다. 디지털 시대가 가져온 변화라고 할 수 있습니다.
여섯 번째 잘 세운 가정의 힘을 이야기합니다. 오늘날의 알고리즘은 지시받은 내용만 수행할 뿐이지, 스스로 가정을 제안하고 검사하고 증명할 수 있는 알고리즘은 아직 발명되지 않았습니다. 결론적으로 똑똑한 기계를 잘 활용하려면 인간이 똑똑해야 한다는 겁니다. 영리한 AI가 존재한다 해도 가정이 덜 중요한 건 아닙니다. 오히려 가정이 더욱 중요합니다. 가정이 잘못되면 데이터로부터 너무나 벗어나게 추산할 위험성이 있습니다.
데이터 과학자들은 모형을 이용해 데이터로부터 통찰을 얻어내고 성공적인 AI 시스템을 제작합니다. 여기서 중요한 점은 모형 제작이 오직 사람만 할 수 있는 일이라는 사실입니다. 기계는 자신을 프로그래밍한 가정을 바탕으로 예측할 수 있지만, 그 가정을 점검할 수 없습니다. 또한 모형에 맞게 작업할 수 있지만, 그 모형을 이용해 올바른 질문을 던질 수는 없습니다. 고로 좋은 데이터 과학은 사람과 기계의 협력을 필요로 합니다. AI 시대에도 인간이 똑똑해야 하는 이유입니다.
일곱 번째는 다음 혁신이 일어날 공중 보건과 데이터 과학에 대해 이야기합니다.
나이팅게일이 남긴 의료 통계가 의료 시스템의 표준이 되었습니다. 오늘날 의료 서비스 시스템이 데이터를 이용하는 주된 방법은 체크리스트를 작성하는 것입니다. AI 관점에서 보자면 체크리스트는 단지 예측 규칙일 뿐이지 환자에게 어떤 일이 벌어질지 알려주지는 않습니다. 문제는 의사들이 데이터에 접근하고 이용하는 업무를 하기 어렵다는 겁니다. 의료 분야의 데이터 과학 혁신은 나이팅게일과 같은 단 한사람이 아니라 수천 명이 관여해야 할 과제라는 점에서 신중할 필요가 있습니다. 특히 개인의 건강 정보 프라이버시 문제는 보안 관련한 모든 우려가 확실히 해소되지 않았습니다. 데이터 프라이버시를 위해서는 보안을 최우선으로 한 시스템 구축이 절실합니다.
결국 이 책은 우리에게 수학이란 절대 포기해서는 안 되는 필수불가결의 영역임을 깨닫게 해줍니다.
