기계는 왜 학습하는가 - AI를 움직이는 우아한 수학
아닐 아난타스와미 지음, 노승영 옮김 / 까치 / 2025년 2월
평점 :
장바구니담기


*본 포스팅은 출판사로부터 도서를 제공받아 주관적으로 작성한 리뷰입니다.

이번에 인공지능의 학습과 그 이면에 있는 수학적인 배경에 대해서 역사적인 순서로 흥미롭게 이야기 해 주는 신간을 읽을 기회가 있었다. 아닐 아난타와미의 <기계는 왜 학습하는가>였다. 인공지능의 수학적 배경을 올바르게 인식하는 것은 인공지능에 대한 맹목적인 맹신을 막고 인공지능의 한계는 무엇인지 등 에 대해서 확실한 인사이트를 가질 수 있을 것이다. 인공지능의 수학적 배경에 대해 궁금한 것이 많은데, 저자의 혜안을 들여다 보고 싶다.

생성형 AI는 기존에 빅데이터를 통해 학습된 텍스트 및 이미지, 동영상 등의 지식을 분석하고, 예측하는 등 기존에 지정된 답만을 찾아내던 인공지능에서 좀 더 복잡도가 높은 지식 간의 연관 관계를 이해하고 요약하며 답을 찾아 낼 수 있다. 뿐만 아니라 생성형 AI는 창의적인 영역까지 더해져서 사람처럼 느껴질 정도의 언어적인 지능과 다양한 멀티 모달로 들어오는 정보들을 분석하고 해석하는 능력을 갖추고 있다. 그리하여 이 생성형 인공지능 AI의 응용분야는 마케팅, 기획, 전략, 비즈니스 관련 콘텐츠나 이메일 작성도 가능하며, 긴 글에 대한 요약문이나 제목 등 을 작성하고, 소설, 시, 노랫말 등 창작도 가능하다. 다양한 프로그래밍 언어로 코딩할 수 있고, 텍스트 설명을 통해서 이미지와 동영상 등을 만들어 내기도 하며, 이미지에 대한 질문을 분석하고 설명하는 것도 가능하다. 그러면 이들이 가능하게 끔 하는 수학적 이론의 원리는 무엇일까?

인공 지능의 역사를 보면 그 부침이 많고 그 활용 측면에서도 활용도가 높은 분야가 있는 반면 아직까지는 그 이론 및 정확도 측면에서 개선의 여지가 많은 분야도 있다. 2차 세계대전이 한창일때, 영국의 천재 수학자인 튜링에 의해서 제시된 인공지능 기계의 탄생, 튜링테스트 제시(기계가 인간과 구별할 수 없는 지능적인 행동을 보일 수 있 는지를 결정하는 기준), 전문가 시스템의 개발, 패턴인식 알고리즘 개발 등이 초기 인공 지능의 역사 할 수 있다.

로지스틱 회귀와 분류 문제를 해결하기 위한 통계적 방법은 인공지능의 초기 로직이었다. 예를 들어 은행이 대출 승인 여부를 결정하는 데 사용될 수 있으며, 여러 변수를 고려하여 확률을 추정한다. 인공지능의 기본이 되는 원리로 다 변수에 대한 분류 문제로 생각할 수 있다. 인공지능이 연습을 할 Training 데이터의 량이 중요하다. 기계학습 에서의 XOR 문제 및 해결 XOR 문제는 선형 분류기만으로는 해결할 수 없는 문제이다. 이를 해결하기 위해 다중 퍼센트론과 같은 비선형 모델이 사용되며, 이는 기계학습의 발전에 중요한 이정표가 되었다. 인공지능의 수학적 배경이 확률과 통계를 기반으로 하기 때문에, 우리가 고등학교 때 배운 베이즈 이론은 중요한 컨셉이다. 베이즈 이론은 확률에서 가장 기본이 되는 이론으로 조건부 확률 계산에서 계산하기 어려운 확률 변수를 계산하기 쉬운 확 률변수로 치환하여 대등한 관계를 만들어 얻고자 하는 최종확률을 얻는 이론이다. 현대 확률 이론의 기반이 되는 이론이라고 할 수 있다.

이후 인공지능은 머신러닝(Machine Learning)으로 발전하고 신경망 알고리즘의 개발로 또 한번의 도약을 한다. 이 후 머신러닝의 한계(XOR 논리 오류..등등)로 침체기를 격고 이후에 인공지능의 아버지라 이야기되기도 하는 제프리 힌튼 등에 의한 역전파 알고리즘(Backpropagation Algorithm)의 개발은 인공지능의 신경망 개발에 획기적인 도약이 이루어 진다. 이후, 인공지능은 Vision을 가지게 됨으로써 획기적인 발전을 하게 된다. 인공지능은 특징 주출과 패턴 인식을 통해 개와 고양이 사진을 구분한다. 이는 신경망 심층 학습의 한 예로, 대량의 이미지 데이터에서 학습하여 각 동물의 특징을 인식하게 된다. 2000년대 초반부터 본격적인 연구가 시작된 것으로 어떻게 보면 컴퓨터에게 비젼(Vision)을 선사하게 하여 인공지능이 폭팔적으로 발전하게 된 계기가 되었다. 지구상에서 동물들이 빛을 인식하고 Vision을 가지게 됨에 따라 엄청난 진화를 한 것과 같은 맥락이라 할 수 있지 않을까...

인공지능의 DNN (Deep Neural Networks) 알고리즘이 컴퓨터에게 Vision을 주었다고 할 수 있을 것 같다. DNN은 인간의 뇌를 모방한 인공 신경망으로, 복잡한 비선형 관계를 모델링할 수 있다. 이는 음성 인식, 이미지 분류 등 다양한 분야에서 활용된다. 컴퓨터가 인간이 쓴 글자를 인식하는 원리를 쉽게 알 수 있다...입력부, 은익층, 출력부... 인공지능에서의 숫자 구분 원리 인공지능은 픽셀 패턴을 분석하여 숫자를 구분한다. 이 과정에서 합성곱 신경망(CNN)과 같은 알고리즘이 사용되어 각 숫자의 고유한 형태를 학습하는 것이다. 여기에 환경의 학습을 적용한 강화학습이론 (Reinforcement Learning)은 인공지능 분야의 영역을 확대하였으며, 현재의 생성형 인공지능의 시대에 이르게 되었다.

저자는 인공지능의 기본이 되는 수학적 이론 뿐만 아니라, 수학이 왜 여전히 중요하고 필요한지에 대해 깊이 있게 알려준다. 저자는 수학이 현실 세계의 복잡한 문제를 이해하고 해결하는 방법론임을 강조한다. 저자는 당신의 예 이 틀리는 수학적 이유를 기본적인 수학 이론을 통해 쉽게 알려준다. 어떻게 보면 데이터의 변동성과 인간의 비합리적인 행동은 예측의 정확성을 떨어뜨리는 주요 요인일 것이다. 저자는 이러한 한계를 극복하기 위해 수학적 사고가 필요함을 강조하며, 수학이 어떻게 더 나은 예측을 가능하게 하는지에 대해 쉬운 사례를 중심으로 설명해 준다. 어떻게 보면 인공지능의 기반이 되었던 수학 이론에 대해서 쉽고 흥미롭게 이야기 해 준다.

이 책은 수학의 역사와 수학 용어를 설명하는 것을 넘어, 인공지능이 작동하는 근본 원리를 이해하고, 과학적 사고를 통해 디지털 문명을 바라보는 새로운 시각을 제공한다 할 수 있을 것 같다.


댓글(0) 먼댓글(0) 좋아요(1)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo