인공지능이 놀라운 속도로 수준급의 결과물을 쏟아낼 때 그 분야(바둑, 과학, 문학, 음악)의 본질과 가치는 어떻게 바뀌는지, 그 분야 종사자의 정체성과 자부심은 과연 유지될 수 있는지가 더 긴급하고 흥미로운 질문으로 떠오르고 있다. - P10
"인공지능"이란 학습, 추론, 지각, 판단, 언어의 이해 등 인간이 가진 지적 능력을 전자적 방법으로 구현한 것을 말한다. - P15
"인공지능시스템"이란 다양한 수준의 자율성과 적응성을 가지고 주어진 목표를 위하여 실제 및 가상환경에 영향을 미치는 예측, 추천, 결정 등의 결과물을 추론하는 인공지능 기반 시스템을 말한다. - P15
"고영향 인공지능"이란 사람의 생명, 신체의 안전 및 기본권에 중대한 영향을 미치거나 위험을 초래할 우려가 있는 인공지능시스템 - P15
"생성형 인공지능"이란 입력한 데이터의 구조와 특성을 모방하여 글, 소리, 그림, 영상, 그 밖의 다양한 결과물을 생성하는 인공지능시스템 - P15
초반을 빠르게 두고 어느 정도 시점부터 생각을 하기 시작해요. - P20
AI가 나오면서 저는 프로들 실력이 상향평준화될 줄 알았어요. 실제로는 그렇지가 않았습니다. 차이가 확고합니다. 양극화가 됐네요. AI를 이해할 수 있는 상위 랭커들은 더 올라갔고, 그렇지 못한 경우에는 가만히 있으니까 차이가 벌어졌죠. 일반기사들은 활용을 못 해요. - P21
격차가 벌어지는 거죠. AI를 활용할 수 있는 사람과 그렇지 못한 사람 사이에요. - P21
어떤 프로젝트는 하다 보면 자연스럽게 룰이 생깁니다. 다른 분야들은 바둑처럼 한정적인 상황이 아니라고 했지만 사실 한정적입니다. 그럼 어떻게 될까요? AI가 무시무시하게 강력해지겠죠. - P22
인간이 절대적 기준이 될 수는 없었어요. 하지만 이제 인공지능이 ‘바둑의 신‘, ‘절대자‘가 되어버렸네요. - P23
AI와 협업을 해서 최소한 바둑에서만큼은 사고력 자체가 올라가는 것을 경험할 가능성도 있다고 봅니다. 너무 어려운 일이긴 합니다만, AI를 통해서 우리가 상상하지 못하는 정도까지 올라갈 수 있지 않을까, 한번 기대는 해볼 수 있는 거죠. 저는 기사들이 ‘새로운 미학의 탄생‘을 위해 노력하고 있다고 생각합니다. - P28
‘인간의 바둑을 두겠다‘, ‘나만의 바둑을 두겠다‘ 그러면 판판이 깨지는 거예요. AI바둑 프로그램이 널리 퍼졌을 때 두 부류가 있었습니다. 끝까지 AI를 안 하겠다는 사람과 ‘결국은 해야 하겠구나‘ 하며 돌아선 사람. 빨리 돌아선 사람은 실력을 회복하고 상위 랭킹을 유지할 수 있었지만 뒤늦게 AI를 수용한 기사들은 상위권으로 못 돌아오는 경우도 꽤 있었어요. - P29
SF 영화 속 슈퍼 히어로가 될 수도 있지만 잘못하면 부작용도 분명히 있을 겁니다. - P32
‘인간적인 실수‘라는 것은 시간이 한정적일 때 많이 나오지 않습니까? - P32
기존의 것들이 가졌던 의미가 사라졌는데, 그러다 보면 또 새로운 뭔가가 생기지 않습니까? - P34
단백질은 주요 생체분자로서, 단백질 구조에 대한 연구는 생명 현상을 이해하기 위해 매우 근본적이고 중요한 문제입니다. 우리 몸이든 식물이든 동물이든 기초 단위는 분자이고, 분자들이 모여서 특정한 활동을 함으로써 생명 현상이 일어나니까요. 생체 분자들이 특정한 활동을 하기 위해서는 특정한 구조를 가진다는 것이 잘 알려져 있습니다. - P39
과학은 자연의 법칙을 찾아가는 동시에 그 법칙을 만족하는 솔루션을 찾아야 하는 두 가지 문제가 있어서 - P40
복잡한 생명체가 스무 개의 아미노산으로 이루어진 단백질로 구성된다고 할 때, 스무 가지 아미노산에는 다 역할이 있거든요. 어떤 건 잘 꺾이게 만들고, 어떤 건 서로 잘 붙게 하고, 어떤 건 안쪽으로 들어가려고 하고, 어떤 건 바깥으로 나오려고 하고요. 크기도 유연성도 다르고요. 완전히 무작위로 접히는 건 아니에요. 그러니까 기본적인 원리는 그렇게까지 복잡하지는 않다는 거고, 이러한 개념이 AI 개발에 중요하죠. - P42
우리가 가진 데이터 안에 이미 해답에 가까운 정보가 들어있다고 보고, 그걸 어떻게 끌어낼 것인가에 집중 - P44
기존의 틀에 갇히지 않고, 데이터 속에 담긴 신호를 최대한 활용하겠다는 식의 과학적 통찰이 적용됐을 때, 비로소 돌파구가 열린 것 같아요. - P44
AI를 흔히 ‘블랙박스‘라고 부르는데, 알파폴드1과 2는 블랙박스 안의 구조가 완전히 다릅니다. 간단히 말하면 1은 ‘합성곱 신경망‘(CNN)에 가까웠고, 2는 ‘트랜스포머‘에 가까운 구조를 사용했죠. - P46
단백질은 길게 이어진 복잡한 분자이지만, 기본적인 골격은 일정해요. 여기서 라이너스 폴링(Linus Pauling)을 생각해 볼 수 있는데, 그분이 화학 결합을 이해한 걸 바탕으로 단백질의 2차 구조, 그러니까 알파 헬릭스나 베타 시트 같은 기본 골격 구조를 실험으로 구조를 보기 전에 이미 예측했거든요. - P43
실제 단백질에서는 멀리 떨어져 있는 아미노산끼리도 서로 끌어당기거나 밀어내는 힘을 작용시킬 수 있어요. 이런 장거리 상호작용이 구조형성에 결정적인 역할을 하죠. 알파폴드2는 이런 생물학적·화학적 상호작용을 더 잘 반영할 수 있도록 신경망 자체를 설계했습니다. - P46
문제의 성격에 맞게 수학적·구조적 표현 방식을 바꾼 것이 결정적이었다 - P46
알파폴드2를 보면서 느낀 건, 문제의 본질을 반영한 신경망 아키텍처를 잘 설계하면 상대적으로 적은 데이터로도 현상의 핵심을 포착할 수 있고, 매우 높은 수준의 예측이 가능하다는 점이었습니다. - P47
언어 모델은 기본적으로 언어 데이터를 학습한 시스템입니다. 언어는 본질적으로 확률적이어서, 상황에 따라 표현이 달라질 수 있고 정답도 하나로 고정되지 않는 경우가 많죠. 하지만 과학은 다릅니다. 자연 법칙은 훨씬 강한 제약을 갖습니다. 예를 들어 보통의 단백질은 특정한 3차원 구조를 가져야만 기능할 수 있어요. 즉, 과학은 확률적 언어의 세계와는 다른, 엄격한 물리적·수학적 제약 아래 작동하는 영역입니다. - P48
텍스트, 이미지, 음성 등을 통합하는 멀티모달 AI - P48
자연과학은 대상이 ‘자연‘입니다. 어디가 끝인지, 도달해야 할 경계가 어디인지조차 명확하지 않은 ‘신의 영역‘이죠. - P49
여러 분야의 관련된 데이터들은 어떻게 보면 서로 원리가 통하는 것들이잖아요. - P50
이전까지는 사람이 도구로서의 역할을 많이 했지만 이제는 사람이 판단을 하기 위해 융합적인 능력을 가지고 있어야 하는 거죠. 그래서 기존 방식으로 모든 디테일을 학습해야 할 필요는 없겠지만, 앞으로 사람이 배워야하는 것이 오히려 더 많아질 것 같아요. - P50
바둑, 음악 등은 인간의 수준에서 평가할 수 있는 분야들이고 과학은 미지의 세계를 탐구하는 활동이라 좀 다르다고 생각합니다. 과학은 어떤 정해진 대상을 놓고 인간이 AI와 경쟁하는 것이 아니고, 크게 열려 있는 어떤 영역을 탐구하기 위해 인간이 AI라는 도구와 협력하는 것으로 보고 있어요. - P51
‘과학AI‘는 언어 모델이 아니라는 인식이 중요합니다. - P51
AI는 우리가 생물학·화학·물리학 등으로 나누어 따로따로 다루던 문제들을 하나의 틀 안에서 다루게 해줍니다. 자연은 나뉘어 존재하지 않는데 우리의 연구 도구가 제한적이어서 대상을 분절해 다뤄왔다고 할 수 있죠. 데이터 기반 AI는 이런 제약을 넘어 현상을 통합적으로 바라보고 근본 원리에 더 가까이 접근하게 해주는 도구입니다. - P52
언어 모델처럼 비정형적이고 다양한 지식을 다룰 수 있는 AI는 여러 모달리티를 결합할 수 있습니다. 분자 수준을 넘어 세포, 더 나아가 가상 세포나 디지털 트윈 휴먼 같은 복합 시스템까지 연결해 다룰 수 있는 가능성이 열리고 있습니다. 서로 다른 영역을 자연스럽게 묶을 수 있다는 점이 중요합니다. - P52
에이전틱 AI의 등장은 또 다른 수준의 융합을 가능하게 합니다. 서로 다른 AI 시스템과 로봇 등을 연결해 협력적으로 문제를 해결하는 구조가 만들어지고 있습니다. - P52
다른 학문들은 실험을 자신이 원하는 방식으로 통제할 수 있잖아요. 그런데 천문학은 그런 실험을 할 수 있는 학문이 아니죠. 순수하게 수동적인 관측에 의존할 수밖에 없습니다. 즉, 하늘에서 흥미로운 현상이 발견이 되거나 아니면 흥미로운 현상이 있을 거라고 추정이 되는 영역을 집중적으로 관측을 하거나 그러한 방식으로 천문학의 발전이 이루어져왔어요. - P57
천문학의 역사는 원래 그런 ‘예기치 않은 이상 현상‘의 우연한 발견을 통해 발전해 왔으니까요. 가장 대표적인 예가 우주배경복사의 발견입니다. 원래는 전파망원경의 잡음인 줄 알았던 신호가 알고 보니 우주의 기원을 설명하는 열쇠였고, 이를 통해 빅뱅 이론이 정설이 되었죠. 감마선 폭발체도 마찬가지입니다. 냉전 시대에 지구의 핵실험을 감시하기 위해 띄운 위성이 우연히 우주에서 번쩍이는 감마선을 포착했습니다. 이 현상을 설명하기 위해 수백 개의 이론이 난립하다가, 20세기 말이 되어서야 무거운 별이 붕괴할 때 생기는 현상임이 밝혀졌습니다. - P62
천체 현상의 깊은 내용을 알기 위해서는 제임스 웹 우주망원경(JWST)이나 알마(ALMA) 같은 고성능 장비가 필요합니다. - P63
알마는 수십 개의 전파 망원경을 연결해 고해상도 이미지를 얻는 시스템인데, 이런 장비들은 워낙 비싸고 운영 비용이 많이 들어서 우주 전체를 훑는 빅 서베이를 할 수가 없습니다. 특정 타깃을 정해 집중적으로 관측해야 하죠. - P64
결국 빅데이터의 진짜 역할은 천문학자들에게 선택지를 주는 것입니다. "수많은 데이터 중에서 제임스 웹이나 알마 등과 같은 고성능 관측장비를 이용해 어디를 집중적으로 볼 것인가?"를 선별해 주는 것이죠. 따라서 다음 세대 천문학자들에게는 빅데이터를 다루는 기술뿐만 아니라, 다시 기본으로 돌아가서 자신이 무엇을 관측하고 싶은지, 어떤 타깃이 중요한지를 판단할 수 있는 물리학적·천문학적 기본기가 훨씬 중요해질 것입니다. - P64
‘빅데이터‘보다 본질을 꿰뚫는 ‘딥 데이터‘(deep data)가 필요하다 - P64
"큰 팀은 축적하고(accumulate), 작은 팀은 혁신한다(innovate)" - P67
앞으로의 천문학도는 머신러닝과 통계학 언어를 습득하는 것은 필수겠지만, 더 중요한 것은 빅데이터와 시뮬레이션이 가진 본질적인 한계와 편향(bias)을 꿰뚫어 볼 수 있는 통찰력입니다. 데이터가 어떤 기기의 한계 속에서 만들어졌는지, 시뮬레이션의 파라미터가 어떤 가정하에 설정되었는지 모른 채 AI가 내놓은 결과를 맹신하면 잘못된 해석에 빠지기 쉽습니다. - P68
단순히 기술적 숙련을 넘어, 학생 때부터 마치 교수(PI)처럼 큰 틀에서 생각하는 훈련이 필요합니다. "AI가 방법은 찾아주겠지만, 나는 어떤 과학적 문제를 풀고 싶은가?"라는 질문을 던질 수 있어야 합니다. - P68
방법론자가 되어서도 안 되지만, 방법론을 모르면 과학을 할 수 없는 딜레마 - P68
바둑 수는 최선의 수(정답)는 존재하지만 많은 경우 AI도 찾아내기 어려우니 이길 확률이 높은 수를 선택합니다. 그런데 수학은 맞을 확률이 높은 것을 선택하는 게 아니라, 반드시 맞는 것을 선택해야 하는 것이죠. 그런 면에서 창의성이 중요하고 어떤 것이 맞을 것이라고 생각했을 때 그것을 증명하기 위해서 온갖 기발하고 창의적인 아이디어들이 총동원됩니다. - P77
언어 모델이라는 건 다음에 올 단어로 가장 확률 높은 것을 찾는 것인데, 수학은 그런 과정이 아니거든요. 다음에 오는 단어나 식이 필연적이어야 되거든요. 그 차이가 있습니다. - P85
|