언젠가는 AGI에 대해서 책을 써야겠다는 생각을 훨씬 오래전, 가령 챗GPT가 처음 공개됐을 때 막연하게나마 했을 수도 있으니까요.
-알라딘 eBook <AGI, 천사인가 악마인가> (김대식 지음) 중에서 - P42
그보다 문맥적으로 얼마나 비슷한 단어인지에 집중해야 한다는 것입니다. 이 방법을 집중 스코어attention score라고 부릅니다.
-알라딘 eBook <AGI, 천사인가 악마인가> (김대식 지음) 중에서 - P45
여러 가지 계산 방법이 있고, 이를 제대로 표현하기 시작한 게 트랜스포머 알고리즘Transformer Algorithm입니다. 아마 챗GPT가 등장하고, 생성형 AI에 관심을 가지고 알아본 사람이라면 익숙한 단어일 겁니다. 트랜스포머는 챗GPT의 핵심입니다.
-알라딘 eBook <AGI, 천사인가 악마인가> (김대식 지음) 중에서 - P45
하지만 중요한 건 이렇게 언어를 학습하기 위해서는 정말 많은 예제, 데이터를 필요로 한다는 것입니다. 예를 들어, 한 작가의 문장만 학습시키면 그 작가의 스타일만 배우게 되니까 보편적인 언어 사용 패턴을 학습하지 못하겠지요. 우리가 원하는 건 보편적이고 범용적인 언어의 규칙입니다
-알라딘 eBook <AGI, 천사인가 악마인가> (김대식 지음) 중에서 - P46
단백질 구조를 학습해서 예측할 수도 있습니다. 그런데 더 중요한 건 조합 학습이 가능하다는 것입니다. 예를 들어 글과 그림을 동시에 학습시켰더니, 우리 인간은 그런 게 있는지도 몰랐는데, 글과 그림의 교집합 문법이 있다는 걸 알게 됐습니다. 우리는 그런 걸 한 번도 생각해 본 적 없었습니다
-알라딘 eBook <AGI, 천사인가 악마인가> (김대식 지음) 중에서 - P50
마찬가지로, DNA 구조와 단백질 구조를 동시에 학습시켰더니, DNA 구조를 입력하면 거기에 적합한 단백질 구조를 예측해 줍니다. 그래서 현재 제약회사와 신소재 회사들이 여기에 굉장히 관심이 많습니다
-알라딘 eBook <AGI, 천사인가 악마인가> (김대식 지음) 중에서 - P50
신약 개발은 정말 어려운 일입니다. 기존에 새로운 약을 만들려면 수년에서 길게는 수십 년 동안 실험하고, 분자 구조를 조사하고, 그렇게 1조 원 이상의 비용이 드는 일도 흔했습니다. 그렇게 해도 성공 확률이 낮았지요. 그래서 새로운 약이라는 게 쉽게 나오지 않았습니다. 그런데 AI를 사용해서 우리가 원하는 조건만 입력하면 가능성 있는 분자 구조를 예측해줍니다.
-알라딘 eBook <AGI, 천사인가 악마인가> (김대식 지음) 중에서 - P50
최근에는 어쩌면 우리 인간이 이미 알고 있는 것들이 생각보다 더 많을지도 모른다는 생각이 들기 시작하고 있습니다.
-알라딘 eBook <AGI, 천사인가 악마인가> (김대식 지음) 중에서 - P51
|