스마트 글라스의 장점은 뭘까요? (중략). 하지만 5년, 10년 후, 카메라 해상도가 높아지고 통신 속도 또한 많은데이터량을 빠르게 처리할 수 있을 정도로 빨라지면 인간의 눈과 다름없는 화질로 AI가 실시간으로 반응해 주는 화면을 볼 수있을 겁니다.- P106
첫째, 애플리케이션이 사라질 수 있습니다. (중략). AI가 사람의 필요를 파악하고 그때그때 알아서 구동하면 됩니다.- P106
흥미롭게도, 샘 올트먼, 조너선 아이브(아이폰 디자이너), 손정의(소프트뱅크 회장)가 비밀리에 회사를 설립했습니다. 이들은 멀티모달 AI 시대에 최적화된 디스플레이 없는 아이폰 같은 기기를 만들고 있다고 합니다.- P107
문제는 디스플레이, 휴대폰, 반도체가 한국을 먹여 살리는 산업이라는 점입니다.- P108
다가올 다음 단계의 AI는
어떤 모습일까?
(전략) 이제 우리는 생성형 AI 시대에 살고 있습니다. 앞으로 로드맵은 뻔합니다. 다음으로 우리가 맞이하게될 것은 다름아닌 에이전트 AI(Agent AI)입니다.
- P108
AI가 이걸 하기 위해서는 인간이 애플리케이션을 켜고 메뉴를 누르는 데이터를 멀티모달로 학습하면 됩니다. (중략). 그리고 다음 단계는 피지컬 AI(physical AI)입니다. - P109
이게 멀티 에이전트Multi-Agent 입니다. 오픈 AI는 2025년 여름멀티 에이전트를 공개하겠다고 했는데, 2025년 3월 6일 중국에서 ‘마누스MANUS‘라는 멀티 에이전트가 나왔습니다. (중략). 아직 완벽하진 않지만 늦어도 5년 안에 멀티 에이전트가 보편화될거라고 예측하고 있습니다.- P110
MCP와
로보틱스
그리고 또 하나, 현재 AI 업계에서가장 화제인 키워드 중 하나는 MCP, 즉 모델 컨텍스트 프로토콜Model Context Protocol 입니다. (중략).
하지만 2024년 11월, 앤트로픽이 MCP를 오픈소스로 공개하며 단일화된 표준을 만들자고 제안했습니다.- P110
MCP가 표준이 되면 에이전트 AI 개발이 훨씬 쉬워집니다.- P111
다음은 피지컬 AI, 즉 로보틱스입니다. (중략). 하지만 이제 테슬라의 옵티머스나 보스턴 다이내믹스의 로봇은 놀라울 정도로 뛰어난 움직임을 보여줍니다.- P112
문제는 이 로봇들이 ‘깡통‘이라는 점입니다.- P113
엔비디아는 2025년 1월 로보틱스용 소형 GPU ‘젯슨 토르jen Thor‘를 공개했습니다. 이 GPU를 로봇에 탑재하고 멀티Jetson에이전트 AI를 심으면 자율적인 두뇌를 가질 수 있지요.- P114
테슬라는 2025년에 옵티머스 5만 대를 생산하겠다고 공언했습니다. (중략). 그래도 5년 안에는 가능하리라고 전망하고 있습니다.- P115
인간의
마지막 도전
기계 학습에는 두 가지 주요 방법이 있습니다. 첫 번째, 지도학습 supervised learning은 간단합니다. (중략). 하지만 세상에 존재하는 많은 문제는 인간도 정답을 모르는 경우가 많습니다.- P116
이런 경우에 사용하는 것이 강화 학습입니다. 정답은 모르지만, 기계가 계속해서 시도하다가 원하는 결과에 가까워지면보상을 주는 것입니다. 그렇게 하다 보면 점점 정답을 내놓을 확률이 높아지는 것이지요.- P117
이 문제는 2024년 12월 24일 GPTO3가 등장하면서 드디어 해결됐습니다. GPT-O3는 체인 오브 소트Chain of Thought (CoT)라는 새로운 강화 학습 방법을 사용합니다. - P117
이 방법은 GPT-O3가 제안한 이후로 엄청난 성과를 냈습니다. 대표적으로 ARC-AGI(Abstract and Reasoning Corpus for Artificial GeneralIntelligence) (범용적 인공지능을 위한 추상적 및 추론적 코퍼스) 테스트를 통과했습니다.- P118
하지만챗GPT 같은 모델은 인간이 쓴 문장을 학습했기 때문에, 단순히 암기로 문제를 푸는게 아니냐는 비판을 받기도 합니다. 이를 반박하기 위해 새롭게 등장한 테스트가 바로 ARC-AGI 테스트입니다. - P119
기존 AI는 이런 문제를 전혀 이해하지 못했습니다. 정확도는 0%에 수렴했지요. 하지만 GPT-O3는 88%를 달성해 사람(75%)보다 추상화를 더 잘한다는 성과를 냈습니다. 이 때문에 업계가 들썩였습니다. 추상화 능력은 왜 중요할까요? - P121
하지만 여전히 문제는 남아 있었습니다. 바로 계산량입니다. CoT 방식을 사용하는 GPT-O3는 프롬프트 하나를 처리하는 데에 GPU 서버 비용이 140만원에서 1,400만원이 든다고 합니다. 말이 안되는 비용이지요.- P122
오픈 AI는 2025년 여름 더 효율적인 버전을 내놓겠다고 했지만, 그 전에 갑자기 2025년 1월 10일 중국의 딥시크DeepSeck가 비슷한 성능을 100분의 1 비용으로 구현하는 데 성공했습니다.- P122
챗GPT가 ARC-AGI 테스트를 통과한 후, 2025년 3월 24일더 어려운 테스트가 나왔습니다. 인간은 AI에 지기 싫어합니다.
이 테스트는 인간이 만든 문제를 거의 다 푸는 AI를 막기 위해 설계됐습니다. 저도 풀어봤지만 못 풀었습니다.- P123