무료 오픈소스 기반의 브라우저 내 데스크톱 환경 ‘Puter’가 2년간의 개발을 마치고 드디어 베타 버전을 종료하고 정식 출시되었습니다. 이 프로젝트는 커뮤니티 기여자 370명, GitHub 스타 4만 개, 40만 회 이상의 다운로드라는 엄청난 규모로 성장했습니다.


GitHub - HeyPuter/puter: 🌐 The Internet Computer! Free, Open-Source, and Self-Hostable.

https://github.com/HeyPuter/puter https://github.com/HeyPuter/puter



Puter는 ‘인터넷 OS’라고 불리며, 브라우저에서 바로 실행되는 데스크톱 환경을 제공합니다. 간단한 메모장, 음성 녹음기부터 스프레드시트, 카메라 앱까지 다양한 기능을 하나의 플랫폼에서 사용할 수 있습니다.



주요 특징


- 셀프 호스트 가능: 자신의 서버에 직접 설치할 수 있으며, 단 한 줄의 코드 실행으로 설치할 수 있습니다.


- 클라우드 이용 가능: 공식 사이트 Puter https://puter.com/에서 별도 설치 없이 바로 사용할 수 있습니다.


- 앱 마켓 지원: Puter Marketplace https://apps.puter.com/에서 Puter에 최적화된 다양한 소프트웨어를 다운로드할 수 있습니다.


- 다양한 활용도:

- 웹사이트, 웹 앱, 게임 제작 및 배포 플랫폼

- Dropbox, Google Drive, OneDrive 등 클라우드 스토리지 대체

- 서버나 워크스테이션을 위한 원격 데스크톱 환경


커뮤니티 반응


Puter는 뛰어난 접근성과 기능성에도 불구하고, 일부 사용자 사이에서는 실용성에 대한 의문이 제기되기도 했습니다. 해외 커뮤니티 Reddit에서는 다음과 같은 의견이 나왔습니다.


- “KasmVNC 같은 도구면 충분하지 않나?”


- “40만 다운로드가 무슨 용도로 쓰이는지 잘 모르겠다.”


이처럼 아직은 ‘어디에 써야 할지’ 명확하지 않다는 반응도 있지만, 오픈소스 생태계에서 빠르게 입지를 넓혀가고 있습니다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기
 
 
 


OCR, 음성 인식, 구조화된 데이터 출력 등 ‘정답이 정해진 작업’에 특화된 새로운 AI 모델 아키텍처 ‘Interfaze’ 가 공개되었습니다. AI 기업 Interfaze가 발표한 이 모델은 대규모 언어 모델(LLM)보다 높은 정확도와 낮은 비용으로 정형화된 작업을 처리하는 것을 목표로 합니다.


공식 블로그에 따르면, Interfaze는 Gemini-3-Flash, Claude-Sonnet-4.6, GPT-5.4-Mini, Grok-4.3 등 경량·고속 모델과 비교하여 OCR, 이미지 인식, 음성 인식, JSON 출력 등 9가지 벤치마크에서 높은 성능을 기록했습니다.


Interfaze: A new model architecture built for high accuracy at scale - Interfaze

https://interfaze.ai/blog/interfaze-a-new-model-architecture-built-for-high-accuracy-at-scale https://interfaze.ai/blog/interfaze-a-new-model-architecture-built-for-high-accuracy-at-scale



기존 LLM의 한계와 Interfaze의 접근법


인간은 문서를 읽고 의미를 이해하거나 모호한 지시를 해석하는 데 능숙하지만, 50페이지 분량의 PDF를 한 글자씩 읽고 각 단어의 좌표를 기록한 뒤 다른 언어로 번역하는 작업에는 적합하지 않습니다. 시간이 오래 걸리고 실수가 늘어나며 비용도 높아집니다.


Interfaze의 설명에 따르면, 현재 널리 사용되는 Transformer 기반의 대규모 언어 모델도 비슷한 특성을 지닙니다. 즉, 문맥 이해와 창의적 처리에는 강하지만, OCR이나 데이터 추출처럼 정확성과 재현성이 요구되는 작업에서는 인간과 유사한 오류가 발생하기 쉽습니다.


이에 Interfaze는 DNN(심층 신경망)이나 CNN(합성곱 신경망) 같은 작업 특화형 신경망과 Transformer 디코더를 결합한 하이브리드 구조를 채택했습니다. DNN과 CNN은 OCR, 번역, GUI 검출 등 특정 작업에 최적화하기 쉽고, 글자의 위치 정보나 신뢰도 점수 같은 메타데이터도 출력할 수 있습니다. 반면, 단독으로는 유연한 추론이나 언어적 판단이 어렵습니다. Interfaze는 이 약점을 Transformer로 보완하여, 정형화된 작업의 정확성과 LLM의 유연성을 동시에 확보하려는 설계입니다.


아래 그림은 Interfaze가 입력을 처리해 출력을 생성하는 과정을 보여줍니다. 프롬프트는 전처리를 거쳐 DNN·CNN과 Transformer가 결합된 핵심 부분으로 전달되며, OCR, 객체 검출, 번역, 음성 인식 등 작업별 어댑터와 연동됩니다. 이후 필요한 정보만 정리되어 디코더나 구조화 출력 모델을 통해 텍스트나 JSON으로 출력됩니다. 이 구조는 Interfaze가 ‘전문 모델의 정확성’과 ‘Transformer의 유연성’을 결합하도록 설계되었음을 보여줍니다.



핵심 포인트: ‘만능 AI’가 아닌 ‘정형 작업 특화 AI’


중요한 점은 Interfaze가 ‘LLM을 대체하는 만능 AI’가 아니라, OCR, 음성 인식, 구조화 출력 등 개발자가 대량으로 처리하는 정형 작업에 특화된 AI로 설계되었다는 것입니다. 기사에서도 Claude Opus나 GPT-5.5 같은 고성능 범용 모델은 코딩이나 복잡한 추론에서 강력하지만, OCR이나 번역 같은 대량 처리에서는 비용과 속도 면에서 사용하기 어렵다고 설명합니다.


Interfaze의 주요 사양은 다음과 같습니다.


컨텍스트 윈도우: 100만 토큰


최대 출력: 3만 2000 토큰


입력 형식: 텍스트, 이미지, 음성, 파일


추론 기능: 기본적으로 비활성화


가격: Gemini-3-Flash와 유사한 수준 (입력 100만 토큰당 1.50달러, 출력 100만 토큰당 3.50달러)


OCR 성능: 복잡한 레이아웃의 PDF도 정확하게


Interfaze가 특히 중점을 둔 분야는 OCR입니다. 긴 PDF, 복잡한 레이아웃의 문서, 이미지 내 문자 인식 등에서 문자뿐만 아니라 도표나 그래픽의 위치도 동시에 처리할 수 있는 점이 강점입니다. 예를 들어, 잡지처럼 여러 단으로 구성된 페이지를 입력하면 페이지 내 텍스트를 추출하면서 일러스트나 도판의 좌표도 JSON 형식으로 반환할 수 있습니다.


아래 그래프는 길고 레이아웃이 복잡한 PDF에 대한 OCR 정확도를 비교한 결과입니다. Interfaze가 85.7%로 가장 높은 성능을 보이며, Chandra OCR, olmOCR, Grok-4.3, GPT-5.4-Mini 등을 앞질렀습니다.



Interfaze가 OCR에서 강력한 이유는 단순히 CNN 인코더가 글자를 잘 읽는 것뿐만 아니라, 도판이나 그래픽 검출, 번역 레이어, Transformer를 통한 의미 이해를 동일한 벡터 공간에서 결합할 수 있기 때문입니다.


구조화 출력: JSON 값의 정확성까지 검증


또 다른 중요한 분야는 구조화 출력입니다. 많은 LLM은 JSON 스키마에 따른 형식으로 출력하는 데 능숙하지만, 그 안에 들어가는 값이 항상 정확한 것은 아닙니다. 예를 들어 ‘이름’, ‘주소’, ‘날짜’, ‘금액’ 같은 항목을 깔끔한 JSON으로 반환하더라도 값 자체가 틀리면 실무에서 사용할 수 없습니다.


Interfaze는 이 문제를 측정하기 위해 Structured Output Benchmark(SOB) 를 공개했습니다. SOB는 모델에 정답 정보를 컨텍스트로 제공하고, 해당 정보를 JSON으로 올바르게 출력할 수 있는지를 측정합니다. 평가 대상은 텍스트, 이미지, 음성을 포함하며, JSON의 최종 값이 정답과 완전히 일치하는지 여부로 정확도를 측정합니다.


아래 그래프는 JSON 최종 값이 정답과 완전히 일치한 비율(SOB Value Accuracy)을 보여줍니다. Interfaze는 79.5%로 1위를 기록하며, Grok-4.3, Claude-Sonnet-4.6, Gemini-3-Flash, GPT-5.4-Mini를 소폭 앞질렀습니다.



다국어 및 음성 인식 성능


다국어 성능에서도 Interfaze는 높은 점수를 보여줍니다. MMMLU는 여러 언어에 대한 지식과 이해력을 측정하는 벤치마크로, 영어 이외의 언어 처리를 얼마나 안정적으로 처리하는지 평가합니다.


아래 그래프는 14개 언어 MMMLU 하위 집합의 매크로 평균 정확도를 보여줍니다. Interfaze는 90.9% 로, Grok-4.3(89.7%), Gemini-3-Flash(88.7%)를 상회했습니다.



음성 인식(자동 음성 인식, ASR)에서도 Interfaze는 전문 음성 인식 서비스에 근접한 성능을 보여줍니다. VoxPopuli-Cleaned-AA는 유럽 의회의 다국어 연설을 대상으로 한 음성 인식 벤치마크로, 단어 오류율(WER)로 평가합니다.


아래 그래프는 VoxPopuli-Cleaned-AA에서의 WER을 비교한 결과입니다. 가장 낮은 오류율은 Scribe v2의 1.7%이고, Interfaze는 2.4%로 2위를 기록했지만, Deepgram Nova-3, Whisper Large v3, Gemini-3-Flash보다 낮은 오류율을 보였습니다.



또한 Interfaze는 음성 인식 속도에서도 강점을 보입니다. 기사에 따르면, Interfaze는 1초의 계산 시간으로 209초 분량의 음성을 처리할 수 있습니다. 이는 Deepgram Nova-3의 약 1.5배, Scribe v2의 약 8배, Gemini-3-Flash의 11배 이상에 해당합니다.


아래 그래프는 VoxPopuli-Cleaned-AA에서의 전사 속도를 비교한 결과입니다. Interfaze가 209.4로 1위를 기록하며, Deepgram Nova-3(143.3), Whisper Large v3(76.3)를 크게 앞질렀습니다.



종합 벤치마크 및 API 제공


기사 전체의 벤치마크에서는 OCRBench V2, olmOCR, RefCOCO, VoxPopuli, Spider 2.0-Lite, GPQA Diamond, MMMLU, MMMU-Pro, SOB Value Accuracy 등 9개 항목이 비교되었습니다. Interfaze는 많은 항목에서 최상위 또는 상위권에 올랐으며, 특히 OCR, 구조화 출력, 다국어 처리, 음성 인식 속도에서 눈에 띄는 결과를 보여주었습니다.



Interfaze는 OpenAI 호환 Chat Completions API로 제공되며, 기존 OpenAI SDK, Vercel AI SDK 등을 통해 쉽게 사용할 수 있습니다.


댓글(0) 먼댓글(0) 좋아요(1)
좋아요
공유하기 북마크하기찜하기
 
 
 

2026-05-14 일일 베스트셀러

아르고나인 미디어그룹 실판매 기반 베스트셀러 순위입니다.


1[과세] 자르지 않고 한 장으로 접는 곤충 종이접기
2[과세]컬러링 두뇌퍼즐 인형놀이 스도쿠 2
3BTS:케이팝의 아이콘
4[과세] 자르지 않고 한 장으로 접는 모던 디자인 종이접기
5볼펜으로 그리는 일러스트
6트쥐백 공룡대백과
7파충류 양서류 종이접기
8평온과 몰입을 선물하는 만다라 아트 컬러링북 3
9딩글스 인형 아트 컬러링 엽서책 (2)
10[과세]스프링 간단 종이접기대백과
11[과세]앤드류 루미스 인체 드로잉
12작은 동전 지갑부터 컬러풀한 숄까지 모티브 뜨개질
13프로골퍼도 몰래 보는 골프책
14[과세] 오리로보 오리가미 솔저
15자이언트 미로
16배경과 소품 스케치
17공룡오리기 백과
18곤충오리기 백과
19선생님도 몰래보는 탈무드 숨은 뜻이야기
20스티커 우주 풍경/우주



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기
 
 
 


OCR, 음성 인식, 구조화된 데이터 출력 등 ‘정답이 정해진 작업’에 특화된 새로운 AI 모델 아키텍처 ‘Interfaze’ 가 공개되었습니다. AI 기업 Interfaze가 발표한 이 모델은 대규모 언어 모델(LLM)보다 높은 정확도와 낮은 비용으로 정형화된 작업을 처리하는 것을 목표로 합니다.


공식 블로그에 따르면, Interfaze는 Gemini-3-Flash, Claude-Sonnet-4.6, GPT-5.4-Mini, Grok-4.3 등 경량·고속 모델과 비교하여 OCR, 이미지 인식, 음성 인식, JSON 출력 등 9가지 벤치마크에서 높은 성능을 기록했습니다.


Interfaze: A new model architecture built for high accuracy at scale - Interfaze

https://interfaze.ai/blog/interfaze-a-new-model-architecture-built-for-high-accuracy-at-scale https://interfaze.ai/blog/interfaze-a-new-model-architecture-built-for-high-accuracy-at-scale



기존 LLM의 한계와 Interfaze의 접근법


인간은 문서를 읽고 의미를 이해하거나 모호한 지시를 해석하는 데 능숙하지만, 50페이지 분량의 PDF를 한 글자씩 읽고 각 단어의 좌표를 기록한 뒤 다른 언어로 번역하는 작업에는 적합하지 않습니다. 시간이 오래 걸리고 실수가 늘어나며 비용도 높아집니다.


Interfaze의 설명에 따르면, 현재 널리 사용되는 Transformer 기반의 대규모 언어 모델도 비슷한 특성을 지닙니다. 즉, 문맥 이해와 창의적 처리에는 강하지만, OCR이나 데이터 추출처럼 정확성과 재현성이 요구되는 작업에서는 인간과 유사한 오류가 발생하기 쉽습니다.


이에 Interfaze는 DNN(심층 신경망)이나 CNN(합성곱 신경망) 같은 작업 특화형 신경망과 Transformer 디코더를 결합한 하이브리드 구조를 채택했습니다. DNN과 CNN은 OCR, 번역, GUI 검출 등 특정 작업에 최적화하기 쉽고, 글자의 위치 정보나 신뢰도 점수 같은 메타데이터도 출력할 수 있습니다. 반면, 단독으로는 유연한 추론이나 언어적 판단이 어렵습니다. Interfaze는 이 약점을 Transformer로 보완하여, 정형화된 작업의 정확성과 LLM의 유연성을 동시에 확보하려는 설계입니다.


아래 그림은 Interfaze가 입력을 처리해 출력을 생성하는 과정을 보여줍니다. 프롬프트는 전처리를 거쳐 DNN·CNN과 Transformer가 결합된 핵심 부분으로 전달되며, OCR, 객체 검출, 번역, 음성 인식 등 작업별 어댑터와 연동됩니다. 이후 필요한 정보만 정리되어 디코더나 구조화 출력 모델을 통해 텍스트나 JSON으로 출력됩니다. 이 구조는 Interfaze가 ‘전문 모델의 정확성’과 ‘Transformer의 유연성’을 결합하도록 설계되었음을 보여줍니다.



핵심 포인트: ‘만능 AI’가 아닌 ‘정형 작업 특화 AI’


중요한 점은 Interfaze가 ‘LLM을 대체하는 만능 AI’가 아니라, OCR, 음성 인식, 구조화 출력 등 개발자가 대량으로 처리하는 정형 작업에 특화된 AI로 설계되었다는 것입니다. 기사에서도 Claude Opus나 GPT-5.5 같은 고성능 범용 모델은 코딩이나 복잡한 추론에서 강력하지만, OCR이나 번역 같은 대량 처리에서는 비용과 속도 면에서 사용하기 어렵다고 설명합니다.


Interfaze의 주요 사양은 다음과 같습니다.


컨텍스트 윈도우: 100만 토큰


최대 출력: 3만 2000 토큰


입력 형식: 텍스트, 이미지, 음성, 파일


추론 기능: 기본적으로 비활성화


가격: Gemini-3-Flash와 유사한 수준 (입력 100만 토큰당 1.50달러, 출력 100만 토큰당 3.50달러)


OCR 성능: 복잡한 레이아웃의 PDF도 정확하게


Interfaze가 특히 중점을 둔 분야는 OCR입니다. 긴 PDF, 복잡한 레이아웃의 문서, 이미지 내 문자 인식 등에서 문자뿐만 아니라 도표나 그래픽의 위치도 동시에 처리할 수 있는 점이 강점입니다. 예를 들어, 잡지처럼 여러 단으로 구성된 페이지를 입력하면 페이지 내 텍스트를 추출하면서 일러스트나 도판의 좌표도 JSON 형식으로 반환할 수 있습니다.


아래 그래프는 길고 레이아웃이 복잡한 PDF에 대한 OCR 정확도를 비교한 결과입니다. Interfaze가 85.7%로 가장 높은 성능을 보이며, Chandra OCR, olmOCR, Grok-4.3, GPT-5.4-Mini 등을 앞질렀습니다.



Interfaze가 OCR에서 강력한 이유는 단순히 CNN 인코더가 글자를 잘 읽는 것뿐만 아니라, 도판이나 그래픽 검출, 번역 레이어, Transformer를 통한 의미 이해를 동일한 벡터 공간에서 결합할 수 있기 때문입니다.


구조화 출력: JSON 값의 정확성까지 검증


또 다른 중요한 분야는 구조화 출력입니다. 많은 LLM은 JSON 스키마에 따른 형식으로 출력하는 데 능숙하지만, 그 안에 들어가는 값이 항상 정확한 것은 아닙니다. 예를 들어 ‘이름’, ‘주소’, ‘날짜’, ‘금액’ 같은 항목을 깔끔한 JSON으로 반환하더라도 값 자체가 틀리면 실무에서 사용할 수 없습니다.


Interfaze는 이 문제를 측정하기 위해 Structured Output Benchmark(SOB) 를 공개했습니다. SOB는 모델에 정답 정보를 컨텍스트로 제공하고, 해당 정보를 JSON으로 올바르게 출력할 수 있는지를 측정합니다. 평가 대상은 텍스트, 이미지, 음성을 포함하며, JSON의 최종 값이 정답과 완전히 일치하는지 여부로 정확도를 측정합니다.


아래 그래프는 JSON 최종 값이 정답과 완전히 일치한 비율(SOB Value Accuracy)을 보여줍니다. Interfaze는 79.5%로 1위를 기록하며, Grok-4.3, Claude-Sonnet-4.6, Gemini-3-Flash, GPT-5.4-Mini를 소폭 앞질렀습니다.



다국어 및 음성 인식 성능


다국어 성능에서도 Interfaze는 높은 점수를 보여줍니다. MMMLU는 여러 언어에 대한 지식과 이해력을 측정하는 벤치마크로, 영어 이외의 언어 처리를 얼마나 안정적으로 처리하는지 평가합니다.


아래 그래프는 14개 언어 MMMLU 하위 집합의 매크로 평균 정확도를 보여줍니다. Interfaze는 90.9% 로, Grok-4.3(89.7%), Gemini-3-Flash(88.7%)를 상회했습니다.



음성 인식(자동 음성 인식, ASR)에서도 Interfaze는 전문 음성 인식 서비스에 근접한 성능을 보여줍니다. VoxPopuli-Cleaned-AA는 유럽 의회의 다국어 연설을 대상으로 한 음성 인식 벤치마크로, 단어 오류율(WER)로 평가합니다.


아래 그래프는 VoxPopuli-Cleaned-AA에서의 WER을 비교한 결과입니다. 가장 낮은 오류율은 Scribe v2의 1.7%이고, Interfaze는 2.4%로 2위를 기록했지만, Deepgram Nova-3, Whisper Large v3, Gemini-3-Flash보다 낮은 오류율을 보였습니다.



또한 Interfaze는 음성 인식 속도에서도 강점을 보입니다. 기사에 따르면, Interfaze는 1초의 계산 시간으로 209초 분량의 음성을 처리할 수 있습니다. 이는 Deepgram Nova-3의 약 1.5배, Scribe v2의 약 8배, Gemini-3-Flash의 11배 이상에 해당합니다.


아래 그래프는 VoxPopuli-Cleaned-AA에서의 전사 속도를 비교한 결과입니다. Interfaze가 209.4로 1위를 기록하며, Deepgram Nova-3(143.3), Whisper Large v3(76.3)를 크게 앞질렀습니다.



종합 벤치마크 및 API 제공


기사 전체의 벤치마크에서는 OCRBench V2, olmOCR, RefCOCO, VoxPopuli, Spider 2.0-Lite, GPQA Diamond, MMMLU, MMMU-Pro, SOB Value Accuracy 등 9개 항목이 비교되었습니다. Interfaze는 많은 항목에서 최상위 또는 상위권에 올랐으며, 특히 OCR, 구조화 출력, 다국어 처리, 음성 인식 속도에서 눈에 띄는 결과를 보여주었습니다.



Interfaze는 OpenAI 호환 Chat Completions API로 제공되며, 기존 OpenAI SDK, Vercel AI SDK 등을 통해 쉽게 사용할 수 있습니다.


댓글(0) 먼댓글(0) 좋아요(2)
좋아요
공유하기 북마크하기찜하기
 
 
 


수학자 티모시 가워스(Timothy Gowers) 교수가 ChatGPT 5.5 Pro를 활용한 수학 연구 경험담을 공개했다. 가워스 교수에 따르면, ChatGPT 5.5 Pro는 거의 수학적 조언 없이도 박사 과정 수준의 조합론 연구 결과를 단 1~2시간 만에 도출해냈다.



AI가 푼 문제는?


가워스 교수가 시험한 문제는 정수 집합 A를 여러 번 더해 만들 수 있는 '합집합'의 크기에 관한 것이다. 쉽게 말해 "k개의 정수로 구성된 집합을 이용해 원하는 크기의 합집합을 만들려면 얼마나 넓은 범위의 정수가 필요한가"라는 문제다.


기존에 알려진 구성 방식은 필요한 정수의 범위가 지나치게 컸다. ChatGPT 5.5 Pro는 우선 h=2라는 기본적인 경우에 대해, 기하급수적이던 상한을 2차 함수 수준으로 개선했다. 이는 합의 결과가 서로 겹치기 어려운 '시돈 집합(Sidon sequence)'을 교묘하게 활용한 덕분이다.


기존 연구를 뛰어넘다


가워스 교수는 이후 더 일반적인 h 값에 대해서도 같은 개선이 가능한지 시도했다. 이 과정에서 MIT 학생 아이작 라자고팔(Isaac Rajagopal)의 기존 연구를 바탕으로 삼았다. ChatGPT 5.5 Pro는 이 논의를 기반으로 개선을 시도했고, 결국 지수 함수적이던 상한을 다항식 수준으로 낮추는 아이디어를 제시했다.


라자고팔은 이 결과를 확인하고 "거의 확실히 맞다"고 평가했다. 특히 중요한 점은 단순한 계산 대체가 아니라, "기하수열처럼 행동하면서도 요소의 크기는 다항식 수준으로 유지되는 집합"을 만드는 발상이 포함되었다는 것이다. 라자고팔은 "내가 생각해도 1~2주는 걸렸을 훌륭한 아이디어를 ChatGPT 5.5 Pro가 1시간도 안 되어 찾아냈다"고 놀라움을 표했다.



"박사 논문 한 장으로 손색없다"


가워스 교수는 이번 결과에 대해 "2시간도 안 되어 찾아낸 것 치고는 조합론 박사 논문의 한 장(chapter)으로 충분히 성립하는 수준"이라고 평가했다. 물론 수학사에 길이 남을 대정리는 아니며, 라자고팔의 기존 연구에 크게 의존한 것도 사실이다. 하지만 단순한 재진술이나 기계적 계산이 아니라, 기존 틀을 비자명하게 확장한 내용이라는 점을 강조했다.


가워스 교수는 "인간 박사 과정생이 같은 결과에 도달하려면, 먼저 라자고팔의 논문을 완전히 이해하고, 개선할 여지를 찾고, 필요한 대수적 기법에 익숙해진 뒤, 새로운 구성을 찾아내야 했을 것"이라고 설명했다. 즉, ChatGPT 5.5 Pro가 한 일은 "검색으로 기존 답을 가져온" 수준이 아니라, 연구자가 실제로 수행하는 독해·개선·구성의 과정에 매우 가까웠다는 것이다.


바뀌는 연구의 최저선


가워스 교수는 이로 인해 초기 박사 과정생에게 연구를 가르치는 일이 더욱 어려워질 것이라고 전망한다. 지금까지는 아직 누구도 풀지 않았지만 비교적 접근하기 쉬운 문제를 학생에게 주어 연구의 첫걸음을 떼게 할 수 있었다. 그러나 AI가 그런 "쉬운 미해결 문제"를 풀 수 있는 단계에 왔다면, 인간 연구자에게 요구되는 최저선은 "미해결 문제를 푸는 것"에서 "AI만으로는 풀 수 없음을 증명하는 것"으로 이동할 가능성이 있다.


하지만 가워스 교수는 "그렇다고 인간 수학자가 필요 없어지는 것은 아니다"라고 강조한다. 오히려 초보 연구자도 AI를 활용할 수 있게 된 만큼, 앞으로 중요한 것은 "AI가 단독으로 할 수 없는 연구를 AI와 협력해 진행하는 능력"이라고 본다. 가워스 교수 자신도 최근 AI와의 공동 작업을 적극 시도하고 있으며, 현재로서는 AI가 결정적인 대 아이디어를 내는 단계는 아니지만 확실히 유용한 기여를 하고 있다고 덧붙였다.


명예의 의미도 바뀐다


가워스 교수는 수학 연구의 의미 자체도 변할 것이라고 내다본다. 예를 들어 "앞으로는 자신의 이름이 정리나 정의에 영원히 남는 종류의 명예를 얻기는 어려워질 수 있다"고 말한다. 만약 어떤 수학자가 AI와 길고 긴 대화 끝에 큰 문제를 풀었다 해도, 기술적인 작업이나 주요 아이디어를 AI가 담당했다면 그것을 그 수학자의 대위업이라고 부를 수 있을지 의문이기 때문이다.


그럼에도 가워스 교수는 어려운 수학에 도전하는 가치는 남아 있다고 생각한다. 문제와 씨름하면서 단순히 다른 사람의 답을 읽는 것만으로는 얻을 수 없는 '문제 해결의 감각'이 길러지기 때문이다. 뛰어난 프로그래머일수록 AI 코딩을 더 잘 활용하듯, 실제로 어려운 수학 문제를 풀어본 경험이 있는 사람일수록 AI를 활용한 수학 연구에서도 강점을 발휘할 수 있다고 지적한다. 그러면서 "앞으로의 수학 연구에서는 과거 세대와 같은 보상을 얻지 못할 수도 있지만, 연구 수준의 수학에서 단련되는 능력은 미래 사회를 위한 강력한 준비가 될 가능성이 높다"고 글을 마무리했다.



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo