에이전틱 AI - 행동하는 인공지능의 탄생
파스칼 보넷 외 지음, 정미진 옮김, 김재필 감수 / 한즈미디어(한스미디어) / 2026년 1월
평점 :
장바구니담기


*본 포스팅은 출판사로부터 도서를 제공받아 주관적으로 작성한 리뷰입니다.

AI가 우리 곁에 온 지 오래지만, 대부분의 조직은 여전히 AI를 '똑똑한 참모'정도로만 활용하고 있다. 데이터를 분석하고, 인사이트를 제공하고, 예측 모델을 돌리는 역할 말이다. 파스칼 보르네와 그의 동료들이 펴낸 <에이전틱 Al>는 바로 이 지점을 시작한다. 생각하는 AI를 넘어, 실제로 일을 해내는 AI로의 전환. 책은 이를 브릴리언트 어드바이저 트랩 (briliant advisor trap)" 이라 명명하며, 조직들이 AI의 진짜 잠재력을 놓치고 있다고 지적한다. 흥미로운 점은 저자들의 구성이다. 학계, 산업계, 연구소를 아우르는 이들은 수십 년간 AI 솔루션을 실제로 구현해온 사람들이다. 그래서인지 책 전반에 흐르는 톤은 과장이 아닌 솔직함이다. 성공 사례만큼이나 실패 사례를 담담히 공유하며, AI 도입의 현실적 난관들을 있는 그대로 드러낸다. 이는 AI 열풍 속에서 쏟아지는 수많은 책들과 차별화되는 지점이다.


책의 핵심은 '에이전틱 AI 진화 프레임워크'라 불리는 5단계 분류체계다. 흥미롭게도 이 프레임워크는 전통적인 성숙도 모델과 다른 철학을 담고 있다. 높은 단계가 무조건 좋은 게 아니라는 것. 2단계 솔루션이 처리 비용을 40% 줄인다면, 결 코 안착하지 못한 4단계 시스템보다 훨씬 가치 있을 수 있다는 인식이다. 저자들은 자동차 기술에 빗대어 이를 설명한다. 완전 자율주행이 기술적으로 가능하다 해도, 많은 운전자들은 여전히 예측 가능하고 통제 가능한 기본 크루즈 컨트롤을 선호한다는 것. 이는 AI 도입에 있어 기술 가능성보다 조직의 필요와 준비도가 우선한다는 메시지를 담고 있다. 레벨 0은 인간이 모든 작업을 수행하는 수작업 단계다. 엑셀과 이메일 같은 기본 도구는 쓰지만, 모든 판단과 처리는 사람의 몫이 다. 원시적으로 보이지만, 인간의 판단력과 창의성, 감성이 필수적인 영역에서는 여전히 이 단계가 최선일 수 있다. 레벨 1은 규칙 기반 자동화로, 고정된 룰에 따라 움직이는 단순한 크루즈 컨트롤과 같다. 기본적인 RPAL if-then 로직이 여기 속한다. 반복적이고 대량의 작업, 명확한 비즈니스 규칙이 있는 업무에서 빛을 발한다. 하지만 한계도 분명하다. 예외 상황이나 프로그래밍되지 않은 시나리오를 만나면 작동을 멈춘다. 융통성 없이 깨지기 쉬운 시스템이다. 레벨 2는 양적 도약을 의미한다. 자연어 처리, 머신러닝, 컴퓨터 비전 같은 인지 능력이 전통적 자동화와 결합된다. 속도뿐 아니라 방향까지 제어하는 첨단 운전 보조 시스템에 비유된다. 데이터 패턴을 기반으로 결정을 내리고, 반정형 정보를 다루며, 입력값의 변화에 적응한다. 송장 처리 같은 업무에서 문서 정보를 추출하고 검증한 뒤 사람의 승인을 받는 식이다. 저자들은 많은 조직이 레벨 2에서 "스위트 스팟"을 찾았다고 말한다. 상당한 생산성 향상을 이루면서도 복잡한 결정에는 사람의 감독을 유지하는 균형점이다. 레벨 3는 진짜 Al 에이전트의 출현을 의미한다. 콘텐츠를 생성하고, 여러 단계의 프로세스를 계획하며, 복잡한 상황을 추론하고, 맥락에 따라 적응하는 시스템이다. 고속도로에서 자율주행하지만 특이한 상황에서는 사람의 개입이 필요한 수준이다. "더 나은 서비스 제공으로 고객 만족도를 높여라"같은 자연어 지시를 이해하고 실행 가능한 워크플로로 전환한다.


저자들의 대형 언어 모델 전문성이 빛나는 대목이다. 동시에 한계도 솔직히 인정한다. 엣지 케이스에서 여전히 오류를 범할 수 있고, 깊은 도메인 전문성이 필요한 작업에서는 고전하며, 조직의 가치와 목표에 부합하는지 세심한 모니터링이 필 요하다. 레벨 4는 진정한 자율성에 접근한다. 스스로 하위 목표를 설정하고, 경험에서 배우며, 시간이 지나며 전략을 조정 한다. 대부분 상황에서 완전 자율주행하되 특별한 경우에만 사람이 개입하는 수준이다. 아직 실험적이지만, 저자들은 흥 미로운 가능성을 엿보게 한다. 보험사 사례에서 Al 에이전트가 단순히 청구를 처리하는 데 그치지 않고, 사기 패턴을 선제적으로 식별하고, 워크플로 효율을 최적화하며, 정책 개선을 제안하는 모습이 그려진다. 레벨 5는 이론적 종착점이다. 해당 도메인 내 모든 시나리오에서 사람 개입 없이 완전히 자율적으로 작동하는 시스템. 저자들은 이에 대해 신중한 태도를 취한다. 기술적 도전뿐 아니라 책임성, 통제, 복잡한 결정에서 인간 판단의 역할 같은 근본적 질문들이 남아 있기 때문이 다. 레벨 5는 일반적 비즈니스 운영보다는 특정하고 잘 정의된 도메인에서 더 현실적일 것이라는 전망이다.


5단계 체계에 앞서 저자들은 중요한 개념적 토대를 제시한다. SPAR 프레임워크다. Sense(감지), Plan(계획), Act(행동), Reflect(성찰)의 약자로, AI 에이전트가 환경 속에서 어떻게 작동하는지 체계적으로 이해하는 방법이다. 마치 새로 합류한 동료의 역량을 평가하듯 에이전트를 바라보는 시선이다. 감지는 에이전트가 환경에서 정보를 인식하고 수집하는 능력이다. 문서 읽기부터 알림 모니터링, 사용자 입력 처리까지. 계획은 정보를 처리하고 옵션을 평가하며 목표 달성을 위 한 전략을 개발하는 추론 능력이다. 행동은 실제 세계에서 작업을 실행하는 능력으로, 메시지 전송, 데이터베이스 업데이트, 워크플로 트리거, 물리 시스템 제어 등을 포함한다. 성찰은 경험에서 배우고, 성과를 평가하며, 미래 행동을 조정하는 능력이다. SPAR는 책 전반의 진단 도구로 작동한다. 각 레벨에서 이 네 가지 역량이 어떻게 진화하는지 보여주며, 어떤 AI 에이전트 시스템을 평가할 때도 실용적 렌즈가 된다. 기술 명세서에 매몰되지 않고, 각 구성요소와 특정 필요 사이의 정합성에 집중하게 만든다. 이 프레임워크가 빛나는 이유는 조직이 서로 다른 기능에 서로 다른 레벨이 필요하다는 인식 때문이다. 성공적인 AI 전환은 전형적으로 '포트폴리오 접근법'을 취한다. 레벨 1과 2 시스템이 일상 업무를 처리하고, 레벨 3 에이전트가 복잡한 워크플로를 관리하며, 적절한 맥락에서 레벨 4 역량을 조심스럽게 실험하는 식이다. 이는 역량 구축의 발판이기도 하다. 기업은 수작업에서 레벨 3 에이전트로 곧바로 도약할 수 없다. 레벨 1과 2를 구현하며 얻게 되는 프로세스 규율, 데이터 품질, 변화관리 역량이 먼저 필요하다. 단계를 건너뛰려는 조직들이 자주 실패하는 이유가 여기 있다. 저자들이 소개하는 “Three Keystones" 개념도 주목할 만하다. Action(행동), Reasoning(추론), Memory(기억)가 그것이다. 전통적 Al 벤치마크들-HumanEval(작업 실행), MMLU(지식 폭)은 학력증명서와 같다고 저자들은 말한다. 역량에 대해 뭔가를 말해주지만, 실제 성과를 예측하지는 못한다는 것이다. AI 시스템이 추론 테스트에서 95점을 받더라도, 여러 상호작용에 걸쳐 고객 선호도를 기억하지 못하거나, 복잡한 비즈니스 시스템에서 행동을 안정적으로 실행하지 못하거나, 드물지만 중요한 예외 상황에 추론을 적응시키지 못할 수 있다. 세 주춧돌이 조화롭게 작동하지 않으면, 아무리 정교한 AI도 시험은 잘 보지만 실제 업무의 복잡한 현실은 다루지 못하는 우수한 졸업생과 같다. 이 통찰은 많은 조직이 인상적인 데모와 파일럿 결과를 보고도, 정작 프로덕션 배포에서는 취약하고 신뢰할 수 없다고 느끼는 이유를 설명한다.

책은 크고 종종 기능 부전인 조직 내에서 에이전트 기반 자동화가 실제로 어떻게 작동할 수 있는지에 대한 실용적이고 구조화된 가이드다. 성숙도 모델을 제시하고, 단순한 규칙 추종자에서 자율적 협력자로 가는 단계를 안내한다. CIO, CTO, 전환 리더들이 열망과 실행 사이 간극을 헤쳐나가는 데 가치있는 운영적 틀을 제공한다. 명확한 프로세스 모델과 아키텍처 고려사항이 특히 유용하다. 저자들은 에이전트를 새로운 종류의 기업 일꾼으로 다루며, 이들을 지원하는 데 필요한 기술적 조직적 인프라를 이야기 한다. 의사결정 매트릭스, 성숙도 모델, 단계별 로드맵이 빼곡하다. 암묵적 메시지는 명확하다. Al를 프로세스 옆에 덧붙이는 걸 멈추고, 자율 시스템이 전체 업무 설계를 어떻게 재구성하는지 생각하는 것이다. 그리고 여기 그 방법이 있다. 반면 한계도 분명하다. 철학적 의미에서의 에이전시(agency)에 대한 깊은 논의나, 인간과 에이전트가 함께 일하는 것의 사회기술적 함의에 대한 천착은 찾기 어렵다. 그런 종류의 책이 아니다. 책은 플레이북이다. 견고하고, 잘 구조화되었으며, 리더들이 AI 도입의 혼란스러운 중간 지대를 틀짓도록 돕는 플레이북. 사변적이지 않지만 전략적이다. "월요일에 이걸 어떻게 작동시킬까"라는 의미에서의 전략이다.


저자는 AI 전환이 단지 기술 도입이 아니라 업무 방식의 재설계라는 점, 그 과정에서 조직이 자신의 성숙도를 정직하게 진단하고 적절한 수준의 자동화를 선택해야 한다는 점을 끈질기게 상기시킨다. 과장 없는 솔직함, 현장에서 얻은 교훈들, 그리고 실용적인 프레임워크. 파스칼 보르네와 동료들이 제공하는 건 바로 이것이다. AI 에이전트가 프로토타입에서 비즈니스 핵심 시스템으로 전환되는 시점에서, 이들은 리더들이 투자를 평가하고 조직 역량을 체계적으로 구축할 개념적 토대를 이야기 해 준다. 책은 ”할 수 있다"가 아니라 "어떻게 할 것인가"에 답한다. 그리고 그 답은 단계적이고, 현실적이며, 무엇 보다 실행 가능하다.



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo