5단계 체계에 앞서 저자들은 중요한 개념적 토대를 제시한다. SPAR 프레임워크다. Sense(감지), Plan(계획), Act(행동), Reflect(성찰)의 약자로, AI 에이전트가 환경 속에서 어떻게 작동하는지 체계적으로 이해하는 방법이다. 마치 새로 합류한 동료의 역량을 평가하듯 에이전트를 바라보는 시선이다. 감지는 에이전트가 환경에서 정보를 인식하고 수집하는 능력이다. 문서 읽기부터 알림 모니터링, 사용자 입력 처리까지. 계획은 정보를 처리하고 옵션을 평가하며 목표 달성을 위 한 전략을 개발하는 추론 능력이다. 행동은 실제 세계에서 작업을 실행하는 능력으로, 메시지 전송, 데이터베이스 업데이트, 워크플로 트리거, 물리 시스템 제어 등을 포함한다. 성찰은 경험에서 배우고, 성과를 평가하며, 미래 행동을 조정하는 능력이다. SPAR는 책 전반의 진단 도구로 작동한다. 각 레벨에서 이 네 가지 역량이 어떻게 진화하는지 보여주며, 어떤 AI 에이전트 시스템을 평가할 때도 실용적 렌즈가 된다. 기술 명세서에 매몰되지 않고, 각 구성요소와 특정 필요 사이의 정합성에 집중하게 만든다. 이 프레임워크가 빛나는 이유는 조직이 서로 다른 기능에 서로 다른 레벨이 필요하다는 인식 때문이다. 성공적인 AI 전환은 전형적으로 '포트폴리오 접근법'을 취한다. 레벨 1과 2 시스템이 일상 업무를 처리하고, 레벨 3 에이전트가 복잡한 워크플로를 관리하며, 적절한 맥락에서 레벨 4 역량을 조심스럽게 실험하는 식이다. 이는 역량 구축의 발판이기도 하다. 기업은 수작업에서 레벨 3 에이전트로 곧바로 도약할 수 없다. 레벨 1과 2를 구현하며 얻게 되는 프로세스 규율, 데이터 품질, 변화관리 역량이 먼저 필요하다. 단계를 건너뛰려는 조직들이 자주 실패하는 이유가 여기 있다. 저자들이 소개하는 “Three Keystones" 개념도 주목할 만하다. Action(행동), Reasoning(추론), Memory(기억)가 그것이다. 전통적 Al 벤치마크들-HumanEval(작업 실행), MMLU(지식 폭)은 학력증명서와 같다고 저자들은 말한다. 역량에 대해 뭔가를 말해주지만, 실제 성과를 예측하지는 못한다는 것이다. AI 시스템이 추론 테스트에서 95점을 받더라도, 여러 상호작용에 걸쳐 고객 선호도를 기억하지 못하거나, 복잡한 비즈니스 시스템에서 행동을 안정적으로 실행하지 못하거나, 드물지만 중요한 예외 상황에 추론을 적응시키지 못할 수 있다. 세 주춧돌이 조화롭게 작동하지 않으면, 아무리 정교한 AI도 시험은 잘 보지만 실제 업무의 복잡한 현실은 다루지 못하는 우수한 졸업생과 같다. 이 통찰은 많은 조직이 인상적인 데모와 파일럿 결과를 보고도, 정작 프로덕션 배포에서는 취약하고 신뢰할 수 없다고 느끼는 이유를 설명한다.
책은 크고 종종 기능 부전인 조직 내에서 에이전트 기반 자동화가 실제로 어떻게 작동할 수 있는지에 대한 실용적이고 구조화된 가이드다. 성숙도 모델을 제시하고, 단순한 규칙 추종자에서 자율적 협력자로 가는 단계를 안내한다. CIO, CTO, 전환 리더들이 열망과 실행 사이 간극을 헤쳐나가는 데 가치있는 운영적 틀을 제공한다. 명확한 프로세스 모델과 아키텍처 고려사항이 특히 유용하다. 저자들은 에이전트를 새로운 종류의 기업 일꾼으로 다루며, 이들을 지원하는 데 필요한 기술적 조직적 인프라를 이야기 한다. 의사결정 매트릭스, 성숙도 모델, 단계별 로드맵이 빼곡하다. 암묵적 메시지는 명확하다. Al를 프로세스 옆에 덧붙이는 걸 멈추고, 자율 시스템이 전체 업무 설계를 어떻게 재구성하는지 생각하는 것이다. 그리고 여기 그 방법이 있다. 반면 한계도 분명하다. 철학적 의미에서의 에이전시(agency)에 대한 깊은 논의나, 인간과 에이전트가 함께 일하는 것의 사회기술적 함의에 대한 천착은 찾기 어렵다. 그런 종류의 책이 아니다. 책은 플레이북이다. 견고하고, 잘 구조화되었으며, 리더들이 AI 도입의 혼란스러운 중간 지대를 틀짓도록 돕는 플레이북. 사변적이지 않지만 전략적이다. "월요일에 이걸 어떻게 작동시킬까"라는 의미에서의 전략이다.