在人工智能 70 年的发展历程中,Agent 架构(Agent Architecture)始终是核心议题之一。如何设计一个智能体的"大脑",使其能够感知环境、做出决策、执行行动,这一问题贯穿了 AI 从符号主义到连接主义、从反应式到慎思式再到混合式的整个演进历程。
本书的核心问题:在面对一个具体的 AI 应用场景时,我们应该选择反应式架构、慎思式架构还是混合式架构?每种架构范式的优势与局限是什么?如何在速度与深度、简单与复杂、鲁棒性与灵活性之间做出权衡?
三大架构范式的历史演进
🟢 反应式架构 (1986-)
代表人物:Rodney Brooks
核心思想:智能源于与环境的直接交互,无需内部世界模型。感知直接映射到行动(S→R)。
代表作品:Subsumption Architecture (1986)、包容式架构、行为网络
优势:快速响应、鲁棒性强、实现简单
局限:无法处理需要规划的任务、缺乏长期目标导向
🔵 慎思式架构 (1990s-)
代表人物:Anand Rao, Michael Georgeff, John Laird
核心思想:智能体需要内部世界模型,通过符号推理和规划做出最优决策。
代表作品:BDI 架构 (1991)、Soar、ACT-R、规划系统(STRIPS、PDDL)
优势:能够处理复杂任务、支持长期规划、可解释性强
局限:计算复杂、响应慢、对环境变化敏感
🟣 混合式架构 (1990s-)
代表人物:Nils Nilsson, Erann Gat, Marcel Schoppers
核心思想:结合反应式的快速响应与慎思式的深度推理,分层或并行集成两种范式。
代表作品:TouringMachines (1992)、AuRA (1990s)、3T 架构、LLM Agent 架构 (2023-)
优势:兼顾速度与深度、适应性强、实用性好
局限:设计复杂、层间协调困难、调试困难
为什么架构选择至关重要?
Agent 架构的选择直接决定了系统的:
- 性能特征:响应速度、决策质量、资源消耗
- 能力边界:能处理什么任务、不能处理什么任务
- 可维护性:系统是否易于理解、调试、扩展
- 适应性:对环境变化的鲁棒性、学习能力
- 可解释性:决策过程是否透明、可追溯
本书的独特贡献
与现有 Agent 架构教材不同,本书具有以下特色:
- 历史视角:从 1986 年 Brooks 的反应式革命到 2026 年 LLM Agent 的混合架构,40 年演进全景
- 比较分析:系统性比较三大范式,提供量化评估指标
- 实用指南:架构选择决策树、场景匹配矩阵、实现代码库
- 现代视角:将经典架构理论与现代 LLM Agent 实践相结合
- 跨领域应用:机器人、游戏 AI、自动驾驶、企业 Agent 等多领域案例
本书结构
第一编 反应式 Agent 架构:详解反应式架构的哲学基础、Subsumption 架构设计、行为网络实现,分析其在机器人领域的成功应用与局限性。
第二编 慎思式 Agent 架构:深入探讨 BDI 架构的形式化模型、规划与推理技术、知识表示方法,展示慎思式 Agent 在复杂任务中的优势。
第三编 混合式 Agent 架构:系统介绍混合式架构的设计原则、分层与并行集成策略、经典混合架构案例(TouringMachines、AuRA、3T),以及现代 LLM Agent 的混合架构实践。
第四编 架构比较与选择指南:提供三大范式的系统性比较、架构选择决策树、评估方法与基准测试,帮助读者在实际项目中做出明智选择。
第五编 现代应用与未来方向:探讨 LLM Agent 时代的架构演进、神经符号融合、多 Agent 系统架构、伦理与安全考量,展望未来发展方向。
—— 作者
2026 年 3 月 9 日 于数字世界
谨以此书献给 Rodney Brooks、Anand Rao、Michael Georgeff 等架构先驱