需求分析 Agent 核心功能定义

基于 OpenClaw + Claude Code 的端到端研发自动化系统 · 需求结构化提取规则设计

AI Agent 需求工程 PRD 自动化 NLP 结构化提取 ReAct 架构

一、需求分析 Agent 核心功能定位

需求分析 Agent 是端到端研发自动化系统的首个智能节点,负责将非结构化的用户需求、业务描述、口头表达转化为标准化的 PRD 文档和结构化的技术需求规格。该 Agent 基于 ReAct(Reasoning-Action)循环架构,具备意图理解、信息抽取、逻辑推理、冲突检测、需求优先级排序等核心能力。

核心价值主张

从"对话式建议"到"自动化执行":需求分析 Agent 不仅仅是理解用户输入,更要主动追问、澄清歧义、识别隐含需求、验证一致性,最终输出可直接驱动后续技术方案设计和 API 接口开发的标准化需求规格说明书。

🎯 意图识别与语义理解

  • 多轮对话上下文追踪与管理
  • 用户故事(User Story)自动提取
  • 业务场景与用例识别
  • 情感分析与优先级推断
  • 领域术语自动映射与标准化

📋 需求结构化提取

  • 功能性需求(Functional Requirements)拆解
  • 非功能性需求(NFR)识别与量化
  • 业务流程建模(BPMN 兼容)
  • 数据模型与实体关系提取
  • 接口需求与集成点识别

🔍 需求验证与冲突检测

  • 需求一致性检查(Consistency Check)
  • 需求完整性评估(Completeness Analysis)
  • 需求可行性分析(Feasibility Study)
  • 需求冲突识别与解决建议
  • 依赖关系图谱构建

📊 需求优先级排序

  • MoSCoW 法则自动应用(Must/Should/Could/Won't)
  • Kano 模型需求分类
  • ROI(投资回报率)估算辅助
  • 风险 - 价值矩阵分析
  • 迭代规划建议生成

🧠 三级记忆架构

  • L1 任务记忆:当前需求会话的工作记忆
  • L2 知识文档:领域知识库、历史 PRD 模板
  • L3 对话记录:完整需求讨论历史追溯
  • 跨项目需求模式学习与复用
  • 组织级需求资产沉淀

🤖 人机协同追问机制

  • 智能追问:识别模糊点主动澄清
  • 假设生成:提供多种可能性供用户确认
  • 示例引导:通过案例帮助用户明确需求
  • 实时反馈:需求变更影响即时评估
  • 验收标准共创:与用户协作定义 DoD

二、需求结构化提取规则设计

需求结构化提取是需求分析 Agent 的核心能力,通过 NLP 技术与规则引擎的结合,将自然语言描述的需求转换为机器可读、可执行的结构化数据。以下是完整的提取规则体系:

2.1 提取公式框架

核心提取公式
StructuredRequirement = NLP_Parse(Input) + Rule_Transform(Context) + Domain_Map(Knowledge) + Validation_Check(Constraints)
需求完整性评分
Completeness_Score = Σ(Weight_i × Presence_i) / Σ(Weight_i) × 100%
其中 i ∈ {角色,动作,对象,条件,结果,验收标准}

2.2 功能性需求提取规则

规则类型 触发模式 提取目标 输出格式
用户故事识别 "作为 [角色],我想要 [动作],以便 [价值]" 角色、动作、业务价值 {role, action, value}
功能点提取 "系统应该/必须/需要 [功能描述]" 功能名称、输入、处理逻辑、输出 {function_name, input, process, output}
CRUD 操作识别 "创建/查询/更新/删除 [实体]" 操作类型、目标实体、权限要求 {operation_type, entity, permissions}
业务流程提取 "首先...然后...最后..." / "当...时,如果...则..." 流程步骤、条件分支、异常处理 {steps[], conditions[], exceptions[]}
状态机识别 "从 [状态 A] 变为 [状态 B]" / "[事件] 触发状态变更" 初始状态、终止状态、触发事件 {from_state, to_state, trigger_event}

2.3 非功能性需求(NFR)提取规则

NFR 类别 关键词触发 量化指标提取 默认阈值
性能需求 "响应时间"、"并发"、"吞吐量"、"QPS" 数值 + 单位(ms/s/requests) P95 < 500ms, QPS > 1000
可用性需求 "可用性"、"SLA"、"正常运行时间" 百分比(%) ≥ 99.9%
安全性需求 "认证"、"授权"、"加密"、"审计" 安全等级、合规标准 等保三级、OAuth2.0
可扩展性需求 "扩展"、"增长"、"弹性"、"水平扩容" 扩容因子、自动伸缩阈值 CPU > 70% 触发扩容
兼容性需求 "浏览器"、"移动端"、"API 版本"、"向下兼容" 支持列表、版本范围 Chrome/Firefox/Safari 最新 2 版本

2.4 数据模型提取规则

实体识别规则

  • 名词提取:识别业务领域中的核心名词(用户、订单、产品等)
  • 属性推断:从描述中提取实体的属性(姓名、邮箱、价格等)
  • 数据类型映射:根据上下文推断数据类型(string/int/decimal/date)
  • 约束条件识别:必填、唯一、长度限制、格式校验

关系提取规则

  • 一对多:"一个 [A] 有多个 [B]" → A 1:* B
  • 一对一:"每个 [A] 对应一个 [B]" → A 1:1 B
  • 多对多:"[A] 和 [B] 可以多对多关联" → A *:*, 需中间表
  • 继承关系:"[A] 是一种特殊的 [B]" → A extends B

2.5 接口需求提取规则

接口要素 提取规则 示例
HTTP 方法 根据操作类型推断:查询→GET, 创建→POST, 更新→PUT/PATCH, 删除→DELETE "用户提交订单" → POST /orders
请求参数 从输入描述提取:路径参数、查询参数、请求体字段 {userId: path, status: query, orderData: body}
响应结构 从输出描述提取:成功响应、错误响应、分页信息 {code, message, data{items[], total, page}}
错误码定义 识别异常场景并分配错误码 400:参数错误,404:资源不存在,500:系统异常

三、需求分析 Agent 工作流程

1
需求采集与预处理
接收用户输入(文本/语音/文档),进行分词、词性标注、命名实体识别(NER)、依存句法分析,构建初始语义图
2
意图识别与分类
使用多标签分类模型识别需求类型(功能需求/NFR/数据需求/接口需求),确定处理优先级
3
结构化提取执行
应用提取规则引擎,抽取角色、动作、对象、条件、结果等要素,填充标准化需求模板
4
歧义检测与人机协同追问
识别模糊表述、缺失信息、逻辑矛盾,生成澄清问题列表,与用户进行多轮对话确认
5
需求验证与冲突解决
执行一致性检查、完整性评估、可行性分析,检测需求间冲突并提供解决方案建议
6
优先级排序与迭代规划
应用 MoSCoW 法则和 Kano 模型进行优先级排序,生成 MVP 范围和迭代路线图建议
7
PRD 文档自动生成
输出标准化 PRD 文档(Markdown/HTML),包含用户故事、功能规格、验收标准、非功能性需求、数据模型、接口定义
8
需求资产入库与知识沉淀
将结构化需求存入向量数据库,更新领域知识图谱,为后续项目提供模式复用和智能推荐

四、需求分析 Agent 系统架构

📥 输入层(Input Layer)

  • 自然语言文本输入
  • 语音转文字(ASR)
  • 文档上传解析(PDF/Word)
  • 会议纪要导入
  • 竞品需求参考

🧠 处理层(Processing Layer)

  • NLP 预处理模块
  • 意图识别分类器
  • 规则引擎(提取规则库)
  • ReAct 推理循环
  • 冲突检测算法
  • 优先级排序引擎

📤 输出层(Output Layer)

  • 标准化 PRD 文档
  • 用户故事地图
  • 业务流程图(BPMN)
  • 数据模型 ER 图
  • API 接口定义(OpenAPI)
  • 验收测试用例

4.1 核心技术栈

NLP 基础能力

  • 分词与词性标注:Jieba/HanLP/spaCy
  • 命名实体识别:BERT-BiLSTM-CRF
  • 依存句法分析:Stanford Parser
  • 语义角色标注:SRL 模型
  • 文本相似度计算:Sentence-BERT

大模型集成

  • Claude Code:复杂推理与代码生成
  • GPT-4/5:通用语言理解
  • 本地 LLM:敏感数据不出域
  • Fine-tuned 模型:领域特定任务优化
  • RAG 检索增强:知识库动态引用

规则引擎

  • Drools:业务规则管理
  • 正则表达式库:模式匹配
  • 决策树:分类与路由
  • 约束满足问题求解:冲突检测
  • 图算法:依赖关系分析

五、与下游研发节点的集成接口

需求分析 Agent 输出的结构化需求将直接驱动后续研发流程,以下是关键集成点:

→ PRD 设计 Agent

  • 输入:原始需求 + 结构化提取结果
  • 输出:完整 PRD 文档(含业务流程、原型设计)
  • 集成协议:JSON Schema + Markdown

→ 后端技术方案设计 Agent

  • 输入:功能需求 + 数据模型 + 性能指标
  • 输出:技术架构图、数据库设计、中间件选型
  • 集成协议:UML + ER Diagram + OpenAPI

→ 前端技术方案设计 Agent

  • 输入:用户故事 + 交互需求 + 兼容性要求
  • 输出:组件设计、状态管理方案、UI 规范
  • 集成协议:Component Tree + State Diagram

→ API 接口开发协议设计 Agent

  • 输入:接口需求 + 数据模型 + 错误场景
  • 输出:OpenAPI 3.0 规范、Mock 数据
  • 集成协议:Swagger YAML + JSON Schema

→ AI Coding Agent

  • 输入:API 协议 + 业务逻辑描述 + 验收标准
  • 输出:可执行代码、单元测试
  • 集成协议:AST + Test Cases

→ 测试 Agent(Unit/Integration/UI)

  • 输入:验收标准 + 边界条件 + 异常场景
  • 输出:自动化测试脚本、测试报告
  • 集成协议:Test Framework + Coverage Report

六、需求分析质量评估指标体系

评估维度 指标名称 计算公式 目标阈值
准确性 意图识别准确率 正确分类数 / 总样本数 × 100% ≥ 95%
准确性 实体抽取 F1 值 2 × (Precision × Recall) / (Precision + Recall) ≥ 0.90
完整性 需求要素覆盖率 已提取要素数 / 应提取要素数 × 100% ≥ 98%
完整性 歧义检测召回率 检出的歧义数 / 实际歧义数 × 100% ≥ 90%
一致性 冲突检测准确率 正确检出的冲突数 / 总检出数 × 100% ≥ 92%
效率 平均处理时长 Σ(单个需求处理时间) / 需求总数 < 30 秒/需求
用户满意度 人机协同满意度 用户评分平均值(1-5 分) ≥ 4.5 分

七、实施路线图与里程碑

🚀 Phase 1:基础能力建设(Week 1-4)

  • 完成 NLP 预处理模块开发
  • 实现基础意图识别分类器
  • 构建功能性需求提取规则库(v1.0)
  • 集成 Claude Code API
  • 开发三级记忆架构原型

⚡ Phase 2:核心功能完善(Week 5-8)

  • NFR 提取规则库开发
  • 实现歧义检测与人机协同追问
  • 开发需求冲突检测算法
  • 构建优先级排序引擎
  • PRD 文档自动生成模块

🎯 Phase 3:系统集成测试(Week 9-12)

  • 与 PRD 设计 Agent 集成联调
  • 与技术方案设计 Agent 对接
  • 端到端流程验证(需求→API 协议)
  • 性能优化与压力测试
  • 安全审计与合规检查

🌟 Phase 4:生产部署与迭代(Week 13+)

  • 灰度发布与 A/B 测试
  • 用户反馈收集与规则优化
  • 领域知识库持续扩充
  • 多语言支持扩展
  • 自动化运维监控体系