需求分析 Agent 核心功能定义与需求结构化提取规则设计

一、需求分析 Agent 核心功能定位

需求分析 Agent 是端到端研发自动化系统的首个智能节点，负责将非结构化的用户需求、业务描述、口头表达转化为标准化的 PRD 文档和结构化的技术需求规格。该 Agent 基于 ReAct（Reasoning-Action）循环架构，具备意图理解、信息抽取、逻辑推理、冲突检测、需求优先级排序等核心能力。

核心价值主张

从"对话式建议"到"自动化执行"：需求分析 Agent 不仅仅是理解用户输入，更要主动追问、澄清歧义、识别隐含需求、验证一致性，最终输出可直接驱动后续技术方案设计和 API 接口开发的标准化需求规格说明书。

🎯 意图识别与语义理解

多轮对话上下文追踪与管理
用户故事（User Story）自动提取
业务场景与用例识别
情感分析与优先级推断
领域术语自动映射与标准化

📋 需求结构化提取

功能性需求（Functional Requirements）拆解
非功能性需求（NFR）识别与量化
业务流程建模（BPMN 兼容）
数据模型与实体关系提取
接口需求与集成点识别

🔍 需求验证与冲突检测

需求一致性检查（Consistency Check）
需求完整性评估（Completeness Analysis）
需求可行性分析（Feasibility Study）
需求冲突识别与解决建议
依赖关系图谱构建

📊 需求优先级排序

MoSCoW 法则自动应用（Must/Should/Could/Won't）
Kano 模型需求分类
ROI（投资回报率）估算辅助
风险 - 价值矩阵分析
迭代规划建议生成

🧠 三级记忆架构

L1 任务记忆：当前需求会话的工作记忆
L2 知识文档：领域知识库、历史 PRD 模板
L3 对话记录：完整需求讨论历史追溯
跨项目需求模式学习与复用
组织级需求资产沉淀

🤖 人机协同追问机制

智能追问：识别模糊点主动澄清
假设生成：提供多种可能性供用户确认
示例引导：通过案例帮助用户明确需求
实时反馈：需求变更影响即时评估
验收标准共创：与用户协作定义 DoD

二、需求结构化提取规则设计

需求结构化提取是需求分析 Agent 的核心能力，通过 NLP 技术与规则引擎的结合，将自然语言描述的需求转换为机器可读、可执行的结构化数据。以下是完整的提取规则体系：

2.1 提取公式框架

核心提取公式

StructuredRequirement = NLP_Parse(Input) + Rule_Transform(Context) + Domain_Map(Knowledge) + Validation_Check(Constraints)

需求完整性评分

Completeness_Score = Σ(Weight_i × Presence_i) / Σ(Weight_i) × 100%
其中 i ∈ {角色，动作，对象，条件，结果，验收标准}

2.2 功能性需求提取规则

规则类型	触发模式	提取目标	输出格式
用户故事识别	"作为 [角色]，我想要 [动作]，以便 [价值]"	角色、动作、业务价值	{role, action, value}
功能点提取	"系统应该/必须/需要 [功能描述]"	功能名称、输入、处理逻辑、输出	{function_name, input, process, output}
CRUD 操作识别	"创建/查询/更新/删除 [实体]"	操作类型、目标实体、权限要求	{operation_type, entity, permissions}
业务流程提取	"首先...然后...最后..." / "当...时，如果...则..."	流程步骤、条件分支、异常处理	{steps[], conditions[], exceptions[]}
状态机识别	"从 [状态 A] 变为 [状态 B]" / "[事件] 触发状态变更"	初始状态、终止状态、触发事件	{from_state, to_state, trigger_event}

2.3 非功能性需求（NFR）提取规则

NFR 类别	关键词触发	量化指标提取	默认阈值
性能需求	"响应时间"、"并发"、"吞吐量"、"QPS"	数值 + 单位（ms/s/requests）	P95 < 500ms, QPS > 1000
可用性需求	"可用性"、"SLA"、"正常运行时间"	百分比（%）	≥ 99.9%
安全性需求	"认证"、"授权"、"加密"、"审计"	安全等级、合规标准	等保三级、OAuth2.0
可扩展性需求	"扩展"、"增长"、"弹性"、"水平扩容"	扩容因子、自动伸缩阈值	CPU > 70% 触发扩容
兼容性需求	"浏览器"、"移动端"、"API 版本"、"向下兼容"	支持列表、版本范围	Chrome/Firefox/Safari 最新 2 版本

2.4 数据模型提取规则

实体识别规则

名词提取：识别业务领域中的核心名词（用户、订单、产品等）
属性推断：从描述中提取实体的属性（姓名、邮箱、价格等）
数据类型映射：根据上下文推断数据类型（string/int/decimal/date）
约束条件识别：必填、唯一、长度限制、格式校验

关系提取规则

一对多："一个 [A] 有多个 [B]" → A 1:* B
一对一："每个 [A] 对应一个 [B]" → A 1:1 B
多对多："[A] 和 [B] 可以多对多关联" → A *:*, 需中间表
继承关系："[A] 是一种特殊的 [B]" → A extends B

2.5 接口需求提取规则

接口要素	提取规则	示例
HTTP 方法	根据操作类型推断：查询→GET, 创建→POST, 更新→PUT/PATCH, 删除→DELETE	"用户提交订单" → POST /orders
请求参数	从输入描述提取：路径参数、查询参数、请求体字段	{userId: path, status: query, orderData: body}
响应结构	从输出描述提取：成功响应、错误响应、分页信息	{code, message, data{items[], total, page}}
错误码定义	识别异常场景并分配错误码	400:参数错误，404:资源不存在，500:系统异常

三、需求分析 Agent 工作流程

1

需求采集与预处理

接收用户输入（文本/语音/文档），进行分词、词性标注、命名实体识别（NER）、依存句法分析，构建初始语义图

2

意图识别与分类

使用多标签分类模型识别需求类型（功能需求/NFR/数据需求/接口需求），确定处理优先级

3

结构化提取执行

应用提取规则引擎，抽取角色、动作、对象、条件、结果等要素，填充标准化需求模板

4

歧义检测与人机协同追问

识别模糊表述、缺失信息、逻辑矛盾，生成澄清问题列表，与用户进行多轮对话确认

5

需求验证与冲突解决

执行一致性检查、完整性评估、可行性分析，检测需求间冲突并提供解决方案建议

6

优先级排序与迭代规划

应用 MoSCoW 法则和 Kano 模型进行优先级排序，生成 MVP 范围和迭代路线图建议

7

PRD 文档自动生成

输出标准化 PRD 文档（Markdown/HTML），包含用户故事、功能规格、验收标准、非功能性需求、数据模型、接口定义

8

需求资产入库与知识沉淀

将结构化需求存入向量数据库，更新领域知识图谱，为后续项目提供模式复用和智能推荐

四、需求分析 Agent 系统架构

📥 输入层（Input Layer）

自然语言文本输入
语音转文字（ASR）
文档上传解析（PDF/Word）
会议纪要导入
竞品需求参考

🧠 处理层（Processing Layer）

NLP 预处理模块
意图识别分类器
规则引擎（提取规则库）
ReAct 推理循环
冲突检测算法
优先级排序引擎

📤 输出层（Output Layer）

标准化 PRD 文档
用户故事地图
业务流程图（BPMN）
数据模型 ER 图
API 接口定义（OpenAPI）
验收测试用例

4.1 核心技术栈

NLP 基础能力

分词与词性标注：Jieba/HanLP/spaCy
命名实体识别：BERT-BiLSTM-CRF
依存句法分析：Stanford Parser
语义角色标注：SRL 模型
文本相似度计算：Sentence-BERT

大模型集成

Claude Code：复杂推理与代码生成
GPT-4/5：通用语言理解
本地 LLM：敏感数据不出域
Fine-tuned 模型：领域特定任务优化
RAG 检索增强：知识库动态引用

规则引擎

Drools：业务规则管理
正则表达式库：模式匹配
决策树：分类与路由
约束满足问题求解：冲突检测
图算法：依赖关系分析

五、与下游研发节点的集成接口

需求分析 Agent 输出的结构化需求将直接驱动后续研发流程，以下是关键集成点：

→ PRD 设计 Agent

输入：原始需求 + 结构化提取结果
输出：完整 PRD 文档（含业务流程、原型设计）
集成协议：JSON Schema + Markdown

→ 后端技术方案设计 Agent

输入：功能需求 + 数据模型 + 性能指标
输出：技术架构图、数据库设计、中间件选型
集成协议：UML + ER Diagram + OpenAPI

→ 前端技术方案设计 Agent

输入：用户故事 + 交互需求 + 兼容性要求
输出：组件设计、状态管理方案、UI 规范
集成协议：Component Tree + State Diagram

→ API 接口开发协议设计 Agent

输入：接口需求 + 数据模型 + 错误场景
输出：OpenAPI 3.0 规范、Mock 数据
集成协议：Swagger YAML + JSON Schema

→ AI Coding Agent

输入：API 协议 + 业务逻辑描述 + 验收标准
输出：可执行代码、单元测试
集成协议：AST + Test Cases

→ 测试 Agent（Unit/Integration/UI）

输入：验收标准 + 边界条件 + 异常场景
输出：自动化测试脚本、测试报告
集成协议：Test Framework + Coverage Report

六、需求分析质量评估指标体系

评估维度	指标名称	计算公式	目标阈值
准确性	意图识别准确率	正确分类数 / 总样本数 × 100%	≥ 95%
准确性	实体抽取 F1 值	2 × (Precision × Recall) / (Precision + Recall)	≥ 0.90
完整性	需求要素覆盖率	已提取要素数 / 应提取要素数 × 100%	≥ 98%
完整性	歧义检测召回率	检出的歧义数 / 实际歧义数 × 100%	≥ 90%
一致性	冲突检测准确率	正确检出的冲突数 / 总检出数 × 100%	≥ 92%
效率	平均处理时长	Σ(单个需求处理时间) / 需求总数	< 30 秒/需求
用户满意度	人机协同满意度	用户评分平均值（1-5 分）	≥ 4.5 分

七、实施路线图与里程碑

🚀 Phase 1：基础能力建设（Week 1-4）

完成 NLP 预处理模块开发
实现基础意图识别分类器
构建功能性需求提取规则库（v1.0）
集成 Claude Code API
开发三级记忆架构原型

⚡ Phase 2：核心功能完善（Week 5-8）

NFR 提取规则库开发
实现歧义检测与人机协同追问
开发需求冲突检测算法
构建优先级排序引擎
PRD 文档自动生成模块

🎯 Phase 3：系统集成测试（Week 9-12）

与 PRD 设计 Agent 集成联调
与技术方案设计 Agent 对接
端到端流程验证（需求→API 协议）
性能优化与压力测试
安全审计与合规检查

🌟 Phase 4：生产部署与迭代（Week 13+）

灰度发布与 A/B 测试
用户反馈收集与规则优化
领域知识库持续扩充
多语言支持扩展
自动化运维监控体系