📊 系统概览
本系统实现了从需求→PRD 设计→技术方案设计→API 协议设计→AI Coding→Unit Test→集成测试→CI/CD 自动部署→UI 自动化验收的全流程自动化研发体系。
通过 OpenClaw 作为编排层,调度 Codex、Claude Code、Gemini 等多个 AI 模型,实现了一天 94 次代码提交、30 分钟完成 7 个 PR 的惊人效率。
核心特性
✓
双层 Agent 架构:编排层 + 执行层分离
编排层持有业务上下文,执行层专注代码实现
✓
多模型协同:Codex + Claude + Gemini
根据任务类型智能选择最优模型
✓
全流程自动化:从需求到部署
8 个关键节点无缝衔接,支持人机协同
✓
全场景监控:Prometheus + Grafana
覆盖 K8S、应用、数据库、CI/CD 全链路
✓
多渠道告警:飞书 + 邮件 + 短信
分级告警策略,确保关键问题及时响应
✓
动态学习机制:Ralph Loop 改进版
从失败中学习,持续优化 Prompt 质量
🏗️ 系统架构设计
🎭 编排层 (OpenClaw)
业务上下文管理 | Agent 调度 | 进度监控 | 人机协同
⬇
📝 PRD 设计
Claude Opus
🏛️ 技术方案
Codex GPT-5.3
🔌 API 设计
Gemini Pro
⬇
💻 后端开发
Codex
🎨 前端开发
Claude Code
🧪 单元测试
Codex
⬇
⚙️ 执行层基础设施
GitLab → Jenkins → Docker → K8S (KubeSphere)
Prometheus + Grafana + Alertmanager
技术栈选型
| 层级 |
技术组件 |
版本 |
用途 |
| 编排层 |
OpenClaw |
v2026.2.23 |
Agent 编排与调度 |
| AI 模型 |
Claude Code |
v2.1.52 |
前端代码生成、PRD 设计 |
| AI 模型 |
Codex |
GPT-5.3 |
后端开发、技术方案、测试 |
| AI 模型 |
Gemini Pro |
2.0 |
API 设计、UI 设计 |
| CI/CD |
Jenkins |
2.4xx |
持续集成与部署 |
| 容器化 |
Docker + K8S |
24.x + 1.29 |
容器编排 (KubeSphere) |
| 监控 |
Prometheus |
2.45 |
指标采集与存储 |
| 可视化 |
Grafana |
10.x |
监控仪表盘 |
| 告警 |
Alertmanager |
0.26 |
告警路由与通知 |
🤖 研发角色 Agent 集群
系统包含 8 个专业化 Agent,覆盖完整研发流程的各个角色:
📋 PRD 设计师 Agent
Claude Opus 4.5
负责需求分析与 PRD 文档自动生成
- 需求分类与复杂度评估
- 用户故事拆解与优先级排序
- 验收标准定义
- 风险识别与时间估算
🏛️ 解决方案架构师 Agent
Codex GPT-5.3
负责后端 + 前端技术方案设计
- 系统架构模式选择
- 技术栈选型与数据库设计
- 安全设计与可扩展性规划
- 基础设施配置
🔌 API 设计师 Agent
Gemini Pro 2.0
负责 RESTful API 协议设计
- OpenAPI3.0规范生成
- 接口端点设计
- 请求/响应 schema 定义
- Mock 数据生成
💻 后端开发工程师 Agent
Codex GPT-5.3
负责后端业务代码实现
- Spring Boot / FastAPI 开发
- 数据库操作层实现
- 业务逻辑编码
- 代码审查与优化
🎨 前端开发工程师 Agent
Claude Code 2.1.52
负责前端 UI 组件开发
- React/Vue组件开发
- 响应式页面实现
- 状态管理与 API 集成
- 性能优化
🧪 测试工程师 Agent
Codex + Playwright
负责自动化测试编写与执行
- 单元测试 (JUnit/Jest)
- 集成测试
- E2E测试 (Playwright)
- 测试覆盖率分析
☸️ DevOps工程师Agent
Codex + Jenkins API
负责 CI/CD流水线与部署
- Dockerfile编写
- K8S资源配置
- Jenkins Pipeline 设计
- 自动部署执行
🤖 UI 自动化测试 Agent
Playwright + Multimodal AI
负责界面自动化验收测试
- 界面元素识别
- 自动化测试执行
- 视觉回归测试
- 测试报告生成
⚙️ 端到端研发全流程
从需求到上线的 8 个关键节点,支持人机协同:
1
需求输入与分析
自然语言描述需求 → PRD Designer Agent 分析 → 生成结构化需求文档
2
PRD 文档生成
用户故事拆解 → 验收标准定义 → 优先级评估 → 风险识别
3
技术方案设计
架构模式选择 → 技术栈选型 → 数据库设计 → 安全与扩展性规划
4
API 协议设计
RESTful 端点设计 → OpenAPI 规范 → Mock 数据 → 接口文档生成
5
AI Coding 代码生成
后端代码 (Spring Boot/FastAPI) → 前端代码 (React/Vue) → 配置文件
6
自动化测试
单元测试 → 集成测试 → 代码覆盖率检查 → 质量门禁
7
CI/CD自动部署
Jenkins Pipeline → Docker 镜像构建 → K8S 部署 → 滚动更新
8
UI 自动化验收
Playwright E2E 测试 → 视觉回归 → 烟雾测试 → 上线确认
人机协同节点
| 节点 |
人工介入点 |
协同方式 |
审批要求 |
| PRD 评审 |
产品经理确认 PRD 文档 |
Web 控制台 / 飞书 |
必须审批 |
| 技术方案评审 |
架构师审核技术选型 |
Web 控制台 |
必须审批 |
| API 协议确认 |
前后端联调前确认接口 |
Swagger UI |
建议审批 |
| Code Review |
关键代码人工审核 |
GitLab MR |
必须审批 |
| 上线审批 |
生产环境部署前审批 |
Jenkins / 飞书 |
必须审批 |
📈 全场景监控体系
基于 Prometheus + Grafana 构建的多维度监控体系,覆盖 K8S 集群、应用服务、数据库、CI/CD 流水线等全场景:
监控指标体系
K8S 集群监控
- Node CPU/内存使用率
- Pod 状态与健康度
- 资源配额使用情况
- 网络流量与错误率
应用服务监控
- HTTP 请求量与响应时间
- JVM 内存与 GC 指标
- 数据库连接池状态
- 业务指标追踪
数据库监控
- MySQL 连接数与 QPS
- 慢查询统计
- Redis 内存与命中率
- 主从复制延迟
CI/CD监控
- 构建成功率与时长
- 部署频率与回滚率
- 测试覆盖率趋势
- 队列积压情况
Prometheus 抓取配置
scrape_configs:
- job_name: 'kubernetes-apiservers'
kubernetes_sd_configs:
- role: endpoints
scheme: https
tls_config:
ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
- job_name: 'spring-boot-app'
metrics_path: '/actuator/prometheus'
kubernetes_sd_configs:
- role: pod
- job_name: 'mysql'
static_configs:
- targets: ['mysql-exporter:9104']
🚨 分级告警规则体系
基于严重程度分级的智能告警路由,确保关键问题及时响应:
告警级别定义
🔴
Critical - 紧急告警 (立即通知所有渠道)
🟠
Warning - 警告级别 (工作时间通知)
🔵
Info - 信息级别 (仅邮件通知)
核心告警规则
触发条件: Pod CPU 使用率 > 80% 持续 5 分钟
通知渠道: 飞书 + 邮件 + 短信 + PagerDuty
触发条件: 应用实例宕机超过 2 分钟
通知渠道: 飞书 + 邮件 + 短信 + OpsGenie
触发条件: Pod 内存使用率 > 85% 持续 5 分钟
通知渠道: 飞书 + 邮件
触发条件: HTTP 5xx 错误率 > 1% 持续 5 分钟
通知渠道: 飞书 + 邮件
触发条件: Pod 在 5 分钟内重启超过 3 次
通知渠道: 飞书 + 邮件
触发条件: MR 超过 4 小时未审核
通知渠道: 仅邮件
触发条件: SSL 证书将在 30 天内过期
通知渠道: 仅邮件
通知渠道配置
📱
飞书机器人 (Feishu Webhook)
✉️
SMTP 邮件通知
💬
Slack Channel
📞
短信通知 (SMS)
🚨
PagerDuty
🔔
OpsGenie
🔄 CI/CD自动化流水线
基于 Jenkins Pipeline 的 9 阶段自动化部署流程:
1
代码检出
GitLab SCM 集成,自动获取最新代码
2
代码质量检查
Lint 检查 + 安全扫描 + 覆盖率统计
3
编译构建
Maven 构建 + 前端打包,归档构建产物
4
单元测试
JUnit/Jest测试,发布测试结果报告
5
集成测试
Docker Compose 启动测试环境,执行集成测试
6
Docker 镜像构建
构建并推送 Docker 镜像到私有仓库
8
UI 自动化测试
Playwright E2E 测试,视觉回归验证
9
烟雾测试
验证服务可访问性与关键 API 功能
Jenkins Pipeline 关键配置
pipeline {
agent any
stages {
stage('Checkout') { ... }
stage('Code Quality') { ... }
stage('Build & Compile') { ... }
stage('Unit Test') { ... }
stage('Integration Test') { ... }
stage('Build Docker Image') { ... }
stage('Deploy to Kubernetes') { ... }
stage('UI Automation Test') { ... }
stage('Smoke Test') { ... }
}
post {
success { }
failure { }
}
}