🔮 Grafana 监控可视化平台

基于 OpenClaw + Claude Code 的端到端研发自动化系统监控系统

🖥️
15
总服务数
14
在线服务
⚠️
1
异常服务
📊
65%
流程进度
🔔
3
活跃告警

系统健康度

正常
94.5%
过去 24 小时平均健康度
↑ 2.3% 较昨日

平均响应时间

P99
45ms
所有服务平均响应时间
↓ 8ms 性能优化

🐛 错误率

关注
0.8%
过去 1 小时错误请求占比
↑ 0.3% 需关注

📈 QPS 趋势

实时

🔄 流程进度概览

进行中
总体进度 65%
当前阶段:技术方案设计 80%

🖥️ 核心服务状态

14/15 在线
  • OpenClaw-API
    35ms 延迟
    1200 QPS
    0.2% 错误率
    ×3 实例
  • Claude-Code-Engine
    52ms 延迟
    800 QPS
    0.8% 错误率
    ×2 实例
  • Jenkins-Master
    120ms 延迟
    50 QPS
    2.1% 错误率
    ×1 实例
  • KubeSphere-API
    28ms 延迟
    450 QPS
    0.1% 错误率
    ×3 实例

健康服务

14
服务运行正常

⚠️ 警告服务

1
需要关注

离线服务

0
无服务宕机

📋 服务详情列表

服务名称 状态 响应时间 QPS 错误率 实例数 CPU 内存
OpenClaw-API 在线 35ms 1200 0.2% 3 45% 6.2GB
Claude-Code-Engine 在线 52ms 800 0.8% 2 67% 8.5GB
Jenkins-Master 警告 120ms 50 2.1% 1 78% 4.0GB
KubeSphere-API 在线 28ms 450 0.1% 3 35% 5.8GB
MySQL-Primary 在线 15ms 2500 0.05% 1 52% 12.3GB
Redis-Cache 在线 5ms 8000 0.01% 3 25% 3.2GB
Prometheus 在线 42ms 350 0.3% 2 58% 7.5GB
Grafana 在线 38ms 280 0.2% 2 42% 4.8GB

📊 服务响应时间趋势

📉 服务错误率分布

🎯 研发流程总进度

进行中
总体完成度 65%

各阶段详细进度

需求分析 已完成
PRD 设计 已完成
技术方案设计 80%
API 协议设计 60%
AI Coding 待开始
单元测试 待开始
集成测试 待开始
CI/CD 部署 待开始
UI 自动化测试 待开始
验收上线 待开始

⏱️ 平均阶段耗时

2.5 天
每个阶段平均耗时
↓ 0.5 天 效率提升

已完成任务

156
累计完成任务数
↑ 23 本周新增

🚧 阻塞问题

2
待解决的阻塞项
↓ 1 已解决 1 个

📊 阶段耗时对比

👥 人机协同统计

CPU 使用率

集群平均
67%
16 核 × 8 节点
↑ 5% 较昨日

💾 内存使用率

注意
78%
32GB × 8 节点
↑ 3% 较昨日

🗄️ 磁盘使用率

充足
45%
500GB × 8 节点
↑ 2% 较昨日

📈 CPU/内存使用趋势

🌐 网络流量趋势

📊 各服务资源占用排行

服务名称 CPU 使用率 内存使用 磁盘使用 网络接收 网络发送
Claude-Code-Engine
67%
8.5GB 120GB 450 MB/s 320 MB/s
OpenClaw-API
45%
6.2GB 85GB 320 MB/s 280 MB/s
MySQL-Primary
52%
12.3GB 280GB 180 MB/s 150 MB/s
K8S-Nodes
35%
12.3GB 500GB 600 MB/s 550 MB/s
Prometheus
58%
7.5GB 350GB 250 MB/s 200 MB/s
Jenkins-Master
78%
4.0GB 200GB 180 MB/s 120 MB/s

🔴 严重告警

0
需立即处理

🟠 高级告警

1
30 分钟内响应

🟡 中级告警

2
2 小时内处理

📋 活跃告警列表

3 个活跃
  • ⚠️
    Jenkins-Master 高错误率
    服务 Jenkins-Master 的错误率超过阈值 (2.1% > 2%),持续 10 分钟
    发生时间:2026-03-15 22:35:00
  • ℹ️
    技术方案设计阶段接近超时
    当前阶段已执行 2.0 天,接近计划超时阈值 (2.5 天)
    发生时间:2026-03-15 20:00:00
  • ℹ️
    Claude-Code-Engine 内存使用偏高
    服务内存使用率达到 78%,建议关注内存泄漏风险
    发生时间:2026-03-15 18:30:00

📜 历史告警记录

告警名称 级别 状态 发生时间 恢复时间 持续时间
OpenClaw-API 响应延迟过高 高级 已恢复 2026-03-15 14:20:00 2026-03-15 14:35:00 15 分钟
MySQL 主从延迟 高级 已恢复 2026-03-15 10:00:00 2026-03-15 10:20:00 20 分钟
Redis-Cache 命中率下降 中级 已恢复 2026-03-14 22:00:00 2026-03-14 22:30:00 30 分钟
K8S Pod 重启 中级 已恢复 2026-03-14 16:45:00 2026-03-14 16:50:00 5 分钟
磁盘空间不足预警 中级 已恢复 2026-03-14 09:00:00 2026-03-14 11:00:00 2 小时