基于 OpenClaw + Claude Code 的端到端研发自动化系统监控系统
| 服务名称 | 状态 | 响应时间 | QPS | 错误率 | 实例数 | CPU | 内存 |
|---|---|---|---|---|---|---|---|
| OpenClaw-API | 在线 | 35ms | 1200 | 0.2% | 3 | 45% | 6.2GB |
| Claude-Code-Engine | 在线 | 52ms | 800 | 0.8% | 2 | 67% | 8.5GB |
| Jenkins-Master | 警告 | 120ms | 50 | 2.1% | 1 | 78% | 4.0GB |
| KubeSphere-API | 在线 | 28ms | 450 | 0.1% | 3 | 35% | 5.8GB |
| MySQL-Primary | 在线 | 15ms | 2500 | 0.05% | 1 | 52% | 12.3GB |
| Redis-Cache | 在线 | 5ms | 8000 | 0.01% | 3 | 25% | 3.2GB |
| Prometheus | 在线 | 42ms | 350 | 0.3% | 2 | 58% | 7.5GB |
| Grafana | 在线 | 38ms | 280 | 0.2% | 2 | 42% | 4.8GB |
| 服务名称 | CPU 使用率 | 内存使用 | 磁盘使用 | 网络接收 | 网络发送 |
|---|---|---|---|---|---|
| Claude-Code-Engine | 67% | 8.5GB | 120GB | 450 MB/s | 320 MB/s |
| OpenClaw-API | 45% | 6.2GB | 85GB | 320 MB/s | 280 MB/s |
| MySQL-Primary | 52% | 12.3GB | 280GB | 180 MB/s | 150 MB/s |
| K8S-Nodes | 35% | 12.3GB | 500GB | 600 MB/s | 550 MB/s |
| Prometheus | 58% | 7.5GB | 350GB | 250 MB/s | 200 MB/s |
| Jenkins-Master | 78% | 4.0GB | 200GB | 180 MB/s | 120 MB/s |
| 告警名称 | 级别 | 状态 | 发生时间 | 恢复时间 | 持续时间 |
|---|---|---|---|---|---|
| OpenClaw-API 响应延迟过高 | 高级 | 已恢复 | 2026-03-15 14:20:00 | 2026-03-15 14:35:00 | 15 分钟 |
| MySQL 主从延迟 | 高级 | 已恢复 | 2026-03-15 10:00:00 | 2026-03-15 10:20:00 | 20 分钟 |
| Redis-Cache 命中率下降 | 中级 | 已恢复 | 2026-03-14 22:00:00 | 2026-03-14 22:30:00 | 30 分钟 |
| K8S Pod 重启 | 中级 | 已恢复 | 2026-03-14 16:45:00 | 2026-03-14 16:50:00 | 5 分钟 |
| 磁盘空间不足预警 | 中级 | 已恢复 | 2026-03-14 09:00:00 | 2026-03-14 11:00:00 | 2 小时 |