基准测试#
本文档给出可复现的压测流程,用于验证 Cloud Native MCP Server 在当前配置下的性能表现。
1. 测试前准备#
- 固定测试环境(CPU/内存配额、节点负载)
- 固定服务配置(避免测试中变更)
- 记录版本与配置摘要
建议记录:
- commit SHA
- 运行模式(
sse或streamable-http) kubernetes.timeoutSec/qps/burstratelimit是否开启
2. 测试工具#
推荐:Apache Bench (ab)。
| |
3. 压测场景#
场景 A:健康检查#
| |
用途:测基础网络与进程响应能力。
场景 B:工具调用(message 端点,历史兼容)#
创建 payload.json:
| |
压测命令:
| |
用途:测真实业务链路下的吞吐与延迟。
4. 结果解读#
重点字段:
- Requests per second
- Time per request
- Failed requests
建议同时采集:
- p95/p99 延迟
- CPU、内存
- 后端依赖(Kubernetes API、Prometheus/Grafana)延迟
5. 调优顺序#
建议按以下顺序逐步调参:
kubernetes.timeoutSeckubernetes.qps/kubernetes.burstratelimit.requests_per_second/ratelimit.burstserver.readTimeoutSec/server.idleTimeoutSec
每次只改一组参数,并重新压测。
6. 可用的生产基线配置#
| |
7. 常见问题#
吞吐低#
- 提高
kubernetes.qps/burst - 检查下游服务是否成为瓶颈
- 检查限流是否过严
延迟高#
- 提高
kubernetes.timeoutSec - 检查 p99 与下游 API 延迟的相关性
- 减少同时启用的服务与工具范围
错误率高#
- 检查认证配置和凭据
- 查看
/api/audit/logs(启用审计时) - 检查后端服务可用性