为什么要持续 Profiling

离线抓火焰图只能解释“当下问题”,无法覆盖版本演进中的渐进回归。持续 profiling 能提供趋势视角。

落地关键

  1. 采样频率按服务等级分层,避免全局高频。
  2. 只保留聚合后的符号栈,降低存储压力。
  3. 结合版本号维度做回归对比。

噪声治理

  • 排除短命批处理进程。
  • 对 JIT 语言补齐符号映射。
  • 过滤启动期冷缓存阶段样本。

常见风险

  • 盲目提高采样率导致 CPU 额外开销。
  • 内核版本不一致引发采样偏差。
  • 只看 Top 函数,忽视调用链变化。

小结

持续 profiling 不是“多收集”,而是“低扰动、可对比、可解释”的长期性能体检体系。