典型问题
同机混部下,关键服务线程会被后台任务、ksoftirqd 和内核 housekeeping 干扰,导致 p99 抖动长期无法收敛。
隔离手段
- 通过 cpuset 为关键进程绑定独占核心。
- 将中断亲和性避开关键核心。
- 把系统 housekeeping 任务集中到专用核。
验证方法
- 对比隔离前后 p99/p999。
- 观察调度切换次数与 run queue 长度。
- 结合 perf 看 cache miss 与上下文切换变化。
小结
CPU 隔离不是“调个参数”,而是资源编排策略。把关键路径从系统噪声里解耦,低延迟目标才有实现基础。