还有当 X=100 时也叫百分位数(percentile),比如我们常说 P95 响应延迟是 100ms,实际上是指对于收集到的所有响应延迟,有 5% 的请求大于 100ms,95% 的请求小于 100ms。 Prometheus 里面的histogram_quantile函数接收的是 0-1 之间的小数,将这个小数乘以 100 就能很容易得到对应的百分位数,比如 0.95 就对应着 P9...
在 Prometheus 中,histogram_quantile 函数接收一个 0-1 之间的数值,乘以 100 即可得到对应的百分位数,如 0.95 对应 P95。函数还能实现超过百分位数的精度,例如 0.9999。接下来,我们分析一些“反直觉”案例,以更直观地理解 histogram_quantile 的行为。问题 1:P99 可能比平均值小吗?答案是肯定...
还有当 X=100 时也叫百分位数(percentile),比如我们常说 P95 响应延迟是 100ms,实际上是指对于收集到的所有响应延迟,有 5% 的请求大于 100ms,95% 的请求小于 100ms。 Prometheus 里面的histogram_quantile函数接收的是 0-1 之间的小数,将这个小数乘以 100 就能很容易得到对应的百分位数,比如 0.95 就对应着 P9...
histogram_quantile 是 Prometheus 特别常用的一个函数,比如经常把某个服务的 P99 响应时间来衡量服务质量。不过它到底是什么意思很难解释得清,特别是面向非技术的同学。另一方面,即使是资深的研发同学,在排查问题的时候也经常会发现 histogram_quantile 的数值出现一些反直觉的“异常...
histogram_quantile是 Prometheus 特别常用的一个函数,比如经常把某个服务的 P99 响应时间来衡量服务质量。不过它到底是什么意思很难解释得清,特别是面向非技术的同学。另一方面,即使是资深的研发同学,在排查问题的时候也经常会发现histogram_quantile的数值出现一些反直觉的“异常现象”然后摸不着头脑。本文将结合原理和...