max_over_time(range-vector) sum_over_time(range-vector) count_over_time(range-vector) quantile_over_time(scalar, range-vector) stddev_over_time(range-vector) stdvar_over_time(range-vector) 上述的函数的计算结果返回都为 instant vector。因此,我们可以得出这样的结论: range vector 作为这些以 “ran...
要使用 avg_over_time,你首先需要确保你已经安装了 prometheus。一旦你安装了 prometheus,你可以在时序数据查询中使用 avg_over_time 函数。 例如,假设你有一个名为 "temperature" 的时间序列数据指标,并且你想要计算这个指标每5分钟的总平均值,你可以使用以下查询: ```swift avg_over_time(temperature, 5m) ``...
min_over_time(range-vector): 区间向量内每个度量指标的最小值。 max_over_time(range-vector): 区间向量内每个度量指标的最大值。 sum_over_time(range-vector): 区间向量内每个度量指标的求和值。 count_over_time(range-vector): 区间向量内每个度量指标的样本数据个数。 quantile_over_time(scalar, range-...
max_over_time(range-vector) sum_over_time(range-vector) count_over_time(range-vector) quantile_over_time(scalar, range-vector) stddev_over_time(range-vector) stdvar_over_time(range-vector) 上述的函数的计算结果返回都为 instant vector。因此,我们可以得出这样的结论: range vector 作为这些以 “ran...
expr: avg_over_time(up[5m]) * 100 < 50 annotations: description: The service {{ $labels.job }} instance {{ $labels.instance }} is not responding for more than 50% of the time for 5 minutes. summary: The service {{ $labels.job }} is not responding ...
max_over_time(avg(rate(tikv_thread_cpu_seconds_total{name=~"(raftstore|rs)_.*"}[1m])) by(instance)[24h:1m]) 这是获取 TiKV raftstore线程池CPU 使用率的告警项。原版是直接将1分钟内所有线程的变化率相加,而笔者的修改版是将1分钟内所有线程的使用率取平均值,并且从此刻向后倒24小时内,每一分钟...
在使用`avg_over_time`函数时,我们可以使用一个表达式来查询特定的度量,例如`http_requests_total{method="GET"}`,这将返回所有HTTP GET请求的度量数据。 `duration`参数表示计算平均值时所使用的时间范围。它可以采用一些简洁的时间表达式,比如`5m`表示5分钟,`1h`表示1小时。此外,`duration`参数还可以与特殊的...
(1 - max by(name, namespace, cluster)(avg_over_time(aggregator_unavailable_apiservice[5m]))) * 100 < 90 5m 聚合API 服务最近5分钟可用性低于90% APIServer 故障 absent(sum(up{job="apiserver"}) by (cluster) > 0) 5m APIServer 从采集目标中消失 ...
avg_over_time(probe_success{instance="https://www.google.com"}[75s])获得超过75秒的平均探测次数,因此我们可以尝试忽略100万次停机时间。将此称为UP_TIME_PERCENTAGE。 UP_TIME_PERCENTAGE * 75提供过去75秒钟的运行时间,以秒为单位。将此称为UP_TIME_75S。UP...
要让巡检使用 PromQL ,就必须要修改告警中的 PromQL。这里需要介绍一个函数:max_over_time(range-vector),它是获取区间向量内每个指标的最大值。其实还有其他这类时间聚合函数,比如avg_over_time、min_over_time、sum_over_time等等,但是我们只需要获取到最大值,来提醒 dba 就行了。