time() - node_boot_time_seconds{instance="192.168.44.10:9100"} 1. time()函数返回从 1970-01-01 到现在的秒数。注意:它不是直接返回当前时间,而是时间戳 cpu数量 count(count(node_cpu_seconds_total{instance="192.168.44.10:9100", mode='system'}) by (cpu)) 1. 总内存 node_mem...
node_procs_blocked Number of processes blocked waiting for I/O to complete. node-exporter node_sockstat_UDP_mem Number of UDP sockets in state mem. node-exporter node_timex_maxerror_seconds Maximum error in seconds. node-exporter node_memory_Inactive_bytes Memory information field Inactive_bytes...
Uptime 系统正常运行的时间 type:Singlestat Unit: seconds (s) metrics: node_time_seconds{instance=~\"$node:$port\",job=~\"$job\"} - node_boot_time_seconds{instance=~\"$node:$port\",job=~\"$job\"} node_time_seconds 当前系统时间 node_boot_time_seconds 系统启动时间 Basic CPU / Mem ...
node_filesystem_size_bytes:文件系统的大小(以字节为单位)。 node_filesystem_free_bytes和node_filesystem_avail_bytes:分别表示文件系统的空闲空间和非root用户可用的空间大小。 node_disk_io_now、node_disk_io_time_seconds_total等:与磁盘I/O操作相关的指标,如当前正在进行的I/O操作数以及花费在I/O操作上...
例如: job != "node" 代码语言:javascript 复制 // (1) 查询标签 BusinessType 为 zk 以及 version 不等于 go1.15.8 的目标 go_info 指标项。 go_info{version!="go1.15.8",BusinessType="zk"} // go_info{env="prod", instance="192.168.10.67:9100", job="K8S-Prod", version="go1.15.6"} ...
rate(node_disk_io_time_seconds_total{instance=~"$hostname"}[5m]) 1. 2. util%到达100%并不一定会存在磁盘瓶颈,因为磁盘设备可以并发(fio中的多队列),判断磁盘瓶颈要根据util%、IO队列数、读写延迟的历史趋势来判断。没有办法,因为磁盘厂商也没给出相关参考。
node-exporter: Prometheus 官方项目,采集机器指标如 CPU、内存、磁盘。 blackbox_exporter: Prometheus 官方项目,网络探测,dns、ping、http监控 process-exporter: 采集进程指标 nvidia exporter: 我们有 gpu 任务,需要 gpu数据监控 node-problem-detector: 即 npd,准确的说不是 exporter,但也会监测机器状态,上报节点...
node_cpu_seconds_total{cpu="cpu0",mode="idle"} 362812.7890625 Counter Counter (只增不减的计数器)类型的指标其工作方式和计数器一样,只增不减,所以它对于存储诸如服务的 HTTP 请求数量或使用的 CPU 时间之类的信息非常有用。常见的监控指标,如 http_requests_total、node_cpu_seconds_total 都是 Counter ...
irate(node_disk_writes_completed_total[30m]) 1. 每秒磁盘写入速度: irate(node_disk_written_bytes_total[30m]) 1. 每秒磁盘I/O操作耗费时间计算公式: irate(node_disk_io_time_seconds_total[30m]) 1. 每次I/O读取耗时计算公式: irate(node_disk_read_time_seconds_total[30m]) / irate(node_disk_...
node_boot_time_seconds node_cpu_seconds_total 计算平均五分钟内的节点的CPU使用率: 1- sum(increase(node_cpu_seconds_total{mode="idle"}[5m])) by (instance)/sum(increase(node_cpu_seconds_total[5m])) by (instance) 查询节点的内存使用率: (1- (node_memory_Buffers_bytes + node_memory_Cached...