sumby(instance)(rate(node_disk_reads_completed_total[5m])) sumby(instance)(rate(node_disk_writes_completed_total[5m])) 5、Pod CPU 使用率 container_cpu_usage_seconds_total 是容器累计使用的CPU时间,用它除以CPU总时间,就可以得到容器的cpu使用率,首先计算容器的CPU占用时间,由于节点上的cpu有多个,所...
node_disk_reads_completed_total#分区读总次数node_disk_writes_completed_total#分区写总次数 计算公式与上面相似,使用我们熟悉的irate或rate函数来处理 irate(node_disk_reads_completed_total{device="vda"}[5m])irate(node_disk_writes_completed_total{device="vda"}[5m]) 四. 网络监控 网卡流量 网卡流量一...
node_disk_reads_completed_total #分区读总次数 node_disk_writes_completed_total #分区写总次数 计算公式,使用我们熟悉的irate或rate函数来处理 irate(node_disk_reads_completed_total{device="vda"}[5m]) irate(node_disk_writes_completed_total{device="vda"}[5m]) 四、网络监控 网卡流量 网卡流量一般分...
node_disk_read_bytes_total:读IO node_disk_writes_completed_total:写IO 由于ffmpeg转码新增了一个视频文件,因此写IO会有明显增长,下面这个表达式反映了平均每秒的磁盘写入量 代码语言:javascript 复制 rate(node_disk_writes_completed_total[5m]) 如下图,有多个磁盘的数据 如果想看每个机器上的总磁盘写入量,可...
* node_memory_MemFree -> node_memory_MemFree_bytes * node_filesystem_avail -> node_filesystem_avail_bytes * node_filesystem_size -> node_filesystem_size_bytes * node_disk_io_time_ms -> node_disk_io_time_seconds_total * node_disk_reads_completed -> node_disk_reads_completed_total ...
磁盘每秒读取速率: node_disk_reads_completed_total 磁盘每秒写入速率: node_disk_writes_completed_total 读时延: rate(node_disk_read_time_seconds_total{instance="my-instance-name"}[1m]) / rate(node_disk_reads_completed_total{instance="my-instance-name"}[1m]) ...
irate(node_disk_writes_completed_total{cluster=~"$cluster",instance=~"$node"}[5m]) node_disk_writes_completed_total node-exporter node_disk_io_now{cluster=~"$cluster",instance=~"$node"} node_disk_io_now node-exporter 每1秒内 I/O 操作耗时占比 irate(node_disk_io_time_seconds_tot...
Prometheus Node IO指标有哪些重要指标? 1. node_disk_read_bytes_total:节点上所有磁盘读取的总字节数。 2. node_disk_written_bytes_total:节点上所有磁盘写入的总字节数。 3. node_disk_reads_completed_total:节点上所有磁盘读取完成的总次数。 4. node_disk_writes_completed_total:节点上所有磁盘写入完成的...
rate(node_disk_write_time_seconds_total{instance=~"$hostname"}[5m]) / rate(node_disk_writes_completed_total{instance=~"$hostname"}[5m]) * 1000 1. 2. 3. 4. 这个值的单位是秒, 不太好看,乘以1000可以换算成毫秒ms。这个值与设备有关,本地盘、网络盘、SSD磁盘的读写延迟级别不一。
node-exporter:Prometheus 官方项目,采集机器指标如 CPU、内存、磁盘。 blackbox_exporter:Prometheus 官方项目,网络探测,DNS、ping、http 监控。 process-exporter:采集进程指标。 NVIDIA Exporter:我们有 GPU 任务,需要 GPU 数据监控。 node-problem-detector:即 NPD,准确的说不是 Exporter,但也会监测机器状态,上报节...