* node_filesystem_size -> node_filesystem_size_bytes * node_disk_io_time_ms -> node_disk_io_time_seconds_total * node_disk_reads_completed -> node_disk_reads_completed_total * node_disk_sectors_written -> node_disk_written_bytes_total * node_time -> node_time_seconds * node_boot_...
node_cpu_seconds_total node-exporter Node Disk Usage (Top 10) topk(10, sum(label_replace(1-node_filesystem_free_bytes{cluster="$cluster",mountpoint="/"}/node_filesystem_size_bytes{cluster="$cluster",mountpoint="/",fstype!="rootfs"},"host_ip","$1","instance","(.*)"))...
irate(node_disk_io_time_seconds_total[30m]) 1. 每次I/O读取耗时计算公式: irate(node_disk_read_time_seconds_total[30m]) / irate(node_disk_reads_completed_total[30m]) 1. 每次I/O写入耗时计算公式: irate(node_disk_write_time_seconds_total[30m]) / irate(node_disk_writes_completed_total[30...
-name:DiskI/O报警规则 rules: -alert:DiskIOTimeOut expr:| ( sum(node_disk_io_time_seconds_total{device=~"/dev/.*"}[5m]) / sum(node_disk_io_time_seconds_total{device=~"/dev/.*", operation=~"read|write"}[5m]) ) > 0.03 for:10m labels: severity:page annotations: summary:服务器...
node_disk_io_now node-exporter node_disk_io_time_seconds_total node-exporter node_disk_io_time_weighted_seconds_total node-exporter node_disk_read_bytes_total node-exporter node_disk_read_time_seconds_total node-exporter node_disk_reads_completed_total ...
rate(node_disk_io_time_seconds_total{instance=~"$hostname"}[5m]) 1. 2. util%到达100%并不一定会存在磁盘瓶颈,因为磁盘设备可以并发(fio中的多队列),判断磁盘瓶颈要根据util%、IO队列数、读写延迟的历史趋势来判断。没有办法,因为磁盘厂商也没给出相关参考。
node_load1``node_load5 node_load15 node_disk_read_bytes_total node_disk_written_bytes_total node_disk_io_time_seconds_total node_filesystem_size_bytes node_filesystem_avail_bytes node_filesystem_readonly node_network_receive_bytes_total ...
irate(node_disk_written_bytes_total[30m]) # 每秒磁盘I/O操作耗费时间计算公式: irate(node_disk_io_time_seconds_total[30m]) # 每次I/O读取耗时计算公式: irate(node_disk_read_time_seconds_total[30m])/irate(node_disk_reads_completed_total[30m]) ...
node-exporter:Prometheus 官方项目,采集机器指标如 CPU、内存、磁盘。 blackbox_exporter:Prometheus 官方项目,网络探测,DNS、ping、http 监控。 process-exporter:采集进程指标。 NVIDIA Exporter:我们有 GPU 任务,需要 GPU 数据监控。 node-problem-detector:即 NPD,准确的说不是 Exporter,但也会监测机器状态,上报节...
prometheus node-export监控指标 prometheus node-export监控指标node-exporter 是 Prometheus 生态系统中的一个组件,用于收集主机(Node)上的系统级别的监控指标。以下是一些 node-exporter 提供的常见监控指标:1. CPU 相关指标:• node_cpu_seconds_total: CPU 时间(秒)的总和,可以用于计算 CPU 利用率。• ...