1)下载 node_exporter node-exporter用于采集node的运行指标,包括node的cpu、load、filesystem、meminfo、network等基础监控指标,类似于zabbix监控系统的的zabbix-agent。 下载地址:https://github.com/prometheus/node_exporter/releases/ wget https://github.com/prometheus/node_exporter/releases/download/v1.5.0/node...
1)下载 node_exporter 2)启动 node_exporter 3)配置Prometheus加载node_exporter 4)告警规则配置 5)模拟告警 6)配置告警通道 一、概述 通过创建Prometheus监控告警规则,您可以制定针对特定Prometheus实例的告警规则。当告警规则设置的条件满足后,系统会产生对应的告警事件。如果想要收到通知,需要进一步配置对应的通知策略以...
提供下我整理的node-exporter的记录规则和报警规则。 一、node-exporter-record-rules.yml groups:-name:node-exporter-recordrules:-expr:up{job=~"node-exporter"}record:node_exporter:uplabels:desc:"节点是否在线, 在线1,不在线0"unit:" "job:"node-exporter"-expr:time()-node_boot_time_seconds{}record...
expr: 100 -(node_memory_MemTotal_bytes -node_memory_MemFree_bytes+node_memory_Buffers_bytes+node_memory_Cached_bytes ) / node_memory_MemTotal_bytes * 100> 80 for: 1m labels: status: 严重告警 annotations: summary: "{{$labels.mountpoint}} 内存使用率过高!" description: "{{$labels.mountpo...
Exporter是Prometheus的指标数据收集组件。它负责从目标Jobs收集数据,并把收集到的数据转换为Prometheus支持的时序数据格式。和传统的指标数据收集组件不同的是,他只负责收集,并不向Server端发送数据,而是等待Prometheus Server 主动抓取,node-exporter 默认的抓取url地址:http://ip:9100/metrics。 因为环境原因,网络不可达...
常用的告警方式有发邮件、调用指定接口(webhook) 等。本文讲解webhook方式,完成这个示例需要准备4个组件:prometheus、node_exporter、alertmanagers、接受webhook调用的web服务 1 首先准备一个rule_file,机器的近1分钟负载超过0.8,就触发告警。如下: my_rules.yml: ...
- targets: ['192.168.111.65:9100'] # 如果有多个node_exporter,配置到[]中,隔开添加不需要重启服务,服务自动发现node_exporter客户端 labels: app: node-exporter job: node 在grafana 中添加图表 1)开启alertmanager配置告警规则 prometheus 主配置文件配置定义子配置文件路径 rule_files: - "rules/*.yml" 2...
Prometheus 的安装和配置不做赘述,配置可以看这里[2]。下面简单看下几个常用规则 主机和硬件资源 主机和硬件资源的告警依赖 node-exporter[3] 输出的指标。例如:内存不足 可用内存低于阈值 10% 就会触发告警。- alert:HostOutOfMemory expr: node_memory_MemAvailable_bytes / node_memory_MemTotal_bytes *100...
Prometheus 的安装和配置不做赘述,配置可以看这里[2]。下面简单看下几个常用规则 主机和硬件资源 主机和硬件资源的告警依赖 node-exporter[3] 输出的指标。例如: 内存不足 可用内存低于阈值10%就会触发告警。 代码语言:javascript 复制 -alert:HostOutOfMemory expr:node_memory_MemAvailable_bytes/node_memory_MemTot...
Prometheus 的安装和配置不做赘述,配置可以看这里[2]。下面简单看下几个常用规则 主机和硬件资源 主机和硬件资源的告警依赖 node-exporter[3] 输出的指标。例如: 内存不足 可用内存低于阈值 10% 就会触发告警。 - alert:HostOutOfMemoryexpr: node_memory_MemAvailable_bytes / node_memory_MemTotal_bytes *100<...