3.1 修改alertmanager的配置文件 [root@alertmanager44~]# cat /yinzhengjie/softwares/alertmanager-0.27.0.linux-amd64/alertmanager.ymlroute:group_by:['alertname']group_wait:30sgroup_interval:5mrepeat_interval:1hreceiver:'web.hook'receivers:-name:'web.hook'webhook_configs:-url:'http://10.0.0.41:8888...
而group_interval配置,则用于定义相同的Group之间发送告警通知的时间间隔。 例如,当使用Prometheus监控多个集群以及部署在集群中的应用和数据库服务,并且定义以下的告警处理路由规则来对集群中的异常进行通知。 route: receiver: 'default-receiver' group_wait: 30s group_interval: 5m repeat_interval: 4h group_by: [...
查看你的告警路由树,https://www.prometheus.io/webtools/alerting/routing-tree-editor/, ##将alertmanager.yml配置文件复制到对话框,然后点击"Draw Routing Tree" route: group_by: ['env','instance','type','group','job','alertname','cluster'] ##用于分组聚合,对告警通知按标签(label)进行分组,将具...
# 当第一个报警发送后,等待'group_interval'时间来发送新的一组报警信息。group_interval:5m # 如果一个报警信息已经发送成功了,等待'repeat_interval'时间来重新发送他们repeat_interval:5m # 默认的receiver:如果一个报警没有被一个route匹配,则发送给默认的接收器receiver:default# 上面所有的属性都由所有子路由继...
route: group_by: ['alertname'] receiver: 'web.hook' receivers: - name: 'web.hook' webhook_configs: - url: 'http://127.0.0.1:5001/' 如上所示:在Alertmanager配置文件中,我们只定义了一个路由,那就意味着所有由Prometheus产生的告警在发送到Alertmanager之后都会通过名为web.hook 的receiver接收。这里...
route: #配置路由树 receiver: # 接收组名,对于不同级别的告警,我们可能多个完全不同的接收组进行处理。 group_by: []# 根据label标签的key进行匹配,如果是多个,就要多个都匹配 continue: false # 告警是否去继续路由子节点 match: [labelname:labelvalue,labelname1,labelvalue1] # 通过标签去匹配这次告警是否...
route: group_by: [alertname] group_wait: 10s group_interval: 10s repeat_interval: 10m receiver: 'default-receiver' routes: #子路由 - receiver: cluster1 group_wait: 10s match_re: #正则匹配 severity: critical #critical等级的告警发送到cluster1的接收方 ...
smtp_require_tls: false # 是否使用 tlstemplates: # # 模板- '/opt/alertmanager/alert.tmp' #这个文件主要是定义发送的邮件的格式route:group_by: ['alertname'] #分组依据,group_wait: 30sgroup_interval: 5mrepeat_interval: 1hreceiver: 'email' #所有告警先找总路由,这段是接收人,是电子邮件。
global:resolve_timeout: 5msmtp_from: 'xxx@xxx.com'smtp_smarthost: 'smtp.exmail.qq.com:465'smtp_auth_username: smtp_auth_password: 'xxx'smtp_require_tls: falsesmtp_hello: 'Alert'templates:- 'template/*.tmpl'route:group_by: ['alertname']group_wait: 10sgroup_interval: 10srepeat_interval:...
设置的第一个route为根节点,后面包含的节点为子节点 route: # 对报警进行分组,将多个相似告警合并为一个组,减少重复报警 group_by: ['cluster,alertname'] # 从接收告警到发送告警的等待时间,时间段内告警会合并一个通知,默认30s group_wait: 30s # 相同的group之间发送告警的时间间隔,默认5分钟 group_interval...