group_by: ['alertname'] #通过alertname(告警名称)的值对告警进行分类 group_wait: 10s #监控项第一次告警时的等待时间 group_interval: 10s #监控项恢复复第二次告警,那么告警间隔5分钟再发 repeat_interval: 5m #在最终发送消息前再等待5分钟, 5分钟后还没有恢复就发送第二次告警 实际每次告警间隔时间为...
group_by: ['alertname'] //定义分组,根据label标签进行分组 group_wait: 10s //分组等待时间,也就是说在10秒内同一个组中有没有一起报警的,如果有则同时发出报警邮件,也就是有2个报警同时发在一个邮件 group_interval: 10s //告警时间间隔 repeat_interval: 10m //重复告警间隔,也就是触发的一个告警在...
route:group_by: ['env','instance','type','group','job','alertname','cluster'] # 报警分组 group_wait: 5s # 在组内等待所配置的时间,如果同组内,5秒内出现相同报警,在一个组内出现。group_interval: 1m # 如果组内内容不变化,合并为一条警报信息,2m后发送。 repeat_interval: 2m # 发送报警间...
配置文件内容:global: resolve_timeout: 2m smtp_smarthost: 'smtp.qq.com:465' smtp_from: your@qq.com smtp_auth_username: your@qq.com smtp_auth_password: 授权码templates: - /etc/alertmanager/template/*.tmplroute: group_by: - alertname_wechat group_wait: 10s group_interval...
group_by: [alertname] group_wait: 10s group_interval: 10s repeat_interval: 10m receiver: 'default-receiver' routes: #子路由 - receiver: cluster1 group_wait: 10s match_re: #正则匹配 severity: critical #critical等级的告警发送到cluster1的接收方 ...
生产中使用webhook对历史告警进行统计时发现,有些resolved消息没有对应的firing消息、有些的firing消息没有对应的resolved消息、有些resolved消息发送了多次、有些firing消息没有按照repeat_interval间隔重复且短时间内发送了多次。这些问题主要由group_wait和group_interval两个参数引起。
本文中,我们的测试主要来验证AlertManager中Group的机制,以及的三个配置参数的效果:group_wait、group_interval、repeat_interval。 (1)测试选择post,然后输入http://ip/api/v2/alerts 测试:http://192.168.5.128:9093/api/v2/alerts (2)选择json格式
当第一条告警经过 group_wait 时间之后,Alertmanager 会每隔 group_interval 时间检查一次这条告警,判断是否需要对这条告警进行一些操作,当 Alertmanager 经过 n 次 group_interval 的检查后,n*group_interval 恰好大于 repeat_interval 的时候,Alertmanager 才会将这条告警再次发送给对应的 receiver。
smtp_require_tls: false # 是否使用 tlstemplates: # # 模板- '/opt/alertmanager/alert.tmp' #这个文件主要是定义发送的邮件的格式route:group_by: ['alertname'] #分组依据,group_wait: 30sgroup_interval: 5mrepeat_interval: 1hreceiver: 'email' #所有告警先找总路由,这段是接收人,是电子邮件。
global:resolve_timeout: 5msmtp_from: 'xxx@xxx.com'smtp_smarthost: 'smtp.exmail.qq.com:465'smtp_auth_username: smtp_auth_password: 'xxx'smtp_require_tls: falsesmtp_hello: 'Alert'templates:- 'template/*.tmpl'route:group_by: ['alertname']group_wait: 10sgroup_interval: 10srepeat_interval:...