告警抑制
告警抑制用于配置告警之间的抑制关系。当某个告警发生时,可以抑制其他告警的产生,可以理解为“重要”告警抑制“不重要”告警的产生,例如一台服务器宕机产生的告警抑制这台服务器上其他服务产生的告警。
前置条件
- 正确配置分组收敛规则
抑制规则配置
- 抑制规则名称: 唯一标识抑制规则的名称;
- 源标签: 当告警包含这些标签时,将会抑制目标告警,支持添加多个标签;
识别“重要”告警的标签,告警标签需要包含全部源标签才会抑制被目标标签标记的告警。
- 目标标签: 匹配这些标签的告警将被抑制;
识别“不重要”告警的标签,告警标签需要包含全部目标标签才会被抑制。
- 相等标签: 判断告警相关性的标签。支持最多10个标签;
- 启用状态: 启用或禁用该抑制规则。
示例
场景: 使用 Hertzbeat 监控 两个 Centos 服务器 192.168.1.1 和 192.168.1.2,和部署在两个服务器上的 Redis 服务 Redis-1 和 Redis-2。 并配置如下阈值规则:
- 监控 Centos Linux /监控可用性。绑定标签
server-status:down
- 监控 Redis数据库 /监控可用性。绑定标签
redis-status:down
如果需要实现当Centos 宕机告警产生后,Redis 告警不再产生,则可以配置如下告警抑制规则:
- 源标签:
server-status:down
- 目标标签:
redis-status:down
- 相等标签:
instancehost
当 Centos 192.168.1.1 宕机告警产生时,通知Redis-1 不可用的告警将不再产生。且同时 Centos 192.168.1.2 运行正常且 Redis-2 不可用时,通知 Redis-2 不可用的告警将正常产生。