跳到主要内容
版本:v1.7.x

告警中心

告警中心是一个展示平台,用于显示所有经过分组、收敛、抑制、静默等处理的告警,包括由内部系统阈值触发的告警和第三方接入告警。

告警来源

HertzBeat 的告警中心管理来自两个主要来源的告警:

  1. 系统内部阈值触发的告警
    • 当监控指标超过预定义阈值时生成
    • 与系统中配置的监控任务和阈值规则直接相关
    • 可以通过调整监控任务和阈值设置进行控制
  2. 第三方接入告警
    • 通过 API 接口从外部系统接收
    • 支持与其他监控系统或告警平台集成
    • 与内部告警一样经过相同的处理流程

告警处理机制

在显示到告警中心之前,所有告警都会经过几个处理步骤:

  1. 分组
    • 基于来源、类型、严重程度和其他属性(标签)对相关告警进行分类
    • 帮助高效管理大量告警
    • 支持针对不同场景的自定义分组规则
  2. 收敛
    • 减少短时间内发生的多个类似告警产生的干扰
    • 以更简洁的方式呈现收敛后的告警,避免信息冗余
  3. 抑制
    • 处理告警之间的依赖关系
    • 当关键告警触发时,可以抑制相关的次要告警
    • 支持配置定义告警依赖关系的抑制规则
  4. 静默
    • 在特定时间段内暂时屏蔽某些告警
    • 适用于系统维护、已知问题处理等场景
    • 可以基于时间设置静默规则

告警中心界面

alarm_center

告警中心提供了系统所有告警的全面视图:

  1. 告警显示
    • 列出所有告警,包含告警状态、来源、标签和时间等关键信息
    • 提供详细视图功能,显示完整的告警信息和上下文
  2. 搜索功能
    • 帮助快速定位特定告警
    • 支持多种搜索(标签、注解、告警状态等)
  3. 告警管理
    • 告警删除:移除不再需要关注的告警