Promethus之AlertManager介绍

  • 时间:
  • 浏览:9

receiver:指定接收端,可以 理解为出理 法律土办法。

group_wait:分组聚合时间窗口,当第一个多多多新分组开始了了了到发送告警的等待,系统会将这段时间的同组告警合并为二根。

一个多多多很糙典型的应用场景:当某核心服务或组件故障,可能引发成百上千的同类型告警,此时你這個分组聚合,就会使告警通知有效减少,使告警通知保持清晰,有效。

分组操作主却说应用于将同一类告警归集为一个多多多告警通知中,

不支持历史存储,只存储告警快照

(1)告警情况报告快照,未恢复的告警。存储周期可以 配置,默认120小时

具体行态如下:

resolved:endsAt不为空且大于当前时间

group_interval :同一分组的告警发送间隔,可能分组1可能成功发送了,后后 的告警也还属于分组1,则等待你這個间隔时间后再发送。

根节点:router,根节点。父节点所有属性可以 被子节点继承,一些根节点的属性至少 全局默认属性。

alert概念

这里先简单介绍下AlertManager中对告警的概念和情况报告描述。告警对应一个多多多告警事件,包括告警名称,告警时间,告警情况报告以及一些告警完全说明(自定义),其描述行态如下:

告警情况报告:

firing和resolved,你這個值是manager根据收到了alert行态来自行判断并赋值的,manager是为何判断firing呢?

流程控制:

告警唯一标识:

唯一标识为labels所有项组合起来计算得到的一个多多多指纹信息,一些可以 认为labels组却说一个多多多唯一标识。他来进行告警合并和更新告警情况报告。

(2)告警静音情况报告。

firing: endsAt为空,可能当前时间小于等于endsAt时为告警。

每个router可以 富含以下属性

存储周期由静音规则配置。

参考代码如下:

子节点:routers,子节点可以 是0个或多个,子节点可以 单独配置属性以覆盖父节点的属性。

group by:指定分组法律土办法哪个label,可以 是多个以逗号隔开。

分组还有一个多多多参数:

路由可以 是一个多多多树形行态,通过你這個行态可以 灵活的配置一个多多多告警的流转路径。

参考代码如下: