本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
警报规则评估
本文档主题专为支持 Grafana 版本 12.x 的 Grafana 工作空间而设计。
对于支持 Grafana 10.x 版本的 Grafana 工作区,请参阅使用 Grafana 版本 10。
对于支持 Grafana 9.x 版本的 Grafana 工作区,请参阅使用 Grafana 版本 9。
对于支持 Grafana 8.x 版本的 Grafana 工作区,请参阅使用 Grafana 版本 8。
使用警报规则评估来确定评估警报规则的频率以及更改状态的速度。
为此,您需要确保警报规则位于正确的评估组中,并设置最适合用例的待处理时间段。
评估组
每个警报规则都是评估组的一部分。每个评估组都包含一个评估间隔,用于确定检查警报规则的频率。
Data-source 对同一组内的@@ 托管警报规则依次进行评估,而不同组中的警报规则可以同时进行评估。当您要确保在任何警报规则之前评估记录规则时,此功能特别有用。
Grafana-managed无论警报规则组如何,都会同时评估警报规则。默认评估间隔设置为 10 秒,这意味着每隔 10 秒评估一次 Grafana-managed 警报规则,直到时钟上最接近的 10 秒窗口,例如 10:00:00、10:00:10、10:00:10、10:00:20 等。如果需要,您还可以配置自己的评估间隔。
注意
通知策略中的评估组和警报分组是两个独立的东西。通知策略中的分组允许在同一时间消息中发送共享标签的多个警报。
待处理期
设置待处理期后,可以避免因临时问题而发出不必要的警报。
在待处理期,您可以选择警报规则在触发之前可以违反条件的时段。
示例
假设您将警报规则评估间隔设置为每 30 秒一次,将待处理期设置为 90 秒。
评估方式如下:
[00:30] 第一次评估 - 未满足条件。
[01:00] 第二次评估 - 违反条件。待处理计数器启动。警报开始待处理。
[01:30] 第三次评估 - 违反条件。待处理计数器 = 30 秒。待处理状态。
[02:00] 第四次评估 - 违反条件。待处理计数器 = 60 秒待处理状态。
[02:30] 第五次评估 - 违反条件。待处理计数器 = 90 秒。警报开始触发
如果警报规则有一个条件,需要在违反该条件一定时间后才能采取行动,则其状态将发生如下变化:
-
第一次违反条件时,规则将进入“待处理”状态。
-
规则一直处于“待处理”状态,直到在规定的时间(待处理期)内违反条件。
-
一旦过了规定的时间,规则就会进入“触发”状态。
-
如果在待处理期不再违反条件,规则就会恢复到正常状态。
注意
如果要跳过待处理状态,只需将待处理期设置为 0。这实际上跳过了待处理期,一旦违反条件,警报规则就会立即触发。
当警报规则触发时,会生成警报实例,然后发送到 Alertmanager。