

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 经典控制面板警报
<a name="old-alerts-overview"></a>

****  
本文档主题讨论了 Grafana 中的传统警报。未来版本的 Amazon Managed Grafana 将不支持此功能。您可以迁移到 Grafana Alerting 以使用最新的警报功能。有关更多信息，请参阅下列主题之一。  
对于支持 Grafana 10.x 版本的 Grafana 工作区，请参阅[Grafana 10 版本中的警报](v10-alerts.md)。  
对于支持 Grafana 9.x 版本的 Grafana 工作区，请参阅[Grafana 9 版本中的警报](v9-alerts.md)。  
对于支持 Grafana 8.x 版本的 Grafana 工作区，请参阅[Grafana Alerting](alerts-overview.md)。

**注意**  
本节介绍了 Grafana 中的经典控制面板警报系统。要了解有关迁移到和使用新 Grafana Alerting 的信息（该提醒旨在查看 Prometheus Alertmanager 警报以及 Grafana 警报），请参阅 [Grafana 10 版本中的警报](v10-alerts.md)。  
GrafanaLabs 已宣布移除 Grafana 版本 11 中的经典仪表板警报。

 经典控制面板警报由两个部分组成：
+  警报规则：触发警报的时间。警报规则由 Grafana 定期评估的一个或多个条件定义。
+  通知渠道：警报的发送方式。当满足警报规则的条件时，Grafana 会通知为该警报配置的渠道。

 当前，只有图形面板可视化支持警报。

## 警报配置
<a name="old-alert-tasks"></a>

您可以在您的 Amazon Managed Grafana 工作区中配置警报。
+  添加或编辑警报通知渠道。有关更多信息，请参阅 [通知](#old-notifications)。
+  创建一个警报规则。有关更多信息，请参阅 [创建警报](old-create-alerts.md)。
+  查看现有警报规则及其当前状态。有关更多信息，请参阅 [查看现有警报规则](old-view-existing-alert-rules.md)。
+  测试警报规则并进行故障排除。有关更多信息，请参阅 [警报问题故障排除](old-troubleshoot-alerts.md)。

## Clustering
<a name="old-clustering"></a>

 目前，警报支持的高可用性形式有限。当您运行多个工作区时，会对警报通知进行重复数据删除。这意味着所有警报都在每台服务器上运行，但由于重复数据删除逻辑，不会发送重复的警报通知。

## 通知
<a name="old-notifications"></a>

 您可以创建包含详细消息的警报规则，包括如何解决问题、运行手册链接等信息。

 实际的通知是在多个警报之间配置和共享的。

## 警报执行
<a name="old-alert-execution"></a>

 警报规则在 Amazon Managed Grafana 的计划程序和查询执行引擎中进行评估。

# 警报通知
<a name="old-alert-notifications"></a>

****  
本文档主题讨论了 Grafana 中的传统警报。未来版本的 Amazon Managed Grafana 将不支持此功能。您可以迁移到 Grafana Alerting 以使用最新的警报功能。有关更多信息，请参阅下列主题之一。  
对于支持 Grafana 10.x 版本的 Grafana 工作区，请参阅[Grafana 10 版本中的警报](v10-alerts.md)。  
对于支持 Grafana 9.x 版本的 Grafana 工作区，请参阅[Grafana 9 版本中的警报](v9-alerts.md)。  
对于支持 Grafana 8.x 版本的 Grafana 工作区，请参阅[Grafana Alerting](alerts-overview.md)。

 当警报状态发生变化时，它会发出通知。每条警报规则可以有多个通知。要向警报规则添加通知，必须先添加和配置 `notification` 渠道。

 这是在“通知渠道”页面上完成的。

## 添加通知渠道
<a name="old-add-a-notification-channel"></a>

1.  在侧栏中，将鼠标悬停在**警报**（铃铛）图标上，然后选择**通知渠道**。

1.  选择**添加频道**。

1.  填写字段或选择以下各节中所述的选项。

## 新通知渠道字段
<a name="old-new-notification-channel-fields"></a>

### 默认（对所有警报发送）
<a name="old-default-send-on-all-alerts"></a>
+  **名称**：输入此渠道的名称。当用户向警报规则添加通知时，将显示该字段。
+  **类型**：选择渠道类型。有关更多信息，请参阅 [支持的通知程序列表](#old-list-of-supported-notifiers)。
+  **默认（对所有警报发送）**：选择此选项后，将在此渠道上发送所有警报规则的通知。
+  **禁用解决消息**：选择此选项后，将禁用警报状态恢复到 false 时发送的解决消息 [OK]。
+  **发送提醒**：选择此选项后，将为警报发送其他通知（提醒）。您可以使用秒数（s）、分钟数（m）或小时数（h）来指定发送提醒的频率；例如：`30s`、`3m`、`5m` 或 `1h`。

**重要**  
 在对规则进行评估后会发送警报提醒。因此，发送提醒的频率不能超过配置的警报规则评估间隔。

 以下示例显示了针对触发警报发送提醒的频率和时间。


|  警报规则评估间隔  |  发送提醒的间隔为  |  发送提醒的间隔为（在最后一次警报通知之后）  | 
| --- | --- | --- | 
|  30s  |  15s  |  \$130 秒  | 
|  1m  |  5m  |  \$15 分钟  | 
|  5m  |  15m  |  \$115 分钟  | 
|  6m  |  20m  |  \$124 分钟  | 
|  1h  |  15m  |  \$11 小时  | 
|  1h  |  2h  |  \$12 小时  | 

## 支持的通知程序列表
<a name="old-list-of-supported-notifiers"></a>


|  Name  |  Type  |  支持映像  |  支持警报规则标签  | 
| --- | --- | --- | --- | 
| [Amazon Simple Notification Service](#old-amazon-sns)  |  sns  |  否  |  是  | 
|  OpsGenie  |  opsgenie  |  否  |  是  | 
|  [PagerDuty](#old-pagerduty)  |  pagerduty  |  否  |  是  | 
|  [Slack](#old-slack)  |  slack  |  否  |  否  | 
|  VictorOps  |  victorops  |  否  |  否  | 

### Amazon Simple Notification Service
<a name="old-amazon-sns"></a>

如果您已启用服务托管的权限并将 Amazon SNS 作为工作区的通知渠道，则只需在创建通知渠道时提供 SNS 主题 ARN 即可。在**名称**字段中，提供您创建的 SNS 主题的名称。如果您使用服务托管的权限创建了工作区，则 SNS 主题名称必须以 `grafana` 为前缀，这样通知才能成功发布到该主题。如果您在创建工作区时选择了客户管理的权限，则 SNS 主题名称无需加前缀 `grafana`。

 在**主题**字段中，复制并粘贴 SNS 主题的 ARN。在**消息正文格式**中，您可以选择 JSON 或文本选项。

在 “**可选 AWS SNS 设置”** 字段中，选中 “在邮件**中包含所有标签” 复选框以查看邮件**正文中的所有 Grafana 标签。

如果您使用工作区的客户管理权限，则您提供的 IAM 角色应包括针对您的 SNS 主题的 SNS 发布权限。

### Slack
<a name="old-slack"></a>

 要设置 Slack，您必须配置传入的 Slack Webhook URL。有关详细信息，请参阅[使用传入 Webhook 发送消息](https://api.slack.com/incoming-webhooks)。

有关设置 Slack 自动程序集成的详细信息，请参阅[按照 Slack 的指南设置自动程序集成](https://api.slack.com/bot-users)。使用提供的以 "xoxb" 开头的令牌。


|  设置  |  说明  | 
| --- | --- | 
|  URL  |  Slack 的传入 Webhook URL，或者最终是 [chat.postMessage](https://api.slack.com/methods/chat.postMessage) Slack API 端点。 | 
|  用户名  |  设置自动程序消息的用户名。 | 
|  收件人  |  使用它来覆盖 Slack 收件人。您必须提供渠道 Slack ID、用户 Slack ID、用户名引用（@<user>，全部为小写，没有空格）或渠道引用（\$1<channel>，全部为小写，没有空格）。如果您使用 chat.postMessage Slack API 端点，则这是必需的。 | 
|  图标表情符号  |  提供一个表情符号作为自动程序消息的图标。例如，:smile： | 
|  图标 URL  |  提供图像的 URL 作为自动程序消息的图标。 | 
|  提及用户  |  （可选）在 Grafana 发送的 Slack 通知中提及一个或多个用户。要通过对应的 Slack 查看以逗号分隔的用户 IDs，请选择每个用户的 Slack 个人资料上的溢出按钮。 | 
|  提及群组  |  （可选）在 Grafana 发送的 Slack 通知中提及一个或多个组。你可以通过相应的 Slack 查看以逗号分隔的群组 IDs （你可以从每个群组的 Slack 个人资料网址中获取）。 | 
|  提及渠道  |  （可选）提及所有渠道成员或仅提及活跃的渠道成员。 | 
|  令牌  |  如果提供，Amazon Managed Grafana 将通过 Slack file.upload API 操作上传生成的图像，而不是外部图像目标。如果您使用 chat.postMessage Slack API 端点，则这是必需的。 | 

 如果您将令牌用于 Slack 自动程序，则必须邀请该自动程序加入您要发送通知的渠道。然后将渠道添加到收件人字段。

### PagerDuty
<a name="old-pagerduty"></a>

 要进行设置 PagerDuty，请提供集成密钥。


|  设置  |  说明  | 
| --- | --- | 
|  集成密钥  |  的集成密钥 PagerDuty。 | 
|  严重性  |  动态通知的级别；默认为 critical（1）。 | 
|  自动解决事件  |  警报恢复为 “正常” 后再解决事件。 PagerDuty  | 
|  详细消息  |  从 PD 摘要字段中移除警报消息，改为将其放到自定义详细信息中（2）。 | 

**注意**  
 标签`Severity`、、`Class``Group``dedup_key`、和在[PagerDuty通用事件格式（PD-](https://support.pagerduty.com/docs/pd-cef) CEF）中`Component`具有特殊含义。如果警报面板定义了这些标签键，则它们将被移植到发送到的事件的根目录。 PagerDuty这意味着它们将在 PagerDuty 用户界面和筛选工具中可用。在警报上设置的严重性标签的级别有效，它会覆盖通知渠道上设置的全局严重性。

**注意**  
 使用 Message In Details 将更改 PagerDuty 事件中`custom_details`字段的结构。如果您依赖中的字段，这可能会破坏 PagerDuty 规则中的自定义事件规则`payload.custom_details`。将使用 `custom_details.myMetric` 的所有现有规则移至 `custom_details.queries.myMetric`。

**注意**  
 使用 `dedup_key` 标签将覆盖 Grafana 使用自定义密钥生成的 `dedup_key`。

## 配置从警报通知返回 Grafana 的链接
<a name="old-configure-the-link-back-to-grafana-from-alert-notifications"></a>

 所有警报通知都包含指向 Grafana 工作区中触发的警报的链接。

# 创建警报
<a name="old-create-alerts"></a>

****  
本文档主题讨论了 Grafana 中的传统警报。未来版本的 Amazon Managed Grafana 将不支持此功能。您可以迁移到 Grafana Alerting 以使用最新的警报功能。有关更多信息，请参阅下列主题之一。  
对于支持 Grafana 10.x 版本的 Grafana 工作区，请参阅[Grafana 10 版本中的警报](v10-alerts.md)。  
对于支持 Grafana 9.x 版本的 Grafana 工作区，请参阅[Grafana 9 版本中的警报](v9-alerts.md)。  
对于支持 Grafana 8.x 版本的 Grafana 工作区，请参阅[Grafana Alerting](alerts-overview.md)。

 当您使用 Amazon Managed Grafana Alerting 时，您可以将规则附加到控制面板的面板中。当您保存控制面板时，Amazon Managed Grafana 会将警报规则提取到单独的警报规则存储中，并安排对它们进行评估。

 在图形面板的**警报**选项卡上，您可以配置评估警报规则的频率以及警报更改状态和启动其通知所必须满足的条件。

 当前，只有图形面板支持警报规则。

## 添加或编辑警报规则
<a name="old-add-or-edit-an-alert-rule"></a>

1.  导航到添加或编辑警报规则的面板，选择标题，然后选择**编辑**。

1.  在**警报**选项卡上，选择**创建警报**。如果此面板已存在警报，则可以编辑**警报**选项卡上的字段。

1.  填写以下字段。有关更多信息，请参阅 [警报规则字段](#old-alert-rule-fields)。

1.  编写完规则后，选择右上角的**保存**以保存警报规则和控制面板。

1.  （可选，但建议使用）要确保规则返回预期的结果，请选择**测试规则**。

## 删除警报规则
<a name="old-delete-an-alert"></a>

 要删除警报，请滚动到警报底部，然后选择**删除**。

## 警报规则字段
<a name="old-alert-rule-fields"></a>

 本节介绍创建警报需要填写的字段。

### 规则
<a name="old-rule"></a>
+  **名称**：请输入描述性名称。该名称将显示在**警报规则**列表中。
+  **评估每项**：指定调度程序应评估警报规则的频率。这称为*评估间隔*。
+  **时长**：指定查询在触发警报通知之前必须超过配置阈值的时长。

**警告**  
请勿在 `If no data or all values are null` 设置为 `No Data` 的情况下使用 `For`。`No Data` 的触发将立即发生，而不考虑 `For`。如果警报从 `No Data -> Pending -> OK` 中转换，这也可能导致不发送“确认”通知。

 如果警报规则中配置了 `For`，但查询违反了配置的阈值，则它将首先从 `OK` 变为 `Pending`。从 `OK` 到 `Pending` 的过程中，Amazon Managed Grafana 不发送任何通知。当警报规则的触发时间超过 `For` 持续时间时，它将更改为 `Alerting` 并发送警报通知。

 通常，我们建议使用此设置，因为获得误报通常比等待几分钟才启动警报通知的结果更糟。查看 `Alert list` 或 `Alert list panels` 使您能够看到处于待处理状态的警报。

### Conditions
<a name="old-conditions"></a>

 当前，唯一现有的条件类型是 `Query` 条件，允许您指定查询字母、时间范围和聚合函数。

#### 查询条件示例
<a name="old-query-condition-example"></a>

```
avg() OF query(A, 15m, now) IS BELOW 14
```
+  `avg()` 控制如何将**每个**序列的值减少到可以与阈值进行比较的值。选择该函数将其更改为另一个聚合函数。
+  `query(A, 15m, now)` 字母定义了要从**指标**选项卡运行的查询。后两个参数定义了时间范围：`15m, now` 表示 15 分钟前到现在。您也可以使用 `10m, now-2m` 来定义 10 分钟前到 2 分钟前的时间范围。如果您想忽略前两分钟的数据，则此操作会很有用。
+  `IS BELOW 14` 定义阈值的类型和阈值。您可以选择 `IS BELOW` 来更改阈值的类型。

 警报规则中使用的查询不能包含任何模板变量。目前，我们仅支持在条件之间使用 `AND` 和 `OR` 运算符，并且它们按串行的方式运行。例如，我们有三个按以下顺序排列的条件：*condition:A(evaluates to: TRUE) OR condition:B(evaluates to: FALSE) AND condition:C(evaluates to: TRUE)*，因此计算得到的结果为 ((TRUE OR FALSE) AND TRUE) = TRUE。

#### 多个序列
<a name="old-multiple-series"></a>

 如果查询返回多个序列，则将评估每个序列的聚合函数和阈值检查。目前，Amazon Managed Grafana 不会对**每个序列**的警报规则状态进行跟踪。以下场景详细说明了其影响。
+  带有返回以下两个序列的查询的警报条件：**server1** 和 **server2**。
+  **server1** 序列会导致触发警报规则并切换到状态 `Alerting`。
+  发送通知时会显示以下消息：*负载达到峰值（server1）* 
+  在同一警报规则的后续评估中，**server2** 序列还会导致警报规则触发。
+  由于警报规则已处于状态 `Alerting`，因此不会发送任何新通知。

从前面的场景中可以看出，如果规则已经处于状态 `Alerting`，那么当其他序列导致警报触发时，Grafana 不会发送通知。

**注意**  
 您可以将提醒配置为针对触发的警报发送。当警报继续触发时，此配置将发送额外通知。如果其他序列（例如上一个示例中的 server2）也导致警报规则触发，则它们将包含在提醒通知中。根据您使用的通知渠道，您可以利用此功能来识别导致警报触发的新序列或现有序列。

### 没有数据和错误处理
<a name="old-no-data-error-handling"></a>

 下表包含的条件用于控制规则评估引擎如何处理不返回任何数据或仅返回空值的查询。


|  无数据选项  |  说明  | 
| --- | --- | 
|  无数据  |  将警报规则状态设置为 NoData。 | 
|  警报  |  将警报规则状态设置为 Alerting。 | 
|  保留上一状态  |  不管当前警报规则状态如何，都保持当前的状态。 | 
|  确定  | 支持，但通常没有用。 | 

### 执行错误或超时
<a name="old-execution-errors-or-timeouts"></a>

 以下选项告诉 Amazon Managed Grafana 如何处理执行或超时错误。


|  错误或超时选项  |  说明  | 
| --- | --- | 
|  警报  |  将警报规则状态设置为 Alerting。 | 
|  保留上一状态  |  不管当前警报规则状态如何，都保持当前的状态。 | 

 如果您有一个不可靠的时间序列存储，其中查询有时会超时或随机失败，则可以将此选项设置为 `Keep Last State` 以基本上忽略它们。

## 通知
<a name="old-alert-notifications-1"></a>

 在**警报**选项卡上，您还可以指定警报规则通知和有关警报规则的详细消息。该消息可以包含有关如何解决问题以及运行手册的链接等任何信息。

 实际的通知是在多个警报之间配置和共享的。有关如何配置和设置通知的信息，请参阅 [警报通知](old-alert-notifications.md)。
+  **发送至**：如果您已设置警报通知渠道，请选择该渠道。
+  **消息**：输入要在通知渠道上发送的文本消息。某些警报通知器支持将文本转换为 HTML 或其他丰富格式。
+  **标签**：指定要包含在通知中的标签（键值）列表。只有一些通知程序支持标签。

## 警报状态历史记录和注释
<a name="old-alert-state-history-and-annotations"></a>

 警报状态更改记录在 Amazon Managed Grafana 数据库的内部注释表中。状态变化在警报规则的图形面板中以注释的形式可视化。您也可以进入**警报**选项卡上的 `State history` 子菜单来查看和清除状态历史记录。

# 暂停警报规则
<a name="old-pause-an-alert-rule"></a>

****  
本文档主题讨论了 Grafana 中的传统警报。未来版本的 Amazon Managed Grafana 将不支持此功能。您可以迁移到 Grafana Alerting 以使用最新的警报功能。有关更多信息，请参阅下列主题之一。  
对于支持 Grafana 10.x 版本的 Grafana 工作区，请参阅[Grafana 10 版本中的警报](v10-alerts.md)。  
对于支持 Grafana 9.x 版本的 Grafana 工作区，请参阅[Grafana 9 版本中的警报](v9-alerts.md)。  
对于支持 Grafana 8.x 版本的 Grafana 工作区，请参阅[Grafana Alerting](alerts-overview.md)。

 暂停对警报规则的评估有时会很有用。例如，在维护时段内，暂停警报规则可以避免发起大量警报。

1.  在 Grafana 侧栏中，将鼠标悬停在**警报**（铃铛）图标上，然后选择**警报规则**。将列出所有已配置的警报规则及其当前状态。

1.  在列表中找到您的警报，然后选择右侧的**暂停**图标。**暂停**图标将变成**播放**图标。

1.  选择**播放**图标以恢复对警报的评估。

# 查看现有警报规则
<a name="old-view-existing-alert-rules"></a>

****  
本文档主题讨论了 Grafana 中的传统警报。未来版本的 Amazon Managed Grafana 将不支持此功能。您可以迁移到 Grafana Alerting 以使用最新的警报功能。有关更多信息，请参阅下列主题之一。  
对于支持 Grafana 10.x 版本的 Grafana 工作区，请参阅[Grafana 10 版本中的警报](v10-alerts.md)。  
对于支持 Grafana 9.x 版本的 Grafana 工作区，请参阅[Grafana 9 版本中的警报](v9-alerts.md)。  
对于支持 Grafana 8.x 版本的 Grafana 工作区，请参阅[Grafana Alerting](alerts-overview.md)。

 Amazon Managed Grafana 将各个警报规则存储在定义警报规则的面板中，但您也可以查看所有现有警报规则及其当前状态的列表。

 在 Grafana 侧栏中，将鼠标悬停在**警报**（铃铛）图标上，然后选择**警报规则**。将列出所有已配置的警报规则及其当前状态。

 查看警报时，您可以执行以下操作：
+  **按名称筛选警报**：在**搜索警报**字段中键入警报名称。
+  **按状态筛选警报**：在**状态**中，选择要查看的警报状态。所有其他内容都将隐藏。
+  **暂停或恢复警报**：选择警报旁边的**暂停**或**播放**图标可暂停或恢复评估。
+  **访问警报规则设置**：选择警报名称或**编辑警报规则**（齿轮）图标。Amazon Managed Grafana 会打开定义警报规则的面板的**警报**选项卡。这在警报触发时很有用，但您不知道警报是在哪个面板中定义的。

# 通知模板化
<a name="old-alerts-notification-templating"></a>

****  
本文档主题讨论了 Grafana 中的传统警报。未来版本的 Amazon Managed Grafana 将不支持此功能。您可以迁移到 Grafana Alerting 以使用最新的警报功能。有关更多信息，请参阅下列主题之一。  
对于支持 Grafana 10.x 版本的 Grafana 工作区，请参阅[Grafana 10 版本中的警报](v10-alerts.md)。  
对于支持 Grafana 9.x 版本的 Grafana 工作区，请参阅[Grafana 9 版本中的警报](v9-alerts.md)。  
对于支持 Grafana 8.x 版本的 Grafana 工作区，请参阅[Grafana Alerting](alerts-overview.md)。

警报通知模板功能允许您从警报查询中获取标签值并将该值注入警报通知中。

警报查询评估中存在的标签可用于警报规则名称和警报通知消息字段。当警报处于警报状态时，警报标签数据将注入到通知字段中。当同一个标签有多个唯一值时，这些值以逗号分隔。

**要将警报标签数据添加到警报通知中**

1. 导航到要为其添加或编辑警报规则的面板。

1. 选择面板标题并选择**编辑**。

1. 在**警报**选项卡上，选择**创建警报**。如果已存在此面板的警报，您可以直接编辑警报。

1. 使用 `${Label}` 语法查看警报规则名称或警报通知消息字段中的警报查询标签。有关警报查询标签的更多信息，请参阅 Grafanaa 文档中的[消息模板](https://grafana.com/docs/grafana/v8.4/alerting/unified-alerting/message-templating/)。

1. 在右上角，选择**保存**。

# 警报问题故障排除
<a name="old-troubleshoot-alerts"></a>

****  
本文档主题讨论了 Grafana 中的传统警报。未来版本的 Amazon Managed Grafana 将不支持此功能。您可以迁移到 Grafana Alerting 以使用最新的警报功能。有关更多信息，请参阅下列主题之一。  
对于支持 Grafana 10.x 版本的 Grafana 工作区，请参阅[Grafana 10 版本中的警报](v10-alerts.md)。  
对于支持 Grafana 9.x 版本的 Grafana 工作区，请参阅[Grafana 9 版本中的警报](v9-alerts.md)。  
对于支持 Grafana 8.x 版本的 Grafana 工作区，请参阅[Grafana Alerting](alerts-overview.md)。

 如果警报的行为不符合您的预期，则以下步骤可以帮助您进行故障排除并找出问题所在。

 您可以做的第一级故障排除是选择**测试规则**。您可以将结果扩展到可以看到从查询返回的原始数据的程度。