

AWS Systems Manager Incident Manager 不再向新客户开放。现有客户可以继续正常使用该服务。有关更多信息，请参阅 [AWS Systems Manager Incident Manager 可用性变更](https://docs.aws.amazon.com/incident-manager/latest/userguide/incident-manager-availability-change.html)。

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 在 Incident Manager 中为事件做准备
<a name="incident-response"></a>

事件规划早在事件生命周期之前就已开始。如下图所示，在开始响应事件之前，您需要通过设置聊天频道、创建升级计划、指定联系人以及确定用于事件响应的自动化运行手册来做好准备。然后，使用响应计划来指定如何进行监控以及响应是否是自动进行的。修复完成后，您可以分析事件和事件响应，以进一步完善针对未来事件的响应计划。

![\[事件管理器工作流程，用于为事件做准备、响应和从中吸取教训。\]](http://docs.aws.amazon.com/zh_cn/incident-manager/latest/userguide/images/how-it-works.png)


**Topics**
+ [监控](#incident-response-monitoring)
+ [在事件管理器中配置复制集和查找结果](general-settings.md)
+ [在事件管理器中创建和配置联系人](contacts.md)
+ [在事件管理器中使用待命时间表管理响应者轮换](incident-manager-on-call-schedule.md)
+ [在事件管理器中为响应者参与制定升级计划](escalation.md)
+ [在事件管理器中为响应者创建和集成聊天频道](chat.md)
+ [将 Systems Manager 自动化运行手册集成到事件管理器中以进行事故补救](runbooks.md)
+ [在事件管理器中创建和配置响应计划](response-plans.md)
+ [在事件管理器中将来自其他服务的事件的潜在原因确定为 “调查结果”](findings.md)

## 监控
<a name="incident-response-monitoring"></a>

监控 AWS 托管应用程序的运行状况是确保应用程序正常运行时间和性能的关键。在确定监控解决方案时，请注意以下事项：
+ **特征的严重性**——如果系统发生故障，对下游用户的影响将有多严重。
+ **故障的共同性**——系统发生故障的频率；需要经常干预的系统应受到密切监控。
+ **延迟时间增加**——完成一项任务的时间增加或减少了多少。
+ **客户端指标与服务器端指标**——如果客户端和服务器上的相关指标之间存在差异。
+ **依赖性故障**——您的团队可以而且应该做好准备的故障。

创建响应计划后，您可以使用监控解决方案在环境中发生事件时自动跟踪事件。有关事件跟踪和创建的更多信息，请参阅 [在事件管理器控制台中查看事件详细信息](tracking.md)。

[有关构建安全、高性能、有弹性和高效的基础架构应用和工作负载的更多信息，请参阅 Well-Architected。AWS](https://aws.amazon.com/architecture/well-architected/)

# 在事件管理器中配置复制集和查找结果
<a name="general-settings"></a>

完成 “事件管理器做好准备” 向导后，您可以在 **“设置”** 页面上管理某些选项。这些选项包括您的复制集、应用于复制集的标签以及调查发现特征。

**Topics**
+ [配置事件管理器复制集](#replication)
+ [管理复制集的标签](#general-tags)
+ [管理调查发现特征](#settings-findings)

## 配置事件管理器复制集
<a name="replication"></a>

Incident Manager 复制集可将您的数据复制到多 AWS 区域 个，以便执行以下操作：
+ 增加跨区域冗余
+ 允许事件管理器访问不同区域的资源并减少用户的延迟。
+ 使用 AWS 托管式密钥 或您自己的客户托管密钥加密您的数据。

  默认情况下，所有 Incident Manager 资源均加密。要了解有关您的资源如何加密的更多信息，请参阅 [Incident Manager 中的数据保护](data-protection.md)。

要开始使用 Incident Manager，请先使用**做准备**向导创建您的复制集。要了解有关在 Incident Manager 中做准备的更多信息，请参阅 [准备向导](getting-started.md#getting-started-wizard)。

### 编辑复制集
<a name="replication-edit"></a>

通过使用 Incident Manager **设置**页面，您可以编辑您的复制集。您可以添加区域、删除区域以及启用或禁用复制集删除保护。您无法编辑用于加密数据的密钥。要更改密钥，请删除并重新创建复制集。

**添加区域**

1. 打开 [Incident Manager 控制台](https://console.aws.amazon.com/systems-manager/incidents/home)，然后从左侧导航窗格中选择**设置**。

1. 选择**添加区域**。

1. 选择**区域**。

1. 选择**添加**。

**删除区域**

1. 打开 [Incident Manager 控制台](https://console.aws.amazon.com/systems-manager/incidents/home)，然后从左侧导航窗格中选择**设置**。

1. 选择要删除的区域。

1. 选择**删除**。

1. 在文本框中输入**删除**，然后选择**删除**。

### 删除复制集
<a name="replication-delete"></a>

删除复制集中的最后一个区域会删除整个复制集。在删除最后一个区域之前，请先在 “**设置”** 页面上关闭**删除保护**，以禁用删除保护。删除复制集后，您可以使用**做准备**向导创建新的复制集。

要从复制集中删除区域，请在创建该区域后等待 24 小时。在创建后 24 小时内尝试从复制集删除区域会导致删除失败。

删除复制集会删除所有 Incident Manager 数据。

**删除复制集**

1. 打开 [Incident Manager 控制台](https://console.aws.amazon.com/systems-manager/incidents/home)，然后从左侧导航窗格中选择**设置**。

1. 在复制集中选择最后一个区域。

1. 选择**删除**。

1. 在文本框中输入**删除**，然后选择**删除**。

## 管理复制集的标签
<a name="general-tags"></a>

标签是您分配给资源的可选元数据。使用标签按不同的方式（如用途、拥有者或环境）对资源进行分类。

**要管理复制集的标签**

1. 打开 [Incident Manager 控制台](https://console.aws.amazon.com/systems-manager/incidents/home)，然后从左侧导航窗格中选择**设置**。

1. 在**标签** 部分中，选择**编辑**。

1. 要添加标签，请执行以下操作：

   1. 选择**添加新标签**。

   1. 输入标签的密钥和可选值。

   1. 选择**保存**。

1. 要删除标签，请执行以下操作：

   1. 在要删除的标签的下面，选择**删除**。

   1. 选择**保存**。

## 管理调查发现特征
<a name="settings-findings"></a>

调查发现特征可帮助组织中的响应者在事件开始后立即识别事件的潜在根本原因。目前，事件管理器提供 AWS CodeDeploy 部署和 AWS CloudFormation 堆栈更新的调查结果。

对于跨账户支持调查发现，在启用该特征后，您必须在组织中的每个应用程序账户中完成额外的设置步骤。

要使用该特征，您可以让 Incident Manager 创建一个服务角色，该角色包含代表您访问数据所需的权限。

**要启用调查发现特征**

1. 打开 [Incident Manager 控制台](https://console.aws.amazon.com/systems-manager/incidents/home)，然后从左侧导航窗格中选择**设置**。

1. 在**调查发现**区域中，选择**创建服务角色**。

1. 

   查看要创建的服务角色的相关信息，然后选择**创建**。

**要禁用调查发现特征**

要停止使用调查发现特征，请从创建 `IncidentManagerIncidentAccessServiceRole` 角色的每个账户中删除该角色。

1. 使用 [https://console.aws.amazon.com/iam/](https://console.aws.amazon.com/iam/) 打开 IAM 控制台。

1. 在左侧导航窗格中，选择**角色**。

1. 在搜索框中，输入 **IncidentManagerIncidentAccessServiceRole**。

1. 选择角色的名称，然后选择**删除**。

1. 在对话框中输入角色的名称，确认要删除角色，然后选择**删除**。

# 在事件管理器中创建和配置联系人
<a name="contacts"></a>

AWS Systems Manager Incident Manager 联系人是事件的响应者。Incident Manager 在事件发生期间可以通过多个渠道与联系人互动。您可以定义联系人的互动计划，描述 Incident Manager 与联系人互动的方式和时间。

**Topics**
+ [联系人渠道](#contacts-channels)
+ [互动计划](#contacts-engage)
+ [创建联系人](#contacts-define)
+ [将联系人详细信息导入您的通讯录](#contacts-details-file)

## 联系人渠道
<a name="contacts-channels"></a>

联系渠道是 Incident Manager 用于与联系人互动的各种方法。

Incident Manager 支持以下联系渠道：
+ 电子邮件
+ 短信服务 (SMS) 
+ 语音

**联系人渠道激活**  
为了保护您的隐私和安全，Incident Manager 会在您创建联系人时向您发送设备激活码。要在事件发生期间使用您的设备，必须先将其激活。为此，请在创建联系人页面输入设备激活码。

Incident Manager 的某些特征包括向联系人渠道发送通知的功能。使用这些特征，即表示您同意本服务向指定工作流程中的联系人渠道发送有关服务中断或其他事件的通知。这包括作为待命时间表轮换的一部分发送给联系人的通知。通知可根据联系人的详细信息，通过电子邮件、短信或语音电话发送。通过使用这些特征，您确认自己有权将您提供的联系人渠道添加到Incident Manager 中。

**选择退出**  
您可以随时取消这些通知，方法是删除移动设备作为联系人渠道。个人通知收件人也可以随时从联系人中删除设备，从而取消通知。

**要从联系人中删除联系人渠道**

1. 导航到 [Incident Manager 控制台](https://console.aws.amazon.com/systems-manager/incidents/home)，然后从左侧导航栏中选择**联系人**。

1. 选择要删除的联系人渠道的联系人，然后选择**编辑**。

1. 选择您要删除的联系人渠道旁边的**删除**。

1. 选择**更新**。

**联系人渠道停用**  
要停用设备，请回复**取消订阅**。回复**取消订阅**会阻止 Incident Manager 使用您的设备。

**联系人渠道重新激活**

1. 对来自 Incident Manager 的消息回复**开始**。

1. 导航到 [Incident Manager 控制台](https://console.aws.amazon.com/systems-manager/incidents/home)，然后从左侧导航栏中选择**联系人**。

1. 选择要删除的联系人渠道的联系人，然后选择**编辑**。

1. 选择**激活服务**。

1. 输入 Incident Manager 发送到设备的**激活码**。

1. 选择**激活**。

## 互动计划
<a name="contacts-engage"></a>

互动计划定义了 Incident Manager 何时与联系人渠道互动。您可以在互动开始的不同阶段多次与联系人渠道互动。您可以在上报计划或响应计划中使用互动计划。要了解有关上报计划的更多信息，请参阅 [在事件管理器中为响应者参与制定升级计划](escalation.md)。

## 创建联系人
<a name="contacts-define"></a>

创建联系人的步骤如下。

1. 打开 [Incident Manager 控制台](https://console.aws.amazon.com/systems-manager/incidents/home)，然后从左侧导航栏中选择**联系人**。

1. 选择**创建联系人**。

1. 键入联系人的全名，并提供唯一且可识别的别名。

1. 定义**联系人渠道**。我们建议拥有两种或两种以上不同类型的联系人渠道。

   1. 选择类型：电子邮件、短信或语音。

   1. 为联系人渠道输入一个可识别的名称。

   1. 提供联系人渠道的详细信息，例如电子邮件：arosalez@example.com

1. 要定义多个联系人渠道，请选择**添加联系人渠道**。每添加一个新的联系人渠道，就重复步骤 4。

1. 定义互动计划。
**重要**  
要与联系人互动，您必须定义互动计划。

   1. 选择**联系人渠道名称**。

   1. 定义从互动开始到 Incident Manager 与该联系人渠道互动的等待时间。

   1. 要添加其他联系人渠道，请选择**添加互动**。

1. 定义互动计划后，选择**创建**。Incident Manager 向每个定义的联系人渠道发送激活码。

1. （可选）要激活联系人渠道，请输入 Incident Manager 发送给每个定义的联系人渠道的激活码。

1. （可选）要发送新的激活码，请选择**发送新的激活码**。

1. 选择**结束**。

定义联系人并激活其联系人渠道后，您可以将联系人添加到上报计划中以形成上报链。要了解有关上报计划的更多信息，请参阅 [在事件管理器中为响应者参与制定升级计划](escalation.md)。您可以将联系人添加到响应计划中以进行直接互动。要了解有关制定响应计划的更多信息，请参阅 [在事件管理器中创建和配置响应计划](response-plans.md)。

## 将联系人详细信息导入您的通讯录
<a name="contacts-details-file"></a>

创建事件后，Incident Manager 可以使用语音或短信通知来通知响应者。为确保响应者看到来电或短信通知来自 Incident Manager，我们建议所有响应者将 Incident Manager [虚拟卡片格式 (.vcf)](https://docs.fileformat.com/email/vcf/) 文件下载到其移动设备上的通讯录中。该文件托管在 Amazon 中 CloudFront ，可在 AWS 商业分区中找到。

**要下载 Incident Manager .vcf 文件**

1. 在您的移动设备上，选择或输入以下 URL：[https://d26vhuvd5b89k2.cloudfront.net/ aws-incident-manager .vcf。](https://d26vhuvd5b89k2.cloudfront.net/aws-incident-manager.vcf)

1. 将文件保存或导入到移动设备上的通讯录。

# 在事件管理器中使用待命时间表管理响应者轮换
<a name="incident-manager-on-call-schedule"></a>

Incident Manager 中的待命时间表定义了当发生需要操作员干预的事件时，谁会收到通知。待命时间表由您为该时间表创建的一个或多个轮换组成。每次轮换最多可包括 30 个联系人。

创建待命时间表后，您可以将其作为上报纳入上报计划中。当发生与该上报计划相关的事件时，Incident Manager 会根据时间表通知待命的操作员（或多名操作员）。然后，该联系人可以确认互动。在上报计划中，您可以在多个上报阶段指定一个或多个待命时间表，以及一个或多个联系人。有关更多信息，请参阅 [在事件管理器中为响应者参与制定升级计划](escalation.md)。

**提示**  
作为最佳实践，我们建议在上报计划中添加联系人和待命时间表作为上报渠道。然后，您应选择上报计划作为响应计划的互动方式。这种方法可以最大限度地覆盖您的组织中的事件响应。

每个待命时间表最多支持八次轮换。轮换可以重叠或同时运行。这增加了在事件发生时被通知做出响应的操作员数量。您也可以创建连续运行的轮换。这支持诸如“全天候式”事件管理之类的场景，在这种场景中，世界各地都有支持相同服务的群组。

该部分中的主题可帮助您创建和管理事件响应操作的待命时间表。

**Topics**
+ [在 Incident Manager 中创建待命时间表和轮换](incident-manager-on-call-schedule-create.md)
+ [在 Incident Manager 中管理现有的待命时间表](incident-manager-on-call-schedule-manage.md)

# 在 Incident Manager 中创建待命时间表和轮换
<a name="incident-manager-on-call-schedule-create"></a>

制定待命时间表，让一个或多个联系人轮换互动，以处理轮班期间发生的事件。

**开始之前**  
在创建待命时间表之前，请确保您之前创建了要添加到时间表轮换中的联系人。有关信息，请参阅 [在事件管理器中创建和配置联系人](contacts.md)。

**考虑夏令时（DST）的变化**  
创建轮换时，您可以指定全球时区，该时区作为轮班覆盖时间和日期的基础。您可以使用[互联网编号分配机构 (IANA)](https://www.iana.org/time-zones) 定义的任何时区。例如：`America/Los_Angeles`、`UTC` 和 `Asia/Seoul`。您可以在待命时间表中添加多个轮换。但是，当每次轮换的响应者在地理位置上位于不同的时区时，请注意每次轮换可能会发生的任何夏令时变化。

例如，`America/Los_Angeles` 并 `Europe/Dublin` 遵守不同的 DST 时间表。因此，根据一年中的不同时间，两个区域之间的时差可能相差 6 到 8 个小时。例如， follow-the-sun待命时间表在时区有一个轮换，一个轮换在`America/Los_Angeles``Europe/Dublin`时区。在该示例中，由于 DST 的变化，时间表可能包含一小时的轮班间隔或一小时的轮班重叠。

为避免出现这些情况，建议您使用以下方法：

1. 在待命时间表中，所有轮换都使用单一时区。

1. 在指定特定时区以外的响应者时，请计算当地时间。

如果您决定将每次轮换分配到其当地时区，请在任何 DST 之前查看时间表。然后，根据需要调整轮班时间，以确保在 DST 变化生效之前，避免待命覆盖范围出现任何意外间隙或重叠。

**要创建待命时间表**

1. 打开 [Incident Manager 控制台](https://console.aws.amazon.com/systems-manager/incidents/home)。

1. 在左侧导航窗格中，选择**待命时间表**。

1. 选择**创建待命时间表**。

1. 对于**时间表名称**，输入名称以帮助您识别时间表，例如 **MyApp Primary On-call Schedule**。

1. 在 “**计划别名**” 中，输入此时间表的别名，该别名在当前时间表中是唯一的 AWS 区域，例如**my-app-primary-on-call-schedule**。

1. （可选）在**标签**区域，将一个或多个标签密钥名称和值对应用到待命时间表。

   标签是您分配给资源的可选元数据。标签可让您按不同的方式（如用途、拥有者或环境）对资源进行分类。例如，您可以标记时间表，以确定其运行的时间段、包含的操作员类型或支持的上报计划。有关标记 Incident Manager 资源的更多信息，请参阅 [在 Incident Manager 中标记资源](tagging.md)。

1. 继续在[待命时间表中添加一个或多个轮换](#on-call-schedule-rotation-times)。

## 在 Incident Manager 中为待命时间表创建轮班
<a name="on-call-schedule-rotation-times"></a>

待命时间表中的轮班规定了轮班的生效时间。它还指定了轮班轮换的联系人。您最多可以在单个待命时间表中包括八次轮换。

您可以将在 Incident Manager 中创建为联系人的任何个人添加到轮换中。有关管理联系人的信息，请参阅 [在事件管理器中创建和配置联系人](contacts.md)。

在配置轮换时，您可以在页面右侧的**预览**日历中看到整个时间表的外观。

**要创建待命时间表的轮班**

1. 在**创建待命时间表**页面的**轮换 1**部分，在**轮换名称**中，输入标识轮换的名称，例如 **00:00 - 7:59 Support** 或 **Dublin Support Group**。

1. 对于**开始日期**，以 `YYYY/MM/DD` 格式输入该轮换开始生效的日期，例如 `2023/07/14`。

1. 对于**时区**，选择全球时区，该时区作为您为该轮换指定的轮班覆盖时间和日期的基础。

   您可以使用互联网编号分配机构 (IANA) 定义的任何时区。例如：“America/Los\$1Angeles", "UTC", "Asia/Seoul”。有关更多信息，请参阅 IANA 网站上的[时区数据库](https://www.iana.org/time-zones)。
**警告**  
您可以根据自己的时区进行每次轮换。但是，您所选择时区的夏令时变化可能会影响您的预期覆盖窗口。有关更多信息，请参阅[本主题前面的考虑夏令时 (DST) 的变化](#on-call-dst)。

1. 对于**轮换开始时间**，以 24 小时 `hh:mm` 格式输入该轮换的轮班开始的时间，例如 `16:00`。

   请注意，与您指定的时区不同的联系人的当地时间差异。例如，如果您选择 `America/Los_Angeles` 为时区，`00:00` 为轮换开始时间，这相当于爱尔兰都柏林的 08:00，印度孟买的 13:30。

1. 对于**轮换结束时间**，以 24 小时 `hh:mm` 格式输入该轮换的轮班结束的时间，例如 `23:59`。
**注意**  
轮换开始和结束之间的间隔时间必须至少为 30 分钟。

1. （可选）要将轮换长度设置为 24 小时，请选择 **24 小时覆盖**，然后在**轮换开始时间**字段中输入该轮换的开始时间。**轮换结束时间**值会自动更新。

   例如，如果您希望待命时间为 24 小时，而轮班在上午 11 点更换，请选择** 24 小时覆盖**，然后输入 **11:00** 作为开始时间。

1. 对于**活跃天数**，选择该轮换在一周中的处于活动状态的天数。例如，如果您的待命计划不包括周末，请选择除**周日**和**周六**之外的所有天数。

1. 继续[将联系人添加到轮换中](#on-call-schedule-rotation-contacts)。

## 在 Incident Manager 的待命时间表中将联系人添加到轮换中
<a name="on-call-schedule-rotation-contacts"></a>

在您的待命时间表中，每次轮换都可以添加一个或多个联系人，最多可添加 30 个。您可以从 Incident Manager 配置中设置的联系人中进行选择。

当您将联系人添加到轮换中时，该联系人可能会收到通知，作为其待命职责的一部分。通知可根据联系人的详细信息，通过电子邮件、短信或语音电话发送。

有关管理联系人和联系人通知选项的信息，请参阅 [在事件管理器中创建和配置联系人](contacts.md)。

**要将联系人添加到待命时间表的轮换中**

1. 在**创建待命时间表**页面上，在轮换的**联系人**部分，选择**添加或删除联系人**。

1. 在**添加或删除联系人**对话框中，选择要包含在轮换中的联系人的别名。

   您选择联系人的顺序就是这些联系人在轮换时间表中首次列出的顺序。您可以在添加联系人后更改顺序。

1. 选择**确认**。

1. 要更改联系人在顺序中的位置，请选择该用户的单选按钮，然后使用向上 (![\[)The Up button\]](http://docs.aws.amazon.com/zh_cn/incident-manager/latest/userguide/images/on-call-Up.png)) 和向下 (![\[)The Down button\]](http://docs.aws.amazon.com/zh_cn/incident-manager/latest/userguide/images/on-call-Down.png)) 按钮更新联系人顺序。

1. 继续[指定轮换的个别轮班周期和时长](#on-call-schedule-rotation-recurrence-and-tags)。

## 在 Incident Manager 中指定轮班周期和时长，并向轮换添加标签
<a name="on-call-schedule-rotation-recurrence-and-tags"></a>

轮班周期规定了轮换中的联系人轮换进入和退出待命的频率。周期时长可以按天数、周数或月数指定。

**要指定轮班周期和时长，并向轮换添加标签**

1. 在**创建待命时间表**页面上，在轮换的**周期设置**部分，请执行以下操作：
   + 对于**轮班周期类型**，请从 `Daily`、`Weekly` 和 `Monthly` 中进行选择，指定每个待命轮班是持续多少天、几周还是几个月。
   + 对于**轮班时长**，输入轮班持续多少天、几周还是几个月。

     例如，如果您选择 `Daily` 并输入 **1**，则每位联系人的待命轮班将持续一天。如果您选择 `Weekly` 并输入 **3**，则每位联系人的待命轮班将持续三周。

1. （可选）在**标签** 区域，将一个或多个标签密钥名称和值对应用到轮换。

   标签是您分配给资源的可选元数据。标签可让您按不同的方式（如用途、拥有者或环境）对资源进行分类。例如，您可以标记轮换，以确定分配给该轮换的联系人的位置、其本应提供的轮换覆盖类型或其支持的上报计划。有关标记 Incident Manager 资源的更多信息，请参阅 [在 Incident Manager 中标记资源](tagging.md)。

1. （推荐）使用日历预览，确保待命时间表的覆盖范围不会出现意外间隙。

1. 选择**创建**。

现在，您可以在上报计划中将待命时间表添加为上报渠道。有关信息，请参阅 [制定上报计划](escalation.md#escalation-create)。

# 在 Incident Manager 中管理现有的待命时间表
<a name="incident-manager-on-call-schedule-manage"></a>

使用本部分中的内容可帮助您处理已创建的待命时间表。

**Topics**
+ [查看待命时间表详细信息](#on-call-schedule-details)
+ [编辑待命时间表](#on-call-schedule-edit)
+ [复制待命时间表](#on-call-schedule-copy)
+ [创建待命时间表轮换的替换](#on-call-schedule-override)
+ [删除待命时间表](#on-call-schedule-delete)

## 查看待命时间表详细信息
<a name="on-call-schedule-details"></a>

您可以在**查看待命时间表详细信息页面上访问待命时间表 at-a-glance**摘要。该页面还包含当前待命人员和下一个待命人员的信息。该页面包含一个日历视图，显示在任何特定时间哪些联系人待命。

**要查看待命时间表详细信息**

1. 打开 [Incident Manager 控制台](https://console.aws.amazon.com/systems-manager/incidents/home)。

1. 在左侧导航窗格中，选择**待命时间表**。

1. 在要查看的待命时间表行中，请执行以下操作之一：
   + 要打开日历摘要视图，请选择时间表别名。

     –或者–

     选择该行的单选按钮，然后选择**查看**。
   + 要打开时间表的日历视图，请选择**查看日历** ![\[The View calendar button\]](http://docs.aws.amazon.com/zh_cn/incident-manager/latest/userguide/images/on-call-calendar.png)

     在日历视图中，选择时间表中特定日期的联系人姓名，查看有关分配轮班的详细信息或创建替换。
   + 要打开或关闭日历中特定轮换的显示，请选择轮换名称旁边的切换开关。  
![\[在待命日历预览中切换显示在开启和关闭位置的按钮。\]](http://docs.aws.amazon.com/zh_cn/incident-manager/latest/userguide/images/on-call-calendar-toggles.png)

## 编辑待命时间表
<a name="on-call-schedule-edit"></a>

您可以更新待命时间表及其轮换的配置，但以下详细信息除外：
+ 时间表别名
+ 轮换名称
+ 轮换开始日期

要使用现有日历作为能够更改这些值的新日历的基础，您可以改为复制该日历。有关信息，请参阅[复制待命时间表](#on-call-schedule-copy)。

**要编辑待命时间表**

1. 打开 [Incident Manager 控制台](https://console.aws.amazon.com/systems-manager/incidents/home)。

1. 在左侧导航窗格中，选择**待命时间表**。

1. 请执行以下操作之一：
   + 选择要编辑的待命时间表行中的单选按钮，然后选择**编辑**。
   + 选择待命时间表的时间表别名，打开**查看待命时间表详细信息**页面，然后选择**编辑**。

1. 对待命时间表及其轮换进行必要的修改。您可以更改轮换配置选项，例如开始和结束时间、联系人和周期。您可以根据需要从时间表中添加或删除轮换。日历预览会反映您所做的更改。

   有关使用页面选项的信息，请参阅 [在 Incident Manager 中创建待命时间表和轮换](incident-manager-on-call-schedule-create.md)。

1. 选择**更新**。

**重要**  
如果您编辑包含替换的时间表，则您所做的更改会影响替换。为确保您的替换按预期配置，我们建议您在更新时间表后仔细检查您的轮班替换。

## 复制待命时间表
<a name="on-call-schedule-copy"></a>

要将现有待命时间表的配置作为新时间表的起点，您可以创建一个日历副本并根据需要对其进行修改。

**要复制待命时间表**

1. 打开 [Incident Manager 控制台](https://console.aws.amazon.com/systems-manager/incidents/home)。

1. 在左侧导航窗格中，选择**待命时间表**。

1. 选择要复制的待命时间表行中的单选按钮。

1. 选择**复制**。

1. 对日历及其轮换进行任何必要的修改。您可以根据需要更改、添加或删除轮换。
**注意**  
复制现有时间表时，必须为每次轮换指定新的开始日期。复制的时间表不支持以过去的开始日期进行轮换。

   有关使用页面选项的信息，请参阅 [在 Incident Manager 中创建待命时间表和轮换](incident-manager-on-call-schedule-create.md)。

1. 选择**创建副本**。

## 创建待命时间表轮换的替换
<a name="on-call-schedule-override"></a>

如果您需要对现有的轮换时间表进行一次性更改，则可以创建替换。通过替换，您可以将联系人的全部或部分轮班替换为另一个联系人。您还可以创建跨越多个轮班的替换。

您只能将联系人分配给已分配给轮换的替换对象。

在日历预览中，替换的轮班以条纹背景而不是纯色背景显示。下图显示名为 Zhang Wei 的联系人正在改写中待命。改写包括约翰·多伊和玛莎·里维拉的部分轮班，从5月5日开始，到5月11日结束。

![\[日程日历显示覆盖另外两个班次部分的覆盖班次。\]](http://docs.aws.amazon.com/zh_cn/incident-manager/latest/userguide/images/on-call-rotation-override-example.png)


**要创建待命时间表的替换**

1. 打开 [Incident Manager 控制台](https://console.aws.amazon.com/systems-manager/incidents/home)。

1. 在左侧导航窗格中，选择**待命时间表**。

1. 在要查看的待命时间表行中，请执行以下操作之一：
   + 选择时间表别名，然后选择**时间表日历**选项卡。
   + 选择**查看日历** ![\[)The Calendar button\]](http://docs.aws.amazon.com/zh_cn/incident-manager/latest/userguide/images/on-call-calendar.png)。

1. 请执行以下操作之一：
   + 选择**创建替换**。
   + 在日历预览中选择联系人的姓名，然后选择**替换轮班**。

1. 在**创建轮班替换**对话框中，请执行以下操作：
**注意**  
替换时间必须至少为 30 分钟。您只能为未来不超过 6 个月的轮班指定替换。

   1. 对于**选择轮换**，选择要在其中创建替换的轮换名称。

   1. 对于**开始日期**，选择或输入替换开始的日期。

   1. 对于**开始时间**，以 `hh:mm` 格式输入替换开始的时间。

   1. 对于**结束日期**，选择或输入替换结束的日期。

   1. 对于**结束时间**，以 `hh:mm` 格式输入替换结束的时间。

   1. 对于**选择替换联系人**，选择在替换期间待命的轮换联系人姓名。

1. 选择**创建替换**。

创建替换后，您可以通过条纹背景来识别它。当您为一个替换的轮班选择联系人姓名时，一个信息框会将其标识为替换的轮班。您可以选择**删除替换**将其删除并恢复原始的待命分配。

## 删除待命时间表
<a name="on-call-schedule-delete"></a>

当您不再需要特定的待命时间表时，可以将其从 Incident Manager 中删除。

如果任何上报计划或响应计划目前使用待命时间表作为上报渠道，则应在删除时间表之前将其从这些计划中删除。

**要删除待命时间表**

1. 打开 [Incident Manager 控制台](https://console.aws.amazon.com/systems-manager/incidents/home)。

1. 在左侧导航窗格中，选择**待命时间表**。

1. 选择要删除的待命时间表行中的单选按钮。

1. 选择**删除**。

1. 在**删除待命时间表中？**对话框中，在文本框中输入 **confirm**。

1. 选择**删除**。

# 在事件管理器中为响应者参与制定升级计划
<a name="escalation"></a>

AWS Systems Manager Incident Manager 通过您定义的联系人或待命时间表（统称为*升级渠道）提供升级*路径。您可以同时将多个上报渠道引入一个事件。如果上报渠道中的指定联系人没有响应，Incident Manager 会上报到下一组联系人。您还可以选择在用户确认互动后计划是否停止上报。您可以将上报计划添加到响应计划中，以便在事件开始时自动开始上报。您也可以为活动事件添加上报计划。

**Topics**
+ [Stages](#escalation-stages)
+ [制定上报计划](#escalation-create)

## Stages
<a name="escalation-stages"></a>

上报计划分阶段进行，每个阶段持续规定的分钟数。每个阶段显示以下信息：
+ **持续时间**——计划在下一阶段开始之前等待的时间。互动开始后，上报计划的第一阶段就开始了。
+ **上报渠道**——上报渠道可以是单个联系人，也可以是待命时间表，该时间表由多个联系人组成，他们按规定的时间表轮职。上报计划使用其定义的互动计划使每个渠道进行互动。您可以设置每个上报渠道，以便在上报计划进入下一阶段之前停止其进展。每个阶段可以有多个上报渠道。

  有关设置单个联系人的信息，请参阅 [在事件管理器中创建和配置联系人](contacts.md)。有关创建待命时间表的信息，请参阅 [在事件管理器中使用待命时间表管理响应者轮换](incident-manager-on-call-schedule.md)。

## 制定上报计划
<a name="escalation-create"></a>

1. 打开 [Incident Manager 控制台](https://console.aws.amazon.com/systems-manager/incidents/home)，然后从左侧导航栏中选择**上报计划**。

1. 选择**创建上报计划**。

1. 对于**名称**，输入上报计划的唯一名称，例如 **My Escalation Plan**。

1. 对于**别名**，输入别名以帮助您识别计划，例如 **my-escalation-plan**。

1. 对于**阶段持续时间**，输入 Incident Manager 在进入下一阶段之前等待的分钟数。

1. 对于**升级渠道**，请选择一个或多个联系人或待命时间表以在此阶段进行互动。

1. （可选）要让联系人在确认互动后停止上报计划，请选择**确认停止计划进展**。

1. 要向该阶段添加另一个渠道，请选择**添加上报渠道**。

1. 要向上报计划添加另一个阶段，请选择**添加阶段**。

1. 重复步骤 5 到 9，直到您完成为该上报计划添加所需的上报渠道和阶段。

1. （可选）在**标签** 区域，将一个或多个标签密钥名称和值对应用到上报计划。

   标签是您分配给资源的可选元数据。标签可让您按不同的方式（如用途、拥有者或环境）对资源进行分类。例如，您可以标记一个上报计划，以确定其用于的事件类型、包含的上报渠道类型或支持的上报计划。有关标记 Incident Manager 资源的更多信息，请参阅 [在 Incident Manager 中标记资源](tagging.md)。

1. 选择**创建上报计划**。

# 在事件管理器中为响应者创建和集成聊天频道
<a name="chat"></a>

事件管理器是一个工具 AWS Systems Manager，它使事件响应者能够在事件发生期间通过*聊天渠道*直接进行沟通。*聊天频道*是您在 [Amazon Q Developer 中的聊天应用程序中设置的聊天室](https://docs.aws.amazon.com/chatbot/latest/adminguide/)。然后，您可以将该频道连接到 Incident Manager 中的响应计划。

在事件发生期间，响应者使用聊天频道就事件相互沟通。Incident Manager 还会将有关事件的所有更新和通知直接推送到聊天频道。它会使用您在聊天室配置中指定的一个或多个 Amazon Simple Notiﬁcation Service (Amazon SNS) 主题发送这些通知。

聊天应用程序中的 Amazon Q Developer 和事件管理器支持以下应用程序中的聊天频道：
+ Slack
+ Microsoft Teams
+ Amazon Chime

在事件中设置聊天频道的过程包括在三种不同的 Amazon Web Services 服务中执行任务。

**Topics**
+ [任务 1：为您的聊天频道创建或更新 Amazon SNS 主题](#sns-topic)
+ [任务 2：在 Amazon Q Developer 的聊天应用程序中创建聊天频道](#chat-create)
+ [任务 3：将聊天频道添加到 Incident Manager 的响应计划中](#response-plan)
+ [通过聊天频道进行互动](#chat-interact)

## 任务 1：为您的聊天频道创建或更新 Amazon SNS 主题
<a name="sns-topic"></a>

Amazon SNS 是一项托管服务，提供从发布者向订阅者（也称为*创建者*和*使用者*）的消息传输。发布者通过将消息发送至*主题*与订阅用户进行异步交流，主题是一个逻辑接入点和通信通道。Incident Manager 使用与响应计划关联的一个或多个主题，向事件响应者发送有关事件的通知。

在响应计划中，您可以在事件通知中加入一个或多个 Amazon SNS 主题。作为最佳实践，您应该在已添加到复制集的每个 AWS 区域 主题中创建一个 SNS 主题。

**提示**  
要使设置工作流程更有条理，我们建议您先配置 Amazon SNS 主题，以便与 Incident Manager 一起使用。配置完成后，您就可以创建聊天频道了。

**要为您的聊天频道创建或更新 Amazon SNS 主题**

1. 请按照《Amazon Simple Notification Service 开发人员指南》**中的[创建 Amazon SNS 主题](https://docs.aws.amazon.com/sns/latest/dg/sns-create-topic.html)的步骤进行操作。
**注意**  
创建主题后，编辑主题以更新其访问策略。

1. 选择创建的主题，并记下或复制主题的 Amazon 资源名称 (ARN)，格式如 `arn:aws:sns:us-east-2:111122223333:My_SNS_topic`。

1. 选择**编辑**，然后展开**访问策略**部分，配置默认值之外的其他访问权限。

1. 将以下语句添加到策略的**语句**数组：

   ```
   {
       "Sid": "IncidentManagerSNSPublishingPermissions",
       "Effect": "Allow",
       "Principal": {
           "Service": "ssm-incidents.amazonaws.com"
       },
       "Action": "SNS:Publish",
       "Resource": "sns-topic-arn",
       "Condition": {
           "StringEqualsIfExists": {
               "AWS:SourceAccount": "account-id"
           }
       }
   }
   ```

   按*placeholder values*如下方式替换：
   + *sns-topic-arn*是您为该区域创建的主题的亚马逊资源名称 (ARN)，格式为。`arn:aws:sns:us-east-2:111122223333:My_SNS_topic`
   + *account-id*是您正在 AWS 账户 使用的的 ID，例如`111122223333`。

1. 选择**保存更改**。

1. 在复制集中包含的每个区域重复该过程。

## 任务 2：在 Amazon Q Developer 的聊天应用程序中创建聊天频道
<a name="chat-create"></a>

你可以在Slack、或 Amazon Chim Microsoft Teams e 中创建聊天频道。每个响应计划只需一个聊天频道。

对于您的聊天频道，我们建议您遵循最低权限原则（不要向用户提供超过完成任务所需的权限）。您还应该定期在聊天应用程序聊天频道中查看您的 Amazon Q 开发者的成员资格。查看有助于检查只有相应的响应者和其他利益相关者才能访问聊天频道。

在 Amazon Q Developer 的聊天应用程序中创建的SlackMicrosoft Teams频道和频道中，事件响应者可以直接从Slack或Microsoft Teams应用程序运行多个 Incident Manager CLI 命令。有关更多信息，请参阅 [通过聊天频道进行互动](#chat-interact)。

**重要**  
您添加到聊天频道的用户必须与上报或响应计划中列出的联系人相同。您还可以向聊天频道添加其他用户，例如利益相关者和事件观察者。

有关聊天应用程序中的 Amazon Q Develo [per 的一般信息，请参阅聊天应用程序中的 Amazon Q 开发者*管理员指南中的聊天应用程序中的 Amazon Q 开发者*是什么](https://docs.aws.amazon.com/chatbot/latest/adminguide/what-is.html)。

从以下应用程序中进行选择以创建您的频道：

------
#### [ Slack ]

该步骤提供了建议的权限设置，允许所有频道用户使用 Incident Manager 的聊天命令。使用支持的聊天命令，您的事件响应者可以直接从Slack聊天频道更新事件并与之互动。有关信息，请参阅[通过聊天频道进行互动](#chat-interact)。

**要在中创建聊天频道 Slack**
+ 按照《*Amazon Q 聊天应用程序开发者管理员指南》Slack中的 “[教程：入门](https://docs.aws.amazon.com/chatbot/latest/adminguide/slack-setup.html)” 中的*步骤进行操作，并在您的配置中包含以下内容。
  + 在步骤 10 中，对于**角色设置**，选择**频道角色**。
  + 在步骤 10d 中，对于**策略模板**，选择 **Incident Manager 权限**。
  + 在步骤 11 中，对于**频道防护机制策略**，在**策略名称**中，选择 [https://console.aws.amazon.com/iam/home#/policies/arn:aws:iam::aws:policy/AWSIncidentManagerResolverAccess$jsonEditor](https://console.aws.amazon.com/iam/home#/policies/arn:aws:iam::aws:policy/AWSIncidentManagerResolverAccess$jsonEditor)。
  + 在步骤 12 中的 **SNS 主题**部分，执行以下操作：
    + 对于**区域 1** AWS 区域 ，选择您的复制集中包含的。
    + 对于**主题 1**，选择您在该区域创建的 SNS 主题，用于向聊天频道发送事件通知。
    + 对于复制集中的每个其他区域，请选择**添加其他区域**，然后添加其他区域和 SNS 主题。

------
#### [ Microsoft Teams ]

该步骤提供了建议的权限设置，允许所有频道用户使用 Incident Manager 的聊天命令。使用支持的聊天命令，您的事件响应者可以直接从Microsoft Teams聊天频道更新事件并与之互动。有关信息，请参阅[通过聊天频道进行互动](#chat-interact)。

**要在中创建聊天频道 Microsoft Teams**
+ 按照《*Amazon Q 开发者聊天应用程序管理员指南》Microsoft Teams中的 “[教程：入门](https://docs.aws.amazon.com/chatbot/latest/adminguide/teams-setup.html)” 中的*步骤进行操作，并在您的配置中包括以下内容：
  + 在步骤 10 中，对于**角色设置**，选择**频道角色**。
  + 在步骤 10d 中，对于**策略模板**，选择 **Incident Manager 权限**。
  + 在步骤 11 中，对于**频道防护机制策略**，在**策略名称**中，选择 [https://console.aws.amazon.com/iam/home#/policies/arn:aws:iam::aws:policy/AWSIncidentManagerResolverAccess$jsonEditor](https://console.aws.amazon.com/iam/home#/policies/arn:aws:iam::aws:policy/AWSIncidentManagerResolverAccess$jsonEditor)。
  + 在步骤 12 中的 **SNS 主题**部分，执行以下操作：
    + 对于**区域 1** AWS 区域 ，选择您的复制集中包含的。
    + 对于**主题 1**，选择您在该区域创建的 SNS 主题，用于向聊天频道发送事件通知。
    + 对于复制集中的每个其他区域，请选择**添加其他区域**，然后添加其他区域和 SNS 主题。

------
#### [ Amazon Chime ]

**要在 Amazon Chime 中创建聊天频道**
+ 按照《[Amazon Q 聊天应用程序开发者管理员指南》中的 “教程：开始使用 Amazon Chime](https://docs.aws.amazon.com/chatbot/latest/adminguide/chime-setup.html)*” 中的*步骤进行操作，并在您的配置中包含以下内容：
  + 在步骤 11 中，对于**策略模板**，选择 **Incident Manager 权限**。
  + 在步骤 12 中，在 **SNS 主题**部分，选择将向 Amazon Chime Webhook 发送通知的 SNS 主题：
    + 对于**区域 1** AWS 区域 ，选择您的复制集中包含的。
    + 对于**主题 1**，选择您在该区域创建的 SNS 主题，用于向聊天频道发送事件通知。
    + 对于复制集中的每个其他区域，请选择**添加其他区域**，然后添加其他区域和 SNS 主题。

**注意**  
Amazon Chime 不支持事件响应人员可以在Microsoft Teams聊天频道中Slack使用的聊天命令。

------

## 任务 3：将聊天频道添加到 Incident Manager 的响应计划中
<a name="response-plan"></a>

创建或更新响应计划时，您可以添加聊天渠道，供响应者通过聊天频道进行沟通和接收更新。

按照 [制定响应计划](response-plans.md#response-plans-create) 中的步骤操作时，在 **[（可选）指定事件响应聊天频道](response-plans.md#chat-channel)** 部分中，选择要用于处理与该响应计划相关的事件的频道。

## 通过聊天频道进行互动
<a name="chat-interact"></a>

对于Slack和中的频道Microsoft Teams，事件管理器允许响应者使用以下`ssm-incidents`命令直接从聊天频道与事件进行交互：
+ [start-incident](https://docs.aws.amazon.com/cli/latest/reference/ssm-incidents/start-incident.html)
+ [list-response-plan](https://docs.aws.amazon.com/cli/latest/reference/ssm-incidents/list-response-plan.html)
+ [get-response-plan](https://docs.aws.amazon.com/cli/latest/reference/ssm-incidents/get-response-plan.html)
+ [create-timeline-event](https://docs.aws.amazon.com/cli/latest/reference/ssm-incidents/create-timeline-event.html)
+ [delete-timeline-event](https://docs.aws.amazon.com/cli/latest/reference/ssm-incidents/delete-timeline-event.html)
+ [get-incident-record](https://docs.aws.amazon.com/cli/latest/reference/ssm-incidents/get-incident-record.html)
+ [get-timeline-event](https://docs.aws.amazon.com/cli/latest/reference/ssm-incidents/get-timeline-event.html)
+ [list-incident-records](https://docs.aws.amazon.com/cli/latest/reference/ssm-incidents/list-incident-records.html)
+ [list-timeline-events](https://docs.aws.amazon.com/cli/latest/reference/ssm-incidents/list-timeline-events.html)
+ [list-related-items](https://docs.aws.amazon.com/cli/latest/reference/ssm-incidents/list-related-items.html)
+ [update-related-items](https://docs.aws.amazon.com/cli/latest/reference/ssm-incidents/update-related-items.html)
+ [update-incident-record](https://docs.aws.amazon.com/cli/latest/reference/ssm-incidents/update-incident-record.html)
+ [update-timeline-event](https://docs.aws.amazon.com/cli/latest/reference/ssm-incidents/update-timeline-event.html)

要在活动事件的聊天频道中运行命令，请使用以下格式。*cli-options*替换为要包含在命令中的任何选项。

```
@aws ssm-incidents cli-options
```

例如：

```
@aws ssm-incidents start-incident --response-plan-arn arn:aws:ssm-incidents::111122223333:response-plan/test-response-plan-chat --region us-east-2
```

```
@aws ssm-incidents create-timeline-event --event-data "\"example timeline event"\" --event-time 2023-03-31 T20:30:00.000  --event-type Custom Event --incident-record-arn arn:aws:ssm-incidents::111122223333:incident-record/MyResponsePlanChat/98c397e6-7c10-aa10-9b86-f199aEXAMPLE
```

```
@aws ssm-incidents list-incident-records
```

# 将 Systems Manager 自动化运行手册集成到事件管理器中以进行事故补救
<a name="runbooks"></a>

您可以使用 A [AWS Systems Manager ut](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html) omation 中的运行手册（一种中的 AWS Systems Manager工具）来自动执行 AWS 云 环境中的常见应用程序和基础架构任务。

每个运行手册都定义了一个*运行手册工作流程*，该工作流程由 Systems Manager 在您的托管节点或其他 AWS 资源类型上执行的操作组成。您可以使用运行手册来自动维护、部署和修复 AWS 资源。



在 Incident Manager 中，运行手册推动事件响应和缓解，您可以指定要作为响应计划一部分的运行手册。

在响应计划中，您可以从数十个预先配置的运行手册中进行选择，用于执行常见的自动化任务，也可以创建自定义运行手册。当您在响应计划定义中指定运行手册时，系统可以在事件开始时自动启动运行手册。

**重要**  
跨区域失效转移创建的事件不会调用响应计划中指定的运行手册。

有关 Systems Manager Automation、运行手册以及将运行手册与 Incident Manager 一起使用的详细信息，请参阅以下主题：
+ 要向响应计划添加运行手册，请参阅 [在事件管理器中创建和配置响应计划](response-plans.md)。
+ 要了解有关运行手册的更多信息，请参阅《AWS Systems Manager 用户指南》**和《AWS Systems Manager 自动化运行手册参考》*[https://docs.aws.amazon.com/systems-manager-automation-runbooks/latest/userguide/automation-runbook-reference.html](https://docs.aws.amazon.com/systems-manager-automation-runbooks/latest/userguide/automation-runbook-reference.html)*中的 [AWS Systems Manager 自动化](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html)。
+ 有关使用运行手册的成本的信息，请参阅 [Systems Manager 定价](https://aws.amazon.com/systems-manager/pricing/)。
+ 有关在亚马逊 CloudWatch 警报或亚马逊事件造成事件时自动调用运行手册的信息，请参阅[教程：将 Systems Manager Automation 运行手册与 EventBridge 事件管理器一起使用](https://docs.aws.amazon.com//incident-manager/latest/userguide/tutorials-runbooks.html)。

**Topics**
+ [启动和运行运行手册工作流程所需的 IAM 权限](#runbook-permissions)
+ [使用运行手册参数](#runbooks-parameters)
+ [定义运行手册](#runbook-create)
+ [Incent Manager 运行手册模板](#runbooks-template)

## 启动和运行运行手册工作流程所需的 IAM 权限
<a name="runbook-permissions"></a>

作为事件响应的一部分，Incident Manager 需要运行手册的权限。要提供这些权限，您可以使用 AWS Identity and Access Management (IAM) 角色、*Runbook 服务角色*和*自动化`AssumeRole`*。

运行手册服务角色是必需的服务角色。该角色为 Incident Manager 提供了访问和启动运行手册工作流程所需的权限。

自动化 `AssumeRole` 提供了运行运行手册中指定的各个命令所需的权限。

**注意**  
如果未指定 `AssumeRole`，则 Systems Manager Automation 会尝试将运行手册服务角色用于单个命令。如果未指定 `AssumeRole`，则必须向运行手册服务角色添加必要的权限。否则，运行手册将无法运行这些命令。  
但是，作为最佳安全实践，我们建议使用单独的 `AssumeRole`。使用单独的 `AssumeRole`，您可以限制必须添加到每个角色的必要权限。

有关自动化 `AssumeRole` 的更多信息，请参阅《AWS Systems Manager 用户指南》**中的[配置自动化的服务角色（代入角色）访问权限](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-setup.html#automation-setup-configure-role)。

您可以在 IAM 控制台中手动创建任一类型的角色。-您也可以让 Incident Manager 在创建或更新响应计划时为您创建任一角色。

**运行手册服务角色权限**  
运行手册服务角色权限通过类似于以下内容的策略提供。

第一条语句允许 Incident Manager 启动 Systems Manager `StartAutomationExecution` 操作。然后，该操作将在三种 Amazon 资源名称 (ARN) 格式表示的资源上运行。

当运行手册在受影响的账户中运行时，第二条语句允许运行手册服务角色代入另一个账户中的角色。有关更多信息，请参阅《*AWS Systems Manager 用户指南*[》中的在多个账户 AWS 区域 和账户中运行自动化](https://docs.aws.amazon.com/systems-manager/latest/userguide/running-automations-multiple-accounts-regions.html)。

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Effect": "Allow",
            "Action": "ssm:StartAutomationExecution",
            "Resource": [
                "arn:aws:ssm:*:111122223333:document/{{DocumentName}}",
                "arn:aws:ssm:*:111122223333:automation-execution/*"
            ]
        },
        {
            "Effect": "Allow",
            "Action": "sts:AssumeRole",
            "Resource": "arn:aws:iam::*:role/AWS-SystemsManager-AutomationExecutionRole",
            "Condition": {
                "StringEquals": {
                    "aws:CalledViaLast": "ssm.amazonaws.com"
                }
            }
        }
    ]
}
```

------

**自动化 AssumeRole 权限**  
``创建或更新响应计划时，您可以从多个 AWS 托管策略中进行选择，以附加到事件管理器创建 AssumeRole 的策略中。这些策略提供了运行 Incident Manager 运行手册场景中使用的许多常见操作的权限。您可以选择一个或多个托管式策略来为您的 `AssumeRole` 策略提供权限。`` 下表描述了从 Incident Manager 控制台创建 `AssumeRole` 时可以选择的策略。


| AWS 托管式策略名称 | 策略描述 | 
| --- | --- | 
| AmazonSSMAutomationRole | 授予 Systems Manager Automation 服务运行运行手册中定义的活动的权限。将此策略分配给管理员和可信高级用户。 | 
| AWSIncidentManagerResolverAccess |  授予用户启动、查看和更新事件的权限。您还可以使用它们在事件控制面板中创建客户时间轴事件和相关项目。  | 

您可以使用这些托管式策略向许多常见的事件响应场景授予权限。但是，您需要的特定任务所需的权限可能会有所不同。在这种情况下，您需要为 `AssumeRole` 提供额外的策略权限。有关信息，请参阅 *[AWS Systems Manager 自动化运行手册参考](https://docs.aws.amazon.com/systems-manager-automation-runbooks/latest/userguide/automation-runbook-reference.html)*。

## 使用运行手册参数
<a name="runbooks-parameters"></a>

将运行手册添加到响应计划时，您可以指定运行手册在运行时应使用的参数。响应计划支持具有静态和动态值的参数。对于静态值，在响应计划中定义参数时输入该值。对于动态值，系统通过收集事件信息来确定正确的参数值。Incident Manager 支持以下动态参数：

`Incident ARN`  
Incident Manager 创建事件时，系统会捕获相应事件记录的 Amazon 资源名称 (ARN)，并将其输入到运行手册中的该参数。  
该值只能分配给 `String` 类型的参数。如果分配给任何其他类型的参数，则运行手册将无法运行。

`Involved resources`  
事件管理器创建事件时，系统会 ARNs 捕获事件中涉及的资源。然后 ARNs 在运行手册中将这些资源分配给此参数。

### 关于关联资源
<a name="runbooks-parameters-involved-resources"></a>

事件管理器可以用 CloudWatch 警报、事件和手动创建 EventBridge 的事件中指定的 AWS 资源填充运行手册参数值。 ARNs 本节介绍在填充此参数 ARNs 时事件管理器可以捕获的不同类型的资源。

**CloudWatch 警报**  
当通过 CloudWatch 警报操作创建事件时，事件管理器会自动从关联的指标中提取以下类型的资源。然后，它使用以下相关资源填充所选参数：


****  

| AWS 服务 | 资源类型 | 
| --- | --- | 
|  Amazon DynamoDB  |  全局二级索引 流 表  | 
|  Amazon EC2  |  图片 实例  | 
|  AWS Lambda  |  函数别名 函数版本 函数  | 
|  Amazon Relational Database Service (Amazon RDS)  |  集群 数据库实例  | 
|  Amazon Simple Storage Service（Amazon S3）  |  存储桶  | 

**EventBridge 规则**  
当系统根据事件创建事件时， EventBridge 事件管理器会使用事件中的`Resources`属性填充所选参数。有关更多信息，请参阅《[亚马逊* EventBridge 用户指南》中的亚马逊 EventBridge*活动](https://docs.aws.amazon.com/eventbridge/latest/userguide/eb-events.html)。

**手动创建的事件**  
当您使用 [StartIncident](https://docs.aws.amazon.com/incident-manager/latest/APIReference/API_StartIncident.html)API 操作创建事件时，事件管理器会使用 API 调用中的信息填充所选参数。具体来说，它通过使用在 `relatedItems` 参数中传递的 `INVOLVED_RESOURCE` 类型项来填充参数。

**注意**  
`INVOLVED_RESOURCES` 值只能分配给 `StringList` 类型的参数。如果分配给任何其他类型的参数，则运行手册将无法运行。

## 定义运行手册
<a name="runbook-create"></a>

创建运行手册时，您可以按照此处提供的步骤进行操作，也可以按照《Systems Manager 用户指南》**中[使用运行手册](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-documents.html)部分提供的更详细的指南进行操作。*如果您要创建多账户、多区域运行手册，请参阅 Systems Manager 用户[指南中的在多个账户 AWS 区域 和账户中运行自动化](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation-multiple-accounts-and-regions.html)。*

**定义运行手册**

1. 打开 Systems Manager 控制台，网址为[https://console.aws.amazon.com/systems-manager/](https://console.aws.amazon.com/systems-manager/)。

1. 在导航窗格中，选择**文档**。

1. 选择**创建自动化**。

1. 输入唯一且可识别的运行手册名称。

1. 输入运行手册的描述。

1. 提供自动化文档要代入的 IAM 角色。这允许运行手册自动运行命令。有关更多信息，请参阅[为自动化工作流程配置服务角色访问权限](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-setup.html#automation-setup-configure-role)。

1. （可选）添加运行手册启动时的任何输入参数。启动运行手册时，您可以使用动态或静态参数。动态参数使用运行手册启动时的事件中的值。静态参数使用您提供的值。

1. （可选）添加**目标**类型。

1. （可选）添加标签。

1. 填写运行手册运行时将采取的步骤。每个步骤都需要：
   + 名称。
   + 步骤的用途描述。
   + 要在步骤中运行的操作。运行手册使用**暂停**操作类型来描述手动步骤。
   + （可选）命令属性。

1. 添加所有必需的运行手册步骤后，选择**创建自动化**。

要启用跨账户功能，请将管理账户中的运行手册与在事件发生期间使用该运行手册的所有应用程序帐户共享。

**共享运行手册**

1. 打开 Systems Manager 控制台，网址为[https://console.aws.amazon.com/systems-manager/](https://console.aws.amazon.com/systems-manager/)。

1. 在导航窗格中，选择**文档**。

1. 在文档列表中，选择要共享的文档，然后选择**查看详细信息**。在**权限**选项卡中，确保您是文档所有者。只有文档所有者才可共享文档。

1. 选择**编辑**。

1. 要公开共享命令，请选择**公开**，然后选择**保存**。要私下共享命令，请选择 “隐**私**”，输入 AWS 账户 ID，选择 “**添加权限**”，然后选择 “**保存**”。

## Incent Manager 运行手册模板
<a name="runbooks-template"></a>

Incident Manager 提供了以下运行手册模板，以帮助您的团队开始在 Systems Manager Automation 中编写运行手册。您可以按原样使用此模板，也可以对其进行编辑以包含特定于您的应用程序和资源的详细信息。

**查找 Incident Manager 运行手册模板**

1. 打开 Systems Manager 控制台，网址为[https://console.aws.amazon.com/systems-manager/](https://console.aws.amazon.com/systems-manager/)。

1. 在导航窗格中，选择**文档**。

1. 在**文档**区域中，在搜索字段中输入 **AWSIncidents-** 以显示所有 Incident Manager 运行手册。
**提示**  
输入 **AWSIncidents-** 作为自由文本，而不是使用**文档名前缀**筛选器选项。

**使用模板**

1. 打开 Systems Manager 控制台，网址为[https://console.aws.amazon.com/systems-manager/](https://console.aws.amazon.com/systems-manager/)。

1. 在导航窗格中，选择**文档**。

1. 从文档列表中选择要更新的模板。

1. 选择**内容**选项卡，然后复制文档的内容。

1. 在导航窗格中，选择**文档**。

1. 选择**创建自动化**。

1. 输入唯一且可识别的名称。

1. 选择**编辑器**选项卡。

1. 选择**编辑**。

1. 在**文档编辑器**区域粘贴或输入复制的详细信息。

1. 选择**创建自动化**。

### `AWSIncidents-CriticalIncidentRunbookTemplate`
<a name="runbooks-template-critical"></a>

`AWSIncidents-CriticalIncidentRunbookTemplate` 是一个以手动步骤提供 Incident Manager 事件生命周期的模板。这些步骤足够通用，可用于大多数应用程序，但也足够详细，可供响应者开始解决事件。

# 在事件管理器中创建和配置响应计划
<a name="response-plans"></a>

响应计划允许您计划如何响应影响用户的事件。响应计划就像一个模板，其中包含有关参与人员、事件的预期严重程度、要启动的自动运行手册以及要监控的指标等信息。

**最佳实践**  
提前计划事件时，可以减少事件对团队的影响。在设计响应计划时，团队应考虑以下最佳实践。
+ **简化互动**——确定最适合处理事件的团队。如果您互动的分发名单太广，或者您互动的团队不对，就会在事件中造成混乱，浪费响应者的时间。
+ **可靠的上报**——对于响应计划中的互动，我们建议您选择互动计划，而不是联系人或待命时间表。互动计划应明确在事件发生期间要参与的个人联系人或待命时间表（其中包含多个轮换联系人）。由于有时可能无法联系到您的互动计划中指定的响应者，因此您应在响应计划中配置备用响应者，以应对这些情况。有了备用联系人，如果无法联系主要联系人和次要联系人，或出现其他意外中断，Incident Manager 仍会将事件通知联系人。
+ **运行手册**——使用运行手册提供可重复、易于理解的步骤，以减轻响应者在事件期间所承受的压力。
+ **协作**——使用聊天频道简化事件期间的沟通。聊天频道可帮助响应者及时了解最新信息。他们还可以通过这些频道与其他响应者共享信息。

## 制定响应计划
<a name="response-plans-create"></a>

使用以下步骤创建响应计划并自动执行事件响应。

**要创建响应计划**

1. 打开 [Incident Manager 控制台](https://console.aws.amazon.com/systems-manager/incidents/home)并在导航栏中选择**响应计划**。

1. 选择**创建响应计划**。

1. 在 **名称**中，输入唯一且可识别的响应计划名称，以用于响应计划的 Amazon 资源名称（ARN）。

1. （可选）在**显示名称**中，输入更易于理解的名称，以帮助您在创建事件时识别响应计划。

1. 继续[为事件记录指定默认值](#incident-defaults)。

### 指定事件默认值
<a name="incident-defaults"></a>

为了帮助您更有效地管理事件，您可以指定默认值。Incident Manager 将这些值应用于与响应计划关联的所有事件。

**要指定事件默认值**

1. 在**标题**中，输入该事件的标题，以帮助您在 Incident Manager 主页上识别该事件。

1. 在**影响**中，选择影响级别以指明根据该响应计划创建的事件的潜在范围，例如**严重**或**低**。有关 Incident Manager 中影响级别的信息，请参阅 [分类](incident-lifecycle.md#triage)。

1. （可选）在**摘要**中，输入根据该响应计划创建的事件类型的简短摘要。

1. （可选）对于**重复数据删除字符串**，输入重复数据删除字符串。Incident Manager 使用此字符串来防止相同的根本原因在同一个账户中创建多个事件。

   重复数据删除字符串是系统用来检查重复事件的术语或短语。如果您指定重复数据删除字符串，Incident Manager 会在创建事件时在 `dedupeString` 字段中搜索包含相同字符串的未解决事件。如果检测到重复事件，Incident Manager 会删除较新事件的重复数据到现有事件中。
**注意**  
默认情况下，事件管理器会自动删除由同一 Amazon CloudWatch 警报或亚马逊事件创建的多个事件的重复数据。 EventBridge 您无需输入自己的重复数据删除字符串即可防止这些资源类型出现重复。

1. （可选）在**事件标签**下，添加要分配给根据该响应计划创建的事件的标签密钥和值。

   您必须拥有事件记录资源的 `TagResource` 权限，才能在响应计划中设置事件标签。

1. 继续[指定一个可选的聊天频道](#chat-channel)，供解决者就事件相互沟通。

### （可选）指定事件响应聊天频道
<a name="chat-channel"></a>

当您在响应计划中加入聊天频道时，响应者会通过该频道接收事件更新。他们可以使用聊天命令直接从聊天频道与事件互动。

在聊天应用程序中使用 Amazon Q Developer，您可以为 Slack Amazon Chime 创建频道Microsoft Teams，或者为 Amazon Chime 创建一个频道，供其在响应计划中使用。有关在聊天应用程序中在 Amazon Q Developer 中创建聊天频道的信息，请参阅《[https://docs.aws.amazon.com/chatbot/latest/adminguide/](https://docs.aws.amazon.com/chatbot/latest/adminguide/)。

**重要**  
Incident Manager 必须有发布到聊天频道的 Amazon Simple Notiﬁcation Service (Amazon SNS) 主题的权限。如果没有向 SNS 主题发布的权限，则无法将其添加到响应计划中。Incident Manager 向 SNS 主题发布测试通知，以验证权限。

有关聊天频道的更多信息，请参阅 [在事件管理器中为响应者创建和集成聊天频道](chat.md)。

**要指定事件响应聊天频道**

1. 对于**聊天频道**，在聊天应用程序中选择一个 Amazon Q Developer 聊天频道，在事件发生期间，响应者可以在此进行交流。
**提示**  
要在 Amazon Q Developer 的聊天应用程序中创建新的聊天频道，请选择**配置新的聊天机器人客户端**。

1. 对于**聊天频道 SNS 主题**，选择要在事件发生期间发布到的其他 SNS 话题。如果事件发生时某个区域已关闭，则在多个中添加 SNS 主题 AWS 区域 会增加冗余。

1. 继续[选择在事件发生时需要联系的联系人、待命时间表和上报计划](#engagements)。

### （可选）选择与事件响应互动的资源
<a name="engagements"></a>

在事件发生时，务必要确定最合适的响应者。我们建议您采取以下措施作为最佳实践：

1. 在上报计划中添加联系人和待命时间表作为上报渠道。
**注意**  
目前，不支持将从其他账户共享的联系人添加到回应计划的功能。

1. 选择上报计划作为响应计划的互动方式。

有关联系人和上报计划的更多信息，请参阅 [在事件管理器中创建和配置联系人](contacts.md) 和 [在事件管理器中为响应者参与制定升级计划](escalation.md)。

**要选择与事件响应互动的资源**

1. 对于**互动**，选择任意数量的上报计划、待命时间表和个人联系人。

1. 继续选择性地[指定一个运行手册](#runbook)，作为事件缓解措施的一部分来运行。

### （可选）指定事件缓解措施的运行手册
<a name="runbook"></a>

您可以使用 A [AWS Systems Manager ut](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html) omation 中的运行手册（一种中的 AWS Systems Manager工具）来自动执行 AWS 云 环境中的常见应用程序和基础架构任务。

每个运行手册都定义了*运行手册工作流程*。运行手册工作流程包括 Systems Manager 对您的托管节点或其他 AWS 资源类型执行的操作。在 Incident Manager 中，运行手册推动事件响应和缓解措施。

有关在响应计划中使用运行手册的更多信息，请参阅 [将 Systems Manager 自动化运行手册集成到事件管理器中以进行事故补救](runbooks.md)。

要指定事件缓解措施的运行手册：

1. 对于**运行手册**，请执行以下操作之一：
   + 选择**从模板中克隆运行手册**，复制默认的 Incident Manager 运行手册。在**运行手册名称**中，为新运行手册输入描述性名称。
   + 选择**选择现有运行手册**。选择要使用的**所有者**、**运行手册**和**版本**。
**提示**  
要从头开始创建运行手册，请选择**配置新运行手册**。  
有关创建运行手册的更多信息，请参阅 [将 Systems Manager 自动化运行手册集成到事件管理器中以进行事故补救](runbooks.md)。

1. 在**参数**区域中，提供所选运行手册所需的任何参数。

   可用的参数由运行手册指定。一个运行手册可能需要的参数可能与另一个运行手册不同。有些参数可能是必填参，而另一些则是可选参数。

   在许多情况下，您可以选择手动输入参数的静态值，例如 Amazon EC2 实例列表 IDs。您也可以让 Incident Manager 提供事件动态生成的参数值。

1. （可选）对于 **AutomationAssumeRole**，请指定要使用的 AWS Identity and Access Management (IAM) 角色。该角色必须具有运行手册中指定的各个命令所需的权限。
**注意**  
如果未指定 `AssumeRole`，Incident Manager 会尝试使用运行手册服务角色来运行运行手册中指定的各个命令。

   请从以下内容中选择：
   + **输入 ARN 值** — 按照格式手动输入的亚马逊资源名称 (ARN)。 AssumeRole `arn:aws:iam::account-id:role/assume-role-name`例如 **arn:aws:iam::123456789012:role/MyAssumeRole**。
   + **使用现有服务角色**——从账户现有角色列表中选择一个具有所需权限的角色。
   + **创建新的服务角色**-从 AWS 托管策略中进行选择以附加到您的 AssumeRole。选择此选项后，对于 **AWS 托管式策略**，请从列表中选择一个或多个策略。

     您可以接受建议的新角色默认名称，也可以输入自己选择的名称。
**注意**  
该新运行手册的服务角色与您选择的特定运行手册相关联。它不能用于不同的运行手册。这是因为策略的资源部分不支持其他运行手册。

1. 对于**运行手册的服务角色**，指定要使用的 IAM 角色来提供访问和启动运行手册本身的工作流程所需的权限。

   至少，该角色必须允许对您的特定运行手册执行 `ssm:StartAutomationExecution` 操作。要使运行手册跨账户运行，该角色还必须允许您在 [在事件管理器 AWS 账户 中管理跨地区的事件](incident-manager-cross-account-cross-region.md) 期间创建的 `AWS-SystemsManager-AutomationExecutionRole` 角色执行 `sts:AssumeRole` 操作。

   请从以下内容中选择：
   + **创建新的服务角色**——Incident Manager 为您创建一个运行手册的服务角色，其中包括启动运行手册工作流程所需的最低权限。

     对于**角色名称**，您可以接受建议的默认名称，也可以输入自己选择的名称。我们建议使用建议的名称或在名称中保留运行手册的名称。这是因为新 AssumeRole 的 runbook 与您选择的特定 runbook 相关联，并且可能不包含其他 runbook 所需的权限。
   + **使用现有的服务角色**——您或 Incident Manager 之前创建的 IAM 角色会授予所需的权限。

     在**角色名称**中，选择要使用的现有角色的名称。

1. 展开 “**其他选项**”，然后选择以下选项之一，以指定 runbook 工作流程的运行 AWS 账户 位置。
   + **响应计划所有者的帐户**-在创建响应计划的所有者中启动运行手册工作流程。 AWS 账户 
   + **受影响的帐户**——在开始或报告事件的账户中启动运行手册工作流程。

     当您使用 Incident Manager 处理跨账户场景，且运行手册需要访问受影响的账户中的资源进行补救时，请选择**受影响的账户**。

      

1. 可以选择将[ PagerDuty 服务集成到响应计划中，继续操作](#integrations)。

### （可选）将 PagerDuty 服务集成到响应计划中
<a name="integrations"></a>

**将 PagerDuty 服务整合到响应计划中**

将事件管理器与集成时 PagerDuty，每当事件管理器 PagerDuty 创建事件时，都会创建相应的事件。中的事件除了在事件管理器中定义的寻呼工作流程和升级策略外，还 PagerDuty 使用您在其中定义的寻呼工作流程和升级策略。 PagerDuty 将事件管理器中的时间轴事件作为事件备注附上。

1. 展开**第三方集成**，然后选中 “**启用 PagerDuty 集成**” 复选框。

1. **在 Select** secret AWS Secrets Manager 中，选择存储用于访问 PagerDuty 账户的凭据的密钥。

   有关将您的 PagerDuty 证书存储在 Secrets Manager 密钥中的信息，请参阅[将 PagerDuty 访问凭证存储在 AWS Secrets Manager 密钥中](integrations-pagerduty-secret.md)。

1. 要获得**PagerDuty 服务**，请从您的 PagerDuty 账户中选择要在其中创建 PagerDuty 事件的服务。

1. 继续[添加可选标签并创建响应计划](#tags)。

### 添加标签并创建响应计划
<a name="tags"></a>

**要添加标签并创建响应计划**

1. （可选）在 “**标签**” 区域中，将一个或多个标签密钥 name/value 对应用于响应计划。

   标签是您分配给资源的可选元数据。通过标签，您可以按各种标准（如用途、所有者或环境）对资源进行分类。例如，您可能想要标记一个响应计划，以确定其旨在缓解的事件类型、所包含的上报渠道类型或与之相关的上报计划。有关标记 Incident Manager 资源的更多信息，请参阅 [在 Incident Manager 中标记资源](tagging.md)。

1. 选择**创建响应计划**。

    

# 在事件管理器中将来自其他服务的事件的潜在原因确定为 “调查结果”
<a name="findings"></a>

在 Incident Manager 中，*调查结果*是有关在事件发生前后发生的 AWS CodeDeploy 部署或 AWS CloudFormation 堆栈更新的信息，这些信息涉及一个或多个可能与事件相关的资源。可以将每项调查发现视为事件的潜在原因进行审查。有关这些潜在原因的信息已添加到事件的**事件详细信息**页面。由于有关这些部署和变更的信息随时可用，响应者无需手动搜索这些信息。这样可以减少评估潜在原因所需的时间，从而缩短从事件中恢复的平均时间 (MTTR)。

目前，事件管理器支持从两个方面收集调查结果 AWS 服务：[AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide)和[AWS CloudFormation](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/)。

调查发现是一项可选特征。您可以在[**做准备**向导](getting-started.md#getting-started-wizard)中启用它，也可以在首次加入 Incident Manager 时启用，也可以稍后在[**设置**页面](general-settings.md#settings-findings)上启用。

启用调查发现特征后，Incident Manager 会为您创建一个服务角色。此服务角色包括从 CodeDeploy 和中检索结果所需的权限 CloudFormation。

要在跨账户场景中使用调查发现，请在管理账户中启用该特征。之后， AWS Resource Access Manager (AWS RAM) 组织中的每个应用程序帐户都必须创建相应的服务角色。

请参阅以下主题，可帮助您使用调查发现特征。

**Topics**
+ [为调查发现启用和创建服务角色](#create-findings-role)
+ [配置支持跨账户调查发现的权限](#findings-role-permissions)

## 为调查发现启用和创建服务角色
<a name="create-findings-role"></a>

启用调查发现特征后，Incident Manager 会代表您创建一个名为 `IncidentManagerIncidentAccessServiceRole` 的服务角色。此服务角色提供事件管理员所需的权限，用于收集有关事件创建前后发生的 CodeDeploy 部署和 CloudFormation 堆栈更新的信息。

**注意**  
如果您在组织中使用 Incident Manager，则服务角色将在管理帐户中创建。要使用组织中其他账户的调查发现，必须在每个应用程序账户中创建服务角色。有关使用 CloudFormation 模板在应用程序账户中创建此角色的信息，请参阅中的步骤 4 [设置和配置跨账户事件管理](incident-manager-cross-account-cross-region.md#cross-account-cross-region-setup)。

此服务角色与 AWS 托管策略相关联。有关该策略中权限的信息，请参阅 [AWS 托管策略： AWSIncidentManagerIncidentAccessServiceRolePolicy](security-iam-awsmanpol.md#security-iam-awsmanpol-AWSIncidentManagerIncidentAccessServiceRolePolicy)。

有关在 Incident Manager 引导过程中启用调查发现的信息，请参阅 [开始使用 Incident Manager](getting-started.md)。

有关在完成引导过程后启用调查发现的信息，请参阅 [管理调查发现特征](general-settings.md#settings-findings)。

## 配置支持跨账户调查发现的权限
<a name="findings-role-permissions"></a>

要在中设置了组织的账户中使用调查结果功能 AWS RAM，每个应用程序帐户都必须配置权限，让事件管理员代表其担任管理账户的服务角色。

可以通过部署由提供的 CloudFormation 模板在应用程序账户中配置这些权限 AWS，该模板将创建该角色`IncidentManagerIncidentAccessServiceRole`。

有关在应用程序账户中下载和部署该模板的信息，请参阅 [在事件管理器 AWS 账户 中管理跨地区的事件](incident-manager-cross-account-cross-region.md) 中的步骤 4。