AWS Systems Manager Incident Manager 不再向新客户开放。现有客户可以继续正常使用该服务。有关更多信息,请参阅 AWS Systems Manager Incident Manager 可用性变更。
本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
将迁移运行手册用于 OpsCenter
本指南 step-by-step说明如何将您的亚马逊 CloudWatch 警报和亚马逊 EventBridge 规则从 AWS Systems Manager 事件管理器迁移到 AWS Systems Manager OpsCenter 使用自动迁移运行手册。
有关 OpsCenter 功能的概述以及要了解事件管理器与之间的区别 OpsCenter,请参阅迁移到 AWS Systems Manager OpsCenter。
迁移概述
迁移过程使用 S ystems Manager Automation 运行手册将您的现有 CloudWatch 警报和 EventBridge 规则与 OpsCenter集成。该过程包括以下步骤:
-
部署基础架构-部署 CloudFormation 堆栈以创建迁移运行手册所需的资源。
-
迁移 CloudWatch 警报和 EventBridge 规则-运行自动化运行手册,将您的资源迁移到。 OpsCenter
-
清理资源-(可选)删除复制集和其他事件管理器资源。
注意
运行手册支持单一账户-区域对的迁移。如果您拥有跨多个账户或地区的资源,则必须分别为每个账户-区域组合执行迁移。
步骤 1:部署 CloudFormation 模板
部署 CloudFormation 模板以创建迁移运行手册所需的 IAM 角色、Amazon S3 存储桶和 Amazon SNS 主题。
所需的 IAM 权限
要部署此 CloudFormation 模板,您需要拥有 CloudFormation 堆栈操作 (、)、IAM 角色管理 (cloudformation:CreateStack、、、cloudformation:DescribeStacksiam:PassRole) iam:CreateRole iam:PutRolePolicy iam:AttachRolePolicy、Amazon S3 存储桶创建和配置 (s3:CreateBucket、s3:PutBucket*) 以及 Amazon SNS 主题操作 (、sns:CreateTopicsns:Subscribe、sns:SetTopicAttributes) 的 IAM 权限。
有关 CloudFormation 权限的完整详细信息,请参阅《 CloudFormation 用户指南》中的CloudFormation 权限参考。
使用控制台部署 CloudFormation 模板
-
下载并解压缩包含
AWS-IncidentManager-MigrationResources.yaml模板的 AWS-IncidentManager-MigrationResources .zip 文件。 -
在 https://console.aws.amazon.com/cloudformat
ion 上打开 CloudFormation 控制台。 -
选择创建堆栈。
-
在指定模板部分,选择上传模板文件。
-
选择 “选择文件”,然后选择该
AWS-IncidentManager-MigrationResources.yaml文件。 -
选择下一步。
-
在指定堆栈详细信息页面上,输入以下内容:
-
堆栈名称-输入名称(例如,
im-migration-infrastructure) -
ApprovalEmail-输入用于接收批准通知的电子邮件地址(仅在 r RequireManualApproval unbook 参数设置为 true 时使用)。
-
IsPrimaryMigrationRegion-选择这是
true否是你账户中第一个部署堆栈的区域,否则选择false
-
-
选择 Next(下一步)。
-
在配置堆栈选项页面上,请选择下一步。
-
在 “审阅” 页面上,向下滚动并选择 “我确认 CloudFormation 可能会使用自定义名称创建 IAM 资源”。
-
选择提交。
CloudFormation 显示CREATE_IN_PROGRESS状态。堆栈准备就绪CREATE_COMPLETE时,状态将更改为。
注意
如果您在多个区域都有 CloudWatch 警报或 EventBridge 规则,请在要执行迁移的每个区域部署此 CloudFormation 堆栈。
对于跨 AWS 组织部署多账户,请使用两个 CloudFormation StackSets:
-
主要 StackSet- IsPrimaryMigrationRegion 为每个账户一个区域设置为 true
-
次要 StackSet-对于所有其他区域 IsPrimaryMigrationRegion ,设置为 false
有关说明,请参阅《 CloudFormation 用户指南》 CloudFormation StackSets中的 “使用”。
要部署 CloudFormation 模板,请使用 AWS CLI
对于您账户中的第一个区域,请使用以下命令:
aws cloudformation create-stack \ --stack-name im-migration-infrastructure \ --template-body file://AWS-IncidentManager-MigrationResources.yaml \ --parameters ParameterKey=ApprovalEmail,ParameterValue=your-email@example.com \ ParameterKey=IsPrimaryMigrationRegion,ParameterValue=true \ --capabilities CAPABILITY_NAMED_IAM \ --region us-east-1
对于同一账户中的其他区域,IsPrimaryMigrationRegion请设置为false:
aws cloudformation create-stack \ --stack-name im-migration-infrastructure \ --template-body file://AWS-IncidentManager-MigrationResources.yaml \ --parameters ParameterKey=ApprovalEmail,ParameterValue=your-email@example.com \ ParameterKey=IsPrimaryMigrationRegion,ParameterValue=false \ --capabilities CAPABILITY_NAMED_IAM \ --region us-west-2
要验证堆栈状态,请执行以下操作:
aws cloudformation describe-stacks \ --stack-name im-migration-infrastructure \ --query 'Stacks[0].StackStatus' \ --output text
等到命令返回CREATE_COMPLETE后再继续下一步。
步骤 2:迁移 CloudWatch 警报和 EventBridge 规则
使用 Systems Manager Automation 运行手册将 CloudWatch 警报和 EventBridge 规则从事件管理器迁移到。 OpsCenter
迁移操作手册
有关这些运行手册的功能的更多信息,包括详细的步骤描述、输入参数和输出,请参阅 runbook 文档。
运行手册是如何运作的
两个迁移运行手册都遵循相同的工作流程:
-
发现和批处理-发现使用事件管理器响应计划操作配置的所有 CloudWatch 警报或 EventBridge 规则,并将其组织成可配置的批次。
-
手动批准(可选)-默认情况下,需要明确批准才能继续迁移,超时时间为 24 小时。Amazon SNS 通知将发送到部署期间 CloudFormation 指定的电子邮件地址。所有配置都备份到 Amazon S3,并存储待迁移资源的完整列表以供手动审查。通过设置为 false,可以跳过此步骤 RequireManualApproval 。
-
备份和迁移-如果手动批准设置为 true,则等待批准,然后继续将每个配置备份到 Amazon S3 并执行迁移。如果设置为 false,则直接进行备份和迁移。
输入参数
两个运行手册都需要以下参数:
- AutomationAssumeRole (必填)
-
堆栈
IM-Migration-Automation-Role创建的 ARN。 CloudFormation - ApproverArn (必填)
-
可以审查和批准迁移的 IAM 角色或用户的 ARN。
- S3BucketName (必填)
-
CloudFormation 堆栈创建的 Amazon S3 存储桶的名称。
- SNSTopicArn(必填)
-
堆栈创建的 Amazon SNS 主题的 ARN。 CloudFormation
- MaxNumberOfAlarmsToMigrate 或 MaxNumberOfRulesToMigrate (可选)
-
单次执行中要迁移的最大资源数。有效值:1、5、10、50、100、500、5000、10000、25000、50000、50000。默认值:10000。
- BatchSize (可选)
-
每批中要处理的资源数量。有效值:25、50、100、200、250、300、350、400、450、500、500。默认值:100。运行手册每次执行最多支持 100 × BatchSize 资源。
- RequireManualApproval (可选)
-
用于控制迁移前是否需要手动批准的布尔值。设置为 true(默认)时,您将收到一封 Amazon SNS 通知电子邮件,其中包含资源列表的 Amazon S3 位置以及用于批准、拒绝或取消的自动执行控制台的链接。设置为 false 时,运行手册将在发现和备份后自动继续运行。有效值:真、假。默认值:真。
使用控制台进行迁移
-
在 https://console.aws.amazon.com/systems-manager 上打开 System
s Manager 控制台。 -
在导航窗格中,选择自动化。
-
搜索运行手册名称(
AWS-MigrateIncidentManagerCloudWatchAlarms或AWS-MigrateIncidentManagerEventBridgeRules)。 -
选择执行自动化。
-
输入 CloudFormation 堆栈输出中的参数值。
-
(可选)
false如果您RequireManualApproval想跳过手动批准步骤,请将其设置为。 -
选择执行。
-
如果设置
RequireManualApproval为 true(默认),则在等待手动审核时您会收到一封电子邮件通知。该电子邮件包含指向自动化执行控制台页面的批准链接。查看 Amazon S3 存储桶中的资源列表,然后在 24 小时内通过电子邮件链接或控制台页面批准、拒绝或取消。只有在获得批准后才会进行迁移。如果设置为 false,则备份后会自动进行迁移。 -
等待执行状态变为 “成功”。
要使用迁移 AWS CLI
对于 CloudWatch 警报:
aws ssm start-automation-execution \ --document-name "AWS-MigrateIncidentManagerCloudWatchAlarms" \ --parameters '{ "AutomationAssumeRole": ["arn:aws:iam::123456789012:role/IM-Migration-Automation-Role"], "ApproverArn": ["arn:aws:iam::123456789012:role/Admin"], "S3BucketName": ["im-migration-logs-123456789012-us-east-1"], "SNSTopicArn": ["arn:aws:sns:us-east-1:123456789012:Automation-IM-Migration-Approvals"], "RequireManualApproval": ["false"] }' \ --region us-east-1
对于 EventBridge 规则:
aws ssm start-automation-execution \ --document-name "AWS-MigrateIncidentManagerEventBridgeRules" \ --parameters '{ "AutomationAssumeRole": ["arn:aws:iam::123456789012:role/IM-Migration-Automation-Role"], "ApproverArn": ["arn:aws:iam::123456789012:role/Admin"], "S3BucketName": ["im-migration-logs-123456789012-us-east-1"], "SNSTopicArn": ["arn:aws:sns:us-east-1:123456789012:Automation-IM-Migration-Approvals"], "RequireManualApproval": ["false"] }' \ --region us-east-1
要查看 Amazon S3 中的资源列表,请执行以下操作:
# For CloudWatch alarms aws s3 cp s3://im-migration-logs-123456789012-us-east-1/review/CloudWatch/review_CW_alarms_to_migrate_123456789012_us-east-1.json ./ # For EventBridge rules aws s3 cp s3://im-migration-logs-123456789012-us-east-1/review/EventBridge/review_EB_rules_to_migrate_123456789012_us-east-1.json ./
如果设置 RequireManualApproval 为 true,请查看资源列表并通过单击电子邮件通知中的批准链接或从自动化执行控制台页面批准迁移。如果设置为 false,则迁移将在备份后自动继续。
步骤 3:验证您的迁移
完成迁移后,请验证您的资源是否正常运行:
-
触发测试警报或事件-激活已迁移的 CloudWatch 警报或 EventBridge 规则之一以生成测试通知。
-
确认 OpsItem 创建-验证警报或事件触发 OpsCenter 时 OpsItem 是否自动创建。
-
验证严重性映射-检查原始事件管理器配置中的严重性级别是否正确保留在中 OpsItem。(仅适用于 CloudWatch 警报)。
步骤 4:清理事件管理器资源
成功迁移 CloudWatch 警报和 EventBridge 规则后,您可以选择清理事件管理器资源,使其完全脱离服务。
有关删除复制集、响应计划、联系人、运行手册和其他事件管理器资源的详细说明,请参阅清理事件管理器资源。
删除 CloudFormation 堆栈(可选)
您可以删除 CloudFormation 堆栈以移除为迁移创建的 IAM 角色、Amazon SNS 主题和 Amazon S3 存储桶。
重要
在删除堆栈之前,必须清空包含所有迁移资源备份的 Amazon S3 存储桶。 CloudFormation 无法删除包含对象的 Amazon S3 存储桶。
删除 CloudFormation 堆栈
aws cloudformation delete-stack --stack-name <your-stack-name>
监控和排查
CloudWatch 日志-迁移活动记录到 CloudWatch 日志:
-
CloudWatch 警报:
/aws/ssm/incidentmanager/cwmigration -
EventBridge 规则:
/aws/ssm/incidentmanager/ebmigration
Amazon S3 备份结构-在迁移之前,所有配置都将备份到 Amazon S3:
migration-logs-{AccountId}-{Region}/ ├── backups/ │ ├── CloudWatch/ │ │ └── {AccountId}/ │ │ └── {Region}/ │ │ └── {AlarmName}_backup.json │ └── EventBridge/ │ └── {AccountId}/ │ └── {Region}/ │ └── {RuleName}_backup.json └── review/ ├── CloudWatch/ │ └── review_CW_alarms_to_migrate_{AccountId}_{Region}.json └── EventBridge/ └── review_EB_rules_to_migrate_{AccountId}_{Region}.json
常见问题:
-
未收到亚马逊 SNS 通知(当 RequireManualApproval =true 时)-请查看亚马逊 SNS 主题订阅:
aws sns list-subscriptions-by-topic --topic-arn <sns-topic-arn> -
部分迁移失败-请查看 CloudWatch 日志以获取详细的错误消息,然后在缩小批量后重试自动化。
回滚程序:
如果您需要回滚迁移,请执行以下操作:
-
从 Amazon S3 检索备份:
aws s3 sync s3://im-migration-logs-123456789012-us-east-1/backups/ ./backups/ -
恢复资源:
# For CloudWatch alarms aws cloudwatch put-metric-alarm --cli-input-json file://backups/CloudWatch/123456789012/us-east-1/MyAlarm_backup.json # For EventBridge rules aws events put-targets --rule MyRule --targets file://backups/EventBridge/123456789012/us-east-1/MyRule_backup.json
常见问题
- 问:如果在批准期间自动化超时会发生什么?
-
答:如果未收到批准,自动化将在 24 小时后超时。您可以使用相同的参数重新启动自动化。
- 问:我能否跨区域迁移资源?
-
答:不是。 必须使用特定于区域的自动化执行来单独迁移每个区域。
- 问:迁移需要多长时间?
-
答:迁移时间取决于资源的数量:
大约 100 个警报/规则:5-10 分钟
大约 1000 个警报/规则:30-60 分钟
大约 10000 个警报/规则:2-4 小时
- 问:迁移到后严重性是否保留 OpsCenter?
-
答:能。在 CloudWatch 警报迁移期间,事件管理器响应计划影响级别中配置的严重性会被保留并自动映射到相应的 OpsCenter 严重性级别。这不适用于 EventBridge 规则。
- 问:我是否会因为执行自动化运行手册而被收费?
-
答:不是。 迁移自动化运行手册不会产生执行费用。但是,迁移后的 OpsCenter 使用将产生费用。有关详情,请参阅 S ystems Manager 定价
文档。