警报测试(游戏日演练)
AWS 事件检测及响应服务接入流程的最后一步是为您的新工作负载执行游戏日演练。执行警报摄取步骤后,AWS 事件检测及响应服务会确认您选择启动游戏日演练的日期和时间。
您的游戏日演练有两个主要目的:
功能验证:确认 AWS 事件检测及响应服务可以正常接收您的警报事件。而且,功能验证可确认您的警报事件触发相应的操作,例如,根据您在警报摄取期间的选择自动创建支持案例。
模拟:游戏日演练是对真实事件中可能发生的情况进行的端到端模拟。AWS 事件检测及响应服务可让您深入了解真实事件可能如何发展。游戏日演练可为您提供机会来提出问题或完善说明,进而改进参与。
在警报测试期间,AWS 事件检测及响应服务团队会与您协作,纠正发现的任何问题。
CloudWatch 警报测试
在游戏日演练期间,通过使用 AWS Command Line Interface手动将警报更改为警报状态来测试 Amazon CloudWatch 警报。您还可以从 AWS CloudShell 访问 AWS CLI。AWS 事件检测及响应服务为您提供了一系列 AWS CLI 命令供您在测试期间使用。
设置警报状态的 AWS CLI 命令示例:
aws cloudwatch set-alarm-state --alarm-name "ExampleAlarm" --state-value ALARM --state-reason "Testing AWS Incident Detection and Response" --regionus-east-1
注意
您用于警报测试的 AWS Identity and Access Management 用户或角色必须具有 cloudwatch:SetAlarmState 权限。
要详细了解如何手动更改 CloudWatch 警报的状态,请参阅 SetAlarmState。
要了解有关 CloudWatch API 操作所需权限的更多信息,请参阅 Amazon CloudWatch 权限参考。
第三方 APM 警报测试
使用第三方应用程序性能监控(APM)工具(例如 Datadog、Splunk、New Relic 或 Dynatrace)的工作负载需要不同的指示来模拟警报。游戏日演练开始时,AWS 事件检测及响应服务将要求您暂时更改警报阈值或比较运算符,以强制警报进入警报状态。此状态会触发 AWS 事件检测及响应服务的有效载荷。
游戏日演练可验证以下几点
成功摄取警报并正确配置警报。
AWS 事件检测及响应服务成功创建并摄取警报。
为您的事件创建支持案例,并通知您指定的运行手册联系人。
AWS 事件检测及响应服务可以通过您定义的会议桥方法与您联系。