View a markdown version of this page

警示測試 (Gameday) - AWS 事件偵測與回應使用者指南

警示測試 (Gameday)

AWS 事件偵測與回應上線程序的最後一個步驟,是為您的新工作負載執行 Gameday。警示擷取步驟完成後,AWS 事件偵測與回應會確認您選擇開始 Gameday 的日期和時間。

您的 Gameday 有兩個主要目的:

  • 功能驗證:確認 AWS 事件偵測與回應可以正確接收您的警示事件。此外,功能驗證會確認您的警示事件觸發所需的動作,例如,自動建立案例 (若您在警示擷取期間選取此動作)。

  • 模擬:Gameday 會完整模擬真實事件期間可能發生的狀況。AWS 事件偵測與回應會讓您深入了解實際事件可能發生的情形。Gameday 是您提出問題或精進指示,以改善參與度的機會。

在警示測試期間,AWS 事件偵測與回應會與您一起修復發現的任何問題。

CloudWatch 警示測試

在 Gameday 期間,Amazon CloudWatch 警示是透過使用 AWS Command Line Interface 手動將警示變更為警示狀態來進行測試。您也可以從 AWS CloudShell 存取 AWS CLI。AWS 事件偵測與回應提供 AWS CLI 命令清單,可讓您在測試期間使用。

設定警示狀態的範例 AWS CLI 命令:

aws cloudwatch set-alarm-state --alarm-name "ExampleAlarm" --state-value ALARM --state-reason "Testing AWS Incident Detection and Response" --region us-east-1
注意

您用於警示測試的 AWS Identity and Access Management 使用者或角色必須具有 cloudwatch:SetAlarmState 許可。

若要進一步了解手動變更 CloudWatch 警示的狀態,請參閱 SetAlarmState

若要進一步了解 CloudWatch API 操作所需的許可,請參閱 Amazon CloudWatch 許可參考

第三方 APM 警示測試

使用 Datadog、Splunk、New Relic 或 Dynatrace 這類第三方應用程式效能監控 (APM) 工具的工作負載,需要不同的指示來模擬警示。在 Gameday 開始時,AWS 事件偵測與回應會要求您暫時變更警示閾值或比較運算子,以強制警示進入 ALARM 狀態。此狀態會觸發 AWS 事件偵測與回應的承載。

Gameday 會驗證下列幾點

  • 警示擷取成功,且您的警示組態正確。

  • AWS 事件偵測與回應成功建立和接收警示。

  • 此時會針對您的事件建立支援案例,而您指定的執行手冊聯絡人也會收到通知。

  • AWS 事件偵測與回應可以透過您定義的電話會議方式與您互動。