本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
統一操作入門:加入關鍵警示以快速管理事件
為了協助快速通知您重大事件,請完成下列步驟,將警示加入 AWS 事件偵測和回應
定義和設定關鍵警示以快速管理事件。如需詳細資訊,請參閱《事件偵測和回應使用者指南》中的在事件偵測和回應中定義和設定警示。
-
如需使用 Amazon CloudWatch 設定警示的步驟,請參閱《事件偵測和回應使用者指南》中的在事件偵測和回應中定義和設定警示。 如需各種 的重要警示類型 AWS 建議 AWS 服務,請參閱事件偵測和回應 (IDR)
。如果您想要 AWS 自動建立已標記 AWS 資源的關鍵 AWS 警示,請聯絡您的 AWS Unified Operations 團隊。 -
若要重新導向或擷取具有直接 Amazon EventBridge 整合
的第三方 APM 工具的重要警示,例如 DataDog、NewRelic 等,請參閱《 AWS 事件偵測和回應使用者指南》中的從與 Amazon EventBridge 直接整合的 APMs 擷取警示。您必須部署一組 AWS 資源 (AWS Lambda 和 Amazon EventBridge 事件匯流排規則),將警示 (事件) 轉換和重新導向至 AWS 事件偵測和回應。您的 AWS Unified Operations 團隊可協助提供 CloudFormation 範本來安裝這些資源。 -
透過與 Amazon EventBridge 沒有直接整合的第三方 APM 工具,從您的自訂監控工具重新導向或擷取關鍵警示。如需詳細資訊,請參閱《 AWS 事件偵測和回應使用者指南》中的使用 Webhook 從 APMs 擷取警示,而不直接與 Amazon EventBridge 整合。您必須部署一組 AWS 資源 (API Gateway AWS Lambda 函數和 Amazon EventBridge 事件匯流排規則),將警示 (事件) 轉換並重新導向至 AWS 事件偵測和回應。您的 AWS Unified Operations 團隊可協助提供 CloudFormation 範本來安裝這些資源。
-
-
提供關鍵警示緩解動作的工作負載架構詳細資訊、聯絡人資訊和 Runbook 資訊。若要執行此動作,請執行下列步驟。
下載並完成每個關鍵工作負載或應用程式AWS 的事件偵測和回應工作負載入門問卷,以及與每個唯一工作負載相關的警示擷取問卷。
這些問卷中的資訊可協助 AWS 團隊開發事件修復 Runbook。此 Runbook 可讓採取適當的動作,在關鍵警示造成業務停機之前,快速進行故障診斷和修復。如需範例和範例資訊,請參閱AWS 事件偵測和回應中的工作負載加入和警示擷取問卷。
提供將關鍵警示加入 AWS 事件偵測和回應的存取權
在 AWS 帳戶 執行要由 AWS 事件管理團隊監控的關鍵工作負載的 中部署
AWSServiceRoleForHealth_EventProcessor服務連結角色 (SLR)。如需詳細資訊,請參閱佈建事件 AWS 偵測和回應的警示擷取存取權。注意
為了協助您加入大型 AWS 帳戶, AWS 可以為您提供 AWS Command Line Interface 指令碼,以快速追蹤此 SLR 的佈建。
(選用) 如果您的警示位於 Amazon CloudWatch 中,請確定用於警示測試 (上線之前) AWS Identity and Access Management 的使用者或角色在執行關鍵工作負載 AWS 帳戶 的 中具有
cloudwatch:SetAlarmStateIAM 許可。這是加入後警示測試 (遊戲) 所需的。如需詳細資訊,請參閱在AWS 事件偵測和回應中測試加入的工作負載。
建立 AWS 支援 案例以訂閱工作負載以進行快速事件管理。請注意,您的 AWS 帳戶 會自動啟用傳入快速事件管理,這表示您可以透過支援中心主控台 AWS Command Line Interface、 或 AWS SDK 向統一操作事件偵測和回應佇列提出案例,以進行快速動作。若要 AWS 讓 主動監控和建立具有傳出 AWS 支援 案例的事件,請為您的關鍵工作負載建立 AWS 支援 案例。若要執行此動作,請執行下列步驟。
登入 AWS Support Center Console
,選取建立案例,然後選取技術支援。 針對服務選取事件偵測和回應。
針對類別選取加入新的工作負載。
針對嚴重性選取一般指引。
連接您在上一個步驟中完成的工作負載和警示問卷。