View a markdown version of this page

擷取 CloudWatch 警示 - AWS 事件偵測與回應使用者指南

擷取 CloudWatch 警示

AWS 事件偵測與回應可以擷取 Amazon CloudWatch 警示,以便為您的關鍵工作負載提供主動監控。藉由擷取 Amazon CloudWatch 警示以進行監控,AWS 事件偵測與回應就能:

  • 自動偵測警示何時進入「警示」狀態。

  • 讓團隊參與,以協作方式回應和解決事件。

為了確保您上線的警示有效,AWS 事件偵測與回應會建議下列最佳實務:

  • 使用指標數學運算式設定警示,以便在定期維護或批次任務執行期間抑制警示,以免誤報警示參與。

  • 根據預期的資料點交付頻率,在警示上設定遺失資料處理。例如,監控產生連續資料點串流指標的警示,應將遺失的資料視為「違反」(不良),因為遺失的資料點可能表示受監控的基礎資源發生問題。相對來說,監控不常報告資料點指標的警示 (例如,警示監控僅在失敗或錯誤發生時記錄資料點的指標),應將遺失的資料視為 NotBreaching (良好)。

  • 定義在對工作負載造成重大、持續影響時進入「警示」狀態的警示。例如,將警示設定為在經過一段預期的時間後自動取代運作狀態不佳的資源時觸發,而不要在一開始偵測到運作狀態不佳的資源時觸發。

  • 識別並建立直接代表工作負載之客戶體驗的自訂指標警示。

如需常見 AWS 服務 的建議 Amazon CloudWatch 警示清單,請參閱 AWS re:Post 上的事件偵測與回應警示最佳實務