View a markdown version of this page

事件偵測與回應中 CloudWatch 警示的範例使用案例 - AWS 事件偵測與回應使用者指南

事件偵測與回應中 CloudWatch 警示的範例使用案例

下列使用案例提供如何在事件偵測與回應中使用 Amazon CloudWatch 警示的範例。這些範例示範如何設定 CloudWatch 警示以監控各種 AWS 服務的關鍵指標和閾值,讓您能夠識別和回應可能影響應用程式和工作負載可用性與效能的潛在問題。

範例使用案例 A:Application Load Balancer

您可以建立下列 CloudWatch 警示,以指出潛在的工作負載影響。若要這樣做,您可以建立指標數學,在成功連線低於特定閾值時發出警示。若要了解可用的 CloudWatch 指標,請參閱 Application Load Balancer 的 CloudWatch 指標

指標:HTTPCode_Target_3XX_Count;HTTPCode_Target_4XX_Count;HTTPCode_Target_5XX_Count. (m1+m2)/(m1+m2+m3+m4)*100 m1 = HTTP Code 2xx || m2 = HTTP Code 3xx || m3 = HTTP Code 4xx || m4 = HTTP Code 5xx

NameSpace:AWS/ApplicationELB

ComparisonOperator(Threshold):小於 x (x = 客戶的閾值)。

Period:60 秒

DatapointsToAlarm:3 之 3

遺失資料處理:將遺失資料視為違反

統計資料:總和

下圖顯示使用案例 A 的流程:

Application Load Balancer 的範例使用案例

範例使用案例 B:Amazon API Gateway

您可以建立下列 CloudWatch 警示,以指出潛在的工作負載影響。若要這樣做,您可以建立複合指標,在 API Gateway 中出現高延遲或高平均 4XX 錯誤數時發出警示。如需可用的指標,請參閱 Amazon API Gateway 維度和指標

指標:compositeAlarmAPI Gateway (ALARM(error4XXMetricApiGatewayAlarm)) OR (AALARM(latencyMetricApiGatewayAlarm))

NameSpace:AWS/API Gateway

ComparisonOperator(Threshold):大於 (x 或 y 客戶的閾值)

Period:60 秒

DatapointsToAlarm:1 之 1

遺失資料處理:將遺失資料視為未違反

統計資料:

下圖顯示使用案例 B 的流程:

API Gateway 的範例使用案例

範例使用案例 C:Amazon Route 53

您可以透過建立 Route 53 運作狀態檢查,以使用 CloudWatch 收集原始資料並將其處理成為可讀取、近乎即時的指標,藉此監控資源。您可以建立下列 CloudWatch 警示,以指出潛在的工作負載影響。您可以使用 CloudWatch 指標來建立警示,並在違反建立的閾值時觸發警示。如需可用的 CloudWatch 指標,請參閱 Route 53 運作狀態檢查的 CloudWatch 指標

指標:R53-HC-Success

NameSpace:AWS/Route 53

Threshold HealthCheckStatus:3 分鐘內 3 個資料點的 HealthCheckStatus < x (x 為客戶的閾值)

Period:1 分鐘

DatapointsToAlarm:3 之 3

遺失資料處理:將遺失資料視為違反

統計資料:最小值

下圖顯示使用案例 C 的流程:

Route 53 的範例使用案例

範例使用案例 D:使用自訂應用程式監控工作負載

請務必花些時間在此案例中定義適當的運作狀態檢查。如果您只驗證應用程式的連接埠是否開啟,則尚未驗證應用程式是否正常運作。此外,呼叫應用程式的首頁不一定是判斷應用程式是否正常運作的正確方式。例如,如果應用程式同時依賴資料庫和 Amazon Simple Storage Service (Amazon S3),則運作狀態檢查必須驗證所有元素。其中一種方法是建立監控網頁,例如 /monitor。監控網頁會呼叫資料庫,確認其可以連線並取得資料。監控網頁也會呼叫 Amazon S3。接著您將負載平衡器上的運作狀態檢查指向 /monitor 頁面。

下圖顯示使用案例 D 的流程:

使用自訂應用程式進行監控的範例使用案例