

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 提醒
<a name="alerting"></a>

在 IT 基礎設施和 IT 服務的安全性、可用性、效能和可靠性方面，警示是最重要的資訊來源之一。它們會通知並通知 IT 團隊持續的安全威脅、中斷、效能問題或系統故障。

Information Technology Infrastructure Library (ITIL)，特別是 IT 服務管理 (ITSM) 實務，在監控和事件管理和事件管理最佳實務的焦點設定自動提醒。

事件警示是指監控工具產生警示，以通知您的團隊和自動化工具 （適用於可自動採取行動的項目） 有關 IT 環境中的變更、高風險動作或故障。IT 警示是防範系統中斷或可能成為重大事件變更的第一道防線。透過自動監控系統和產生中斷和風險變更的提醒，IT 團隊可以將停機時間降至最低，並降低伴隨的昂貴成本。

做為最佳實務， AWS Well-Architected Framework 會指定您使用[監控來產生警示型通知](https://docs.aws.amazon.com/wellarchitected/latest/framework/perf_monitor_instances_post_launch_generate_alarms.html)，並[主動監控和警示](https://docs.aws.amazon.com/wellarchitected/latest/framework/perf_monitor_instances_post_launch_proactive.html)。使用 CloudWatch 或第三方監控服務來設定警示，指出指標何時超出預期界限。

警示管理的目的是透過記錄、分類、動作定義和實作、關閉和事件後審核活動，建立高效且標準化的程序來處理 IT 相關事件和事件。

**章節**
+ [CloudWatch 警示](cloudwatch-alarms.md)
+ [EventBridge 規則](eventbridge-rules.md)
+ [指定動作、啟用和停用警示](enable-disable-alarms.md)

# CloudWatch 警示
<a name="cloudwatch-alarms"></a>

當您操作 Amazon RDS 資料庫執行個體時，您想要監控和產生不同類型指標、事件和追蹤的提醒。對於 MySQL 和 MariaDB 資料庫，關鍵資訊來源是[資料庫執行個體指標](db-instance-monitoring.md)、[作業系統指標](os-monitoring.md)、[事件、日誌和稽核線索](events-logs-audit.md)。我們建議您使用 [CloudWatch 警示](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html)，在您指定的期間內監看單一指標。

下列範例說明如何設定警示，以監控所有 `CPUUtilization` Amazon RDS 資料庫執行個體上的指標 (CPU 使用率百分比）。如果任何資料庫執行個體上的 CPU 使用率在 5 分鐘的評估期間內大於 80%，您可以將警示設定為觸發。

![\[設定 CPUUtilization 指標的警示\]](http://docs.aws.amazon.com/zh_tw/prescriptive-guidance/latest/amazon-rds-monitoring-alerting/images/setting-alarm.png)


這表示如果您的任何資料庫經歷 5 分鐘或更長時間的高 CPU 使用率 （超過 80%)，警示會進入 `ALARM` 狀態。如果 CPU 在短時間內偶爾爆增到超過 80% 的使用率，然後再次低於閾值，則警示會保持在 `OK` 狀態。下圖說明此邏輯。

![\[警示狀態和閾值\]](http://docs.aws.amazon.com/zh_tw/prescriptive-guidance/latest/amazon-rds-monitoring-alerting/images/thresholds.png)


CloudWatch 警示支援指標和複合警示。
+ *指標警示*會監看單一 CloudWatch 指標，並可在指標上執行數學表達式。指標警示可以傳送 Amazon SNS 訊息，進而根據指標在多個期間內相對於指定閾值的值，採取一或多個動作。
+ *複合警示*是以規則表達式為基礎，該表達式會評估多個警示的狀態，並且只有在符合規則的所有條件時，才會進入 `ALARM` 狀態。複合警示通常用於減少不必要的警示數量。例如，您可能有一個複合警示，其中包含數個已設定永遠不會採取動作的指標警示。當複合中的所有個別指標警示都已在 中時，複合警示會傳送警示 `ALARM`

CloudWatch 警示只能監看 CloudWatch 指標。如果您想要根據錯誤、慢查詢或一般日誌建立警示，您必須從日誌建立 CloudWatch 指標。您可以使用篩選條件從[日誌事件建立指標](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html)，如先前在[作業系統監控](os-monitoring.md)和[事件、日誌和稽核追蹤](events-logs-audit.md)區段中所討論。同樣地，若要提醒增強型監控指標，您必須在 CloudWatch Logs 的 CloudWatch 中建立指標篩選條件。

# EventBridge 規則
<a name="eventbridge-rules"></a>

[Amazon RDS 事件](https://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/USER_Events.Messages.html)會交付至 Amazon EventBridge，您可以使用 [EventBridge 規則](https://docs.aws.amazon.com/eventbridge/latest/userguide/eb-create-rule.html)來回應這些事件。例如，您可以建立 EventBridge 規則來通知您，並在某個特定資料庫執行個體停止或啟動時採取動作，如下畫面所示。

![\[資料庫執行個體的 EventBridge 規則會停止並啟動\]](http://docs.aws.amazon.com/zh_tw/prescriptive-guidance/latest/amazon-rds-monitoring-alerting/images/eventbridge-rules.png)


偵測`The DB instance has been stopped`事件的規則具有 Amazon RDS 事件 ID `RDS-EVENT-0087`，因此您可以將規則的 `Event Pattern` 屬性設定為：

```
{
  "source": ["aws.rds"],
  "detail-type": ["RDS DB Instance Event"],
  "detail": {
    "SourceArn": ["arn:aws:rds:eu-west-3:111122223333:db:database-3"],
    "EventID": ["RDS-EVENT-0087"]
  }
}
```

此規則`database-3`只會監控資料庫執行個體，並監看`RDS-EVENT-0087`事件。當 EventBridge 偵測到事件時，它會將事件傳送至資源或端點，稱為[目標](https://docs.aws.amazon.com/eventbridge/latest/userguide/eb-targets.html)。您可以在此指定在 Amazon RDS 執行個體關閉時要採取的動作。您可以將事件傳送至許多可能的目標，包括 SNS 主題、Amazon Simple Queue Service (Amazon SQS) 佇列、 AWS Lambda 函數、 AWS Systems Manager Automation、 AWS Batch 任務、Amazon API Gateway 等。例如，您可以建立傳送通知電子郵件和 SMS 的 SNS 主題，並將該 SNS 主題指派為 EventBridge 規則的目標。如果 Amazon RDS 資料庫執行個體`database-3`已停止，Amazon RDS 會將事件交付`RDS-EVENT-0087`至 EventBridge，並在其中偵測到事件。EventBridge 接著會呼叫目標，也就是 SNS 主題。SNS 主題設定為傳送電子郵件 （如下圖所示） 和 SMS。

![\[SNS 主題組態\]](http://docs.aws.amazon.com/zh_tw/prescriptive-guidance/latest/amazon-rds-monitoring-alerting/images/sns-notification.png)


# 指定動作、啟用和停用警示
<a name="enable-disable-alarms"></a>

您可以使用 CloudWatch 警示來指定警示在 `OK`、 `ALARM`和 `INSUFFICIENT_DATA` 狀態之間變更時應採取的動作。CloudWatch 內建與 SNS 主題的整合，以及數個不適用於 Amazon RDS 指標的其他動作類別，例如 Amazon Elastic Compute Cloud (Amazon EC2) 動作或 Amazon EC2 Auto Scaling 群組動作。EventBridge 通常用於撰寫規則，並定義在 Amazon RDS 指標觸發警示時採取動作的目標。CloudWatch 每次 CloudWatch 警示變更其狀態時，都會將事件傳送至 EventBridge。您可使用這些警示狀態變更事件在 EventBridge 中觸發事件目標。如需詳細資訊，請參閱 CloudWatch 文件中的[警示事件和 EventBridge](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/cloudwatch-and-eventbridge.html)。

您可能還需要管理警示；例如，在計劃的組態變更或測試期間自動停用警示，然後在計劃動作結束時重新啟用警示。例如，如果您有計劃、排程的資料庫軟體升級需要停機時間，而且有警示會在資料庫無法使用時啟用，您可以使用 API 動作 [DisableAlarmActions](https://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_DisableAlarmActions.html) 和 [EnableAlarmActions](https://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_EnableAlarmActions.html) 或 中的 [disable-alarm-actions](https://docs.aws.amazon.com/cli/latest/reference/cloudwatch/disable-alarm-actions.html) 和 [enable-alarm-actions](https://docs.aws.amazon.com/cli/latest/reference/cloudwatch/enable-alarm-actions.html) 命令來停用和啟用警示 AWS CLI。您也可以在 CloudWatch 主控台或使用 [DescribeAlarmHistory](https://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_DescribeAlarmHistory.html) API 動作或 中的 [describe-alarm-history](https://docs.aws.amazon.com/cli/latest/reference/cloudwatch/describe-alarm-history.html) 命令來檢視警示的歷史記錄 AWS CLI。CloudWatch 會保留警示歷史記錄 2 週。在 CloudWatch 主控台上**，您可以選擇導覽窗格中的我的最愛和最近**選單，以設定和存取您最愛的和最近瀏覽的警示。