

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 概觀
<a name="overview"></a>

監控和提醒包含在 [AWS Well-Architected Framework](https://aws.amazon.com/architecture/well-architected/) 的四個支柱中。
+ [卓越營運支柱](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/design-telemetry.html)規定，您的工作負載應設計為包含遙測和監控。[Amazon Relational Database Service (Amazon RDS)](https://aws.amazon.com/rds/) 等 AWS 服務提供了解工作負載內部狀態所需的資訊 （例如指標、日誌、事件和追蹤）。當您操作 Amazon RDS 資料庫時，您會想要了解資料庫執行個體的運作狀態、偵測操作事件，並能夠同時回應計劃和非計劃事件。 AWS 提供監控工具，協助您判斷組織和業務成果何時面臨風險，或可能面臨風險，因此您可以在正確的時間採取適當的動作。
+ [效能效率支柱](https://docs.aws.amazon.com/wellarchitected/latest/performance-efficiency-pillar/monitoring.html)規定，您應該即時收集、彙總和處理效能相關指標，以監控 資源的效能，例如 Amazon RDS 資料庫執行個體。您可以識別效能降低並修復因素，例如未最佳化的 SQL 查詢或導致它的組態參數不足。您可以在測量超出預期界限時自動發出警示。建議您不僅將警示用於通知，也要啟動自動動作以回應偵測到的事件。您可以根據預先定義的閾值評估收集的指標，或使用機器學習演算法來識別異常行為。例如，若要偵測 CPU 使用率增加的趨勢，您可以收集和分析一段時間內的`cpuUtilization.total`指標。在 CPU 使用率達到硬性限制之前主動提醒異常情況，可協助您在問題影響客戶之前修復問題。
+ [可靠性支柱](https://docs.aws.amazon.com/wellarchitected/latest/reliability-pillar/monitor-workload-resources.html)將監控和提醒定義為關鍵，以確保您符合可用性需求。您的監控解決方案必須能夠有效地偵測失敗。當它偵測到問題或失敗時，其主要目標是提醒這些問題。實作持續可觀測性和監控實務對於雲端中的彈性架構至關重要。若要改善工作負載，您必須能夠測量它們並了解其狀態和運作狀態。從故障、水平可擴展性和容量佈建自動復原的設計原則取決於準確的監控和提醒服務。
+ [安全支柱](https://docs.aws.amazon.com/wellarchitected/latest/security-pillar/detection.html)討論偵測和預防非預期或不想要的組態變更，以及非預期的行為。您可以使用 MariaDB 稽核外掛程式來設定 Amazon RDS for MySQL 和 MariaDB 資料庫執行個體，以記錄資料庫活動，例如使用者登入和針對資料庫執行的特定操作。 [MariaDB ](https://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/Appendix.MySQL.Options.AuditPlugin.html) 外掛程式會將資料庫活動的記錄儲存在日誌檔案中，該檔案可以整合並匯入監控和提醒工具。日誌檔案會即時分析資料庫中是否有非預期或可疑的行為。這種非預期或可疑的行為可能表示您的 Amazon RDS 資料庫執行個體已遭到入侵，這會向業務發出潛在風險訊號。如果監控工具偵測到這類事件，它會啟用警示來啟動對安全事件的回應，這有助於解決可疑和惡意活動。

## 目標業務成果
<a name="targeted-business-outcomes"></a>

在監控和警示機制中實作最佳實務，可協助您確保應用程式和工作負載的高效能、彈性、高效率、安全且成本最佳化的基礎設施。您可以使用可觀測性工具即時收集、存放和視覺化指標、事件、追蹤和日誌，以觀察和分析資料庫的運作狀態和效能，從而防止相關 IT 服務降級或中斷。如果意外降級或服務中斷仍然發生，監控和提醒工具可協助您及時偵測問題、呈報、反應，以及快速調查和解決。雲端資料庫工作負載的全方位監控和提醒解決方案可協助您實現下列業務成果：
+ **改善客戶體驗。**可靠的服務可改善客戶的體驗。資料庫通常是數位服務的關鍵元件，例如 Web 和行動應用程式、媒體串流、付款、business-to-business(B2B) APIs 和整合服務。如果您可以在資料庫上監控和設定提醒，以快速偵測問題、有效率地調查問題，並儘快修復這些問題，以盡可能減少停機時間和其他中斷，您可以為客戶增強數位服務的可用性、安全性和效能。
+ **建立客戶信任。 **更好的效能和更順暢的使用者體驗可協助您贏得客戶的信任，進而在您的平台上產生更多業務。例如，提供可靠線上服務的付款處理服務供應商可預期客戶高度信任和忠誠度，進而產生更多客戶和更好的保留、增加可計費交易，以及產生更多收入的新創新服務。
+ **避免財務損失。 **資料庫基礎設施中的任何意外停機時間都可能會影響客戶使用您的應用程式執行的業務交易。在某些情況下，這可能會導致巨大的經濟損失。違反服務水準協議 (SLAs) 可能會導致失去客戶信任，進而導致收入損失。它也可以成為昂貴試驗的法律依據，客戶可能會根據您的責任和保固合約要求補償。根據軟體公司 [Atlassian Corporation 的一項研究](https://www.atlassian.com/incident-management/kpis/cost-of-downtime)，服務中斷的平均成本在每小時 140，000 ‒ 540，000 USD 的範圍內，取決於業務的類型和大小。穩定的資料庫環境是防止長時間中斷和業務損失的關鍵。
+ **展開值。**監控和提醒機制可協助您設計、開發和操作高可用性、彈性、可靠、高效能、經濟實惠且安全的數位服務，但這只是一個開始。您會希望您的組織隨著時間擴展和茁壯成長、增強現有的雲端工作負載，以及引進新的服務。新服務為您的客戶提供額外價值，並為您的業務帶來更多收入，從而為您的業務成長帶來飛輪效果。
+ **改善開發人員生產力。 **具有生產力和效率，且在開發任務中未遇到問題和瓶頸的開發人員，可以在較短的時間內提供高品質的產品。不過，軟體工程和 IT 操作通常會面臨複雜的挑戰，而且這種複雜性會隨著工作負載及其架構的規模而增加。為了分析分散式應用程式的效能和一致性，開發人員需要可提供相關指標和追蹤的工具。這些有助於盡快識別瑕疵程式碼成品和基礎設施元件，並協助判斷對最終使用者的影響。正確的監控和提醒工具套件可協助開發人員更妥善且更快速地編寫程式碼和進行測試。
+ **改善營運效率和效率。 **當您大規模操作雲端工作負載時，即使只有一小部分的效能改善，也可以節省數百萬美元。透過監控資料庫和分析指標、事件、日誌和追蹤，您可以了解和預測未來容量需求，並利用 中提供的成本節省 AWS 雲端。了解 Amazon RDS 工作負載和運作狀態可協助您回應事件、修正問題和規劃改善。