

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 減少 MTTD
<a name="reducing-mttd"></a>

 減少失敗意味著盡快發現故障。MTTD縮短基MTTD於可觀察性，或者您如何檢測工作負載以了解其狀態。*客戶應在工作負載的關鍵子系統中監控其「客戶體驗*」指標，以便主動識別問題發生時機 (請參閱[附錄 1 — 以MTTD及關MTTR鍵指標以取得有關這些指標](appendix-1-mttd-and-mttr-critical-metrics.md)的詳細資訊)。). 客戶可以使用 [Amazon CloudWatch Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html) 建立監控您APIs和主控台的*金絲雀*，以主動衡量使用者體驗。還有許多其他健康狀態檢查機制可用於最小化MTTD，例如 E [lastic Load Balancing (ELB) 運作狀態檢查](https://docs.aws.amazon.com/autoscaling/ec2/userguide/as-add-elb-healthcheck.html)、[Amazon Route 53 運作狀態檢查](https://docs.aws.amazon.com/Route53/latest/DeveloperGuide/health-checks-types.html)等。（請參閱 [Amazon Builders' Library-實施運行狀態檢查](https://aws.amazon.com/builders-library/implementing-health-checks/)。） 

 您的監視也需要能夠偵測整個系統和個別子系統中的部分故障。您的可用性、失敗和延遲指標應使用錯誤隔離界限的維度作為[CloudWatch 量](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/cloudwatch_concepts.html#Dimension)度維度。例如，假設單一EC2執行個體屬於儲存格架構的一部分，位於 us-east-1 區域的 use1-az1 AZ 中，該執行個體屬於其控制平面子系統的工作負載更新API的一部分。伺服器推送指標時，可以使用其執行個體 ID、AZ、地區、API名稱和子系統名稱作為維度。這使您可以在每個維度上具有可觀察性並設置警報以檢測故障。