本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 設定 CDN 和 MediaTailor 整合的監控和擴展
<a name="setup-monitoring"></a>

有效的監控和擴展策略對於維持最佳效能以及 AWS Elemental MediaTailor 內容交付網路 (CDN) 整合的瀏覽者體驗至關重要。實作這些方法，以確保您的 CDN 整合大規模可靠地執行。

實作以下監控和擴展策略：

1. 設定這些關鍵指標的監控。如需適當目標值的指引，請參閱[使用 Amazon CloudWatch 監控 MediaTailor](https://docs.aws.amazon.com/mediatailor/latest/ug/monitoring-cloudwatch-metrics.html)，並參閱 CDN 供應商的最佳實務：
   + CDN 快取命中率 （根據您的內容類型和交付模式建立基準指標和目標）
   + 原始請求磁碟區 （正常操作期間的監控模式，以建立異常偵測的基準）
   + 依錯誤類型的錯誤率 （根據您的服務水準目標和 MediaTailor 最佳實務定義閾值）
   + 回應時間 （根據您的瀏覽者體驗需求和地理分佈設定適當的延遲目標）

   如需詳細的實作說明，請參閱[建立 CloudWatch 儀表板](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html)以視覺化 MediaTailor 和 CDN 指標。

1. 設定意外流量模式或效能降低的提醒。根據您的基準指標和服務層級目標設定閾值。如需設定警示的指引，請參閱[建立 Amazon CloudWatch 警示](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html)。考慮監控：
   + 與基準快取命中率的顯著偏差 （通常在低於 85-90% 時發出警示）
   + 原始伺服器請求量突然增加 （警示與基準相比增加 30% 或更高）
   + 超出定義閾值的錯誤率峰值 (4xx 錯誤通常為 1-2%，5xx 錯誤為 0.5%)
   + 回應時間降級超過可接受的層級 （資訊清單通常 >500 毫秒，區段 >200 毫秒）

   如需實作範例，請參閱用於建立有效監控儀表板和警示的 [CloudWatch 概念](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/cloudwatch_concepts.html)。

1. 為可預測的高流量事件建立擴展計畫。您的計劃應包含這些關鍵元素：
   + 事件前容量增加 （事件開始前 24-48 小時）
   + 漸進式檢視器漸進測試排程 （通常每 5 分鐘間隔 10-20% 的預期受眾）
   + 以受眾為基礎的區域容量分佈 （根據預期的區域檢視器比例配置容量）
   + 事件後擴展程序 （在事件結束後維持尖峰容量 30-60 分鐘）

   如需針對高流量事件進行擴展的實作指引，請參閱 AWS 媒體部落格上的[設定彈性end-to-end即時工作流程](https://aws.amazon.com/blogs/media/part-1-how-to-set-up-a-resilient-end-to-end-live-workflow/)。

1. 實作關鍵串流的容錯移轉和備援措施，包括：
   + 多區域 CDN 部署 （關鍵內容至少有兩個區域）
   + 備份原始伺服器 （設定為每 30 秒自動運作狀態檢查）
   + 根據運作狀態檢查自動容錯移轉觸發 （通常在 2-3 次檢查失敗之後）
   + 不同失敗案例的復原程序 （以特定回應時間目標記錄）

   如需詳細的實作步驟，請參閱[使用 CloudFront 原始伺服器容錯移轉最佳化高可用性](https://docs.aws.amazon.com/AmazonCloudFront/latest/DeveloperGuide/high_availability_origin_failover.html)。