

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# EMR 可觀測性最佳實務
<a name="emr-metrics-observability"></a>

EMR 可觀測性包含 AWS EMR 叢集的全方位監控和管理方法。基礎仰賴 Amazon CloudWatch 做為主要監控服務，並搭配 EMR Studio 和 Prometheus 和 Grafana 等第三方工具，以提高可見性。在本文件中，我們會探索叢集可觀測性的特定層面：

1. *[Spark 可觀測性](https://github.com/aws/aws-emr-best-practices/blob/main/website/docs/bestpractices/Applications/Spark/observability.md)* (GitHub) – 關於 Spark 使用者介面，您在 Amazon EMR 中有三個選項。

1. *[Spark 疑難排解](https://github.com/aws/aws-emr-best-practices/blob/main/website/docs/bestpractices/Applications/Spark/troubleshooting.md)* (GitHub) – 錯誤的解決方案。

1. *[EMR 叢集監控](https://aws.github.io/aws-emr-best-practices/docs/bestpractices/Observability/best_practices/) * (GitHub) – 監控叢集效能。

1. *[故障診斷 EMR ](https://github.com/aws/aws-emr-best-practices/blob/main/website/docs/bestpractices/Troubleshooting/Troubleshooting%20EMR.md)*(GitHub) – 識別、診斷和解決常見的 EMR 叢集問題。

1. *[成本最佳化](https://github.com/aws/aws-emr-best-practices/blob/main/website/docs/bestpractices/Cost%20Optimizations/best_practices.md)* (GitHub) – 本節概述執行具成本效益工作負載的最佳實務。

## 適用於 Apache Spark 應用程式的效能最佳化工具
<a name="performance-optimization"></a>

1. [AWS EMR Advisor](https://github.com/aws-samples/aws-emr-advisor) 工具會分析 Spark 事件日誌，以提供量身打造的建議，以最佳化 EMR 叢集組態、增強效能並降低成本。透過利用歷史資料，建議理想的執行器大小和基礎設施設定，實現更有效率的資源使用率並改善整體叢集效能。

1. [Amazon CodeGuru Profiler](https://github.com/amzn/amazon-codeguru-profiler-for-spark) 工具透過收集和分析執行時間資料，協助開發人員識別 Spark 應用程式中的效能瓶頸和效率低下。該工具與現有的 Spark 應用程式無縫整合，需要最少的設定，並透過 AWS 主控台提供有關 CPU 用量、記憶體模式和效能熱點的詳細洞察。