

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 步驟 4：檢查 Amazon EMR 叢集和執行個體運作狀態
<a name="emr-troubleshoot-slow-4"></a>

 Amazon EMR 叢集是由在 Amazon EC2 執行個體上執行的節點所組成。如果那些執行個體受限於資源 (例如，CPU 或記憶體用盡)、發生網路連線問題，或是終止，則叢集處理速度會降低。

 叢集中的節點類型有三種：
+  **主節點** - 管理叢集。如果發生效能問題，整個叢集都會受到影響。
+  **核心節點** - 處理映射縮減的任務，並保留 Hadoop 分散式檔案系統 (HDFS)。如果其中一個節點發生效能問題，它可以讓 HDFS 操作以及映射縮減處理速度慢下來。您可以將額外的核心節點新增到叢集以提升效能，但不可以移除核心節點。如需詳細資訊，請參閱[手動調整執行中 Amazon EMR 叢集的大小](emr-manage-resize.md)。
+  **任務節點** - 處理映射縮減的任務。這些是純粹的運算資源而不會存放資料。您可以將任務節點新增到叢集以加速效能，或移除不需要的任務節點。如需詳細資訊，請參閱[手動調整執行中 Amazon EMR 叢集的大小](emr-manage-resize.md)。

 當您查看叢集的運作狀態時，您也該同時查看叢集的整體效能，以及個別執行個體的效能。有多種工具可供您使用：

## 使用 CloudWatch 檢查叢集運作狀態
<a name="emr-troubleshoot-slow-4-cw"></a>

 每個 Amazon EMR 叢集都會向 CloudWatch 報告指標。這些指標提供有關叢集的摘要效能資訊，例如總負載、HDFS 使用率、執行中任務、剩餘的任務、損毀區塊等等。查看 CloudWatch 指標可讓您深入了解叢集的目前狀況，並讓您在處理時了解執行速度緩慢的原因。除了使用 CloudWatch 來分析現有的效能問題，您可以設定提醒，此會讓 CloudWatch 在未來發生效能問題時進行提醒。如需詳細資訊，請參閱[使用 CloudWatch 來監控 Amazon EMR 指標](UsingEMR_ViewingMetrics.md)。

## 檢查作業狀態和 HDFS 運作狀態
<a name="emr-troubleshoot-slow-4-web-ui"></a>

使用叢集詳細資訊頁面上的 **Application user interfaces (應用程式使用者界面)**，以檢視 YARN 應用程式的詳細資訊。對於特定的應用程式，您可以深入了解進一步詳細資訊和直接存取日誌。此方式特別適用於 Spark 應用程式。如需詳細資訊，請參閱[檢視 Amazon EMR 應用程式歷史記錄](emr-cluster-application-history.md)。

Hadoop 提供一系列的 Web 介面，您可使用這些介面來檢視資訊。如需如何存取這些 web 介面的詳細資訊，請參閱 [檢視 Amazon EMR 叢集上託管的 Web 介面](emr-web-interfaces.md)。
+  JobTracker - 提供有關叢集處理的作業進度的資訊。您可以使用此介面來識別任務變為停滯的時間。
+  HDFS NameNode - 提供有關 HDFS 使用率和在每個節點上可用空間的百分比的資訊。您可以使用此介面來識別 HDFS 成為受資源限定的時間，且需要額外的容量。
+  TaskTracker - 提供有關叢集處理的作業之作業的資訊。您可以使用此介面來識別作業變為停滯的時間。

## 使用 Amazon EC2 檢查執行個體運作狀態
<a name="emr-troubleshoot-slow-4-ec2"></a>

 在叢集中尋找執行個體相關狀態資訊的另一個方式是使用 Amazon EC2 主控台。因為叢集中的每個節點是在 EC2 執行個體上執行，您可以使用 Amazon EC2 提供的工具來檢查他們的狀態。如需詳細資訊，請參閱[檢視 Amazon EC2 中的叢集執行個體](UsingEMR_Tagging.md)。