

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 建立已安裝 Hudi 的叢集
<a name="emr-hudi-installation-and-configuration"></a>

使用 Amazon EMR 發行版本 5.28.0 及更新版本時，如果已安裝 Spark、Hive 或 Presto，依預設，Amazon EMR 會安裝 Hudi 元件。若要在 Amazon EMR 上使用 Hudi，請建立已安裝下列一或多個應用程式的叢集：
+ Hadoop
+ Hive
+ Spark
+ Presto
+ Flink

您可以使用 AWS 管理主控台、 AWS CLI或 Amazon EMR API 建立叢集。

## 使用 建立具有 Hudi 的叢集 AWS 管理主控台
<a name="emr-hudi-create-cluster-console"></a>

1. 導覽至新的 Amazon EMR 主控台，然後從側邊導覽選取**切換至舊主控台**。如需有關切換至舊主控台時預期情況的詳細資訊，請參閱[使用舊主控台](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html#console-opt-in)。

1. 選擇 **Create cluster (建立叢集)**，然後選擇 **Go to advanced options (前往進階選項)**。

1. 在「軟體組態」下，對於**發行版本**，選擇 **emr-5.28.0** 或更新版本，然後選擇 **Hadoop**、**Hive**、**Spark**、**Presto** 和 **Tez** 以及叢集需要的其他應用程式。

1. 視您的應用程式需要設定其他選項，然後選擇 **Next (下一步)**。

1. 視需要設定 **Hardware (硬體)** 和 **General cluster settings (一般叢集設定)** 選項。

1. 對於 **Security Options (安全性選項)**，我們建議您選取 **EC2 key pair (EC2 金鑰對)**，以便使用 SSH 連線到主節點命令列。這可讓您執行本指南中描述的 Spark Shell 命令、Hive CLI 命令和 Hudi CLI 命令。

1. 視需要設定其他安全選項，然後選擇 **Create cluster (建立叢集)**。