

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 创建安装了 Hudi 的集群
<a name="emr-hudi-installation-and-configuration"></a>

在 Amazon EMR 版本 5.28.0 及更高版本中， Amazon EMR 默认情况下会在安装 Spark、Hive 或 Presto 时安装 Hudi 组件。要在 Amazon EMR 上使用 Hudi，请在安装了以下一个或多个应用程序后创建集群：
+ Hadoop
+ Hive
+ Spark
+ ：Presto
+ Flink

您可以使用 AWS 管理控制台 AWS CLI、或 Amazon EMR API 创建集群。

## 要使用 Hudi 创建集群，请使用 AWS 管理控制台
<a name="emr-hudi-create-cluster-console"></a>

1. 导航到 Amazon EMR 新控制台，然后从侧面导航栏中选择**切换到旧控制台**。有关切换到旧控制台后预期情况的更多信息，请参阅 [Using the old console](https://docs.aws.amazon.com/emr/latest/ManagementGuide/whats-new-in-console.html#console-opt-in)。

1. 依次选择 **Create cluster (创建集群)**、**Go to advanced options (转到高级选项)**。

1. 在“软件配置”下，对于**发行版**选择 **emr-5.28.0** 或更高版本，然后选择 **Hadoop**、**Hive**、**Spark**、**Presto** 和 **Tez** 以及集群需要的其他应用程序。

1. 根据应用程序的需要配置其它选项，然后选择**下一步**。

1. 根据需要配置 **Hardware (硬件)** 和 **General cluster settings (常规集群设置)** 的选项。

1. 对于 **Security Options (安全选项)**，我们建议您选择一个 **EC2 key pair (EC2 密钥对)**，您可以使用它通过 SSH 连接到主节点命令行。这允许您运行本指南中描述的 Spark shell 命令、Hive CLI 命令和 Hudi CLI 命令。

1. 根据需要选择其它安全选项，然后选择 **Create cluster (创建集群)**。