View a markdown version of this page

Crear un clúster con Hudi instalado - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Crear un clúster con Hudi instalado

Con la versión 5.28.0 y posteriores de Amazon EMR, Amazon EMR instala los componentes de Hudi de forma predeterminada cuando se instalan Spark, Hive o Presto. Para utilizar Hudi en Amazon EMR, cree un clúster con una o varias de las siguientes aplicaciones instaladas:

  • Hadoop

  • Hive

  • Spark

  • Presto

  • Flink

Puede crear un clúster mediante la Consola de administración de AWS AWS CLI, la o la API de Amazon EMR.

  1. Vaya hasta la nueva consola de Amazon EMR y seleccione Ir a la consola antigua en el panel de navegación lateral. Para más información sobre lo que puede esperar al cambiar a la consola antigua, consulte Uso de la consola antigua.

  2. Elija Crear clúster e Ir a las opciones avanzadas.

  3. En Configuración de software, elija emr-5.28.0 o posterior para Versión y seleccione Hadoop, Hive, Spark, Presto y Tez, así como las demás aplicaciones que el clúster requiera.

  4. Configure otras opciones según sea necesario para la aplicación y, a continuación, elija Next (Siguiente).

  5. Configure las opciones de Hardware (Hardware) y General cluster settings (Configuración general del clúster) según lo desee.

  6. En Security Options (Opciones de seguridad), recomendamos seleccionar un EC2 key pair (Par de claves de EC2) que pueda utilizar para conectarse a la línea de comandos del nodo principal mediante SSH. Esto le permitirá ejecutar los comandos del intérprete de comandos de Spark, los comandos de la CLI de Hudi y los comandos de la CLI de Hudi descritos en esta guía.

  7. Configure las demás opciones de seguridad como desee y elija Create cluster (Crear clúster).