

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Instalación de paquetes en el clúster de Amazon EKS mediante Helm
<a name="sagemaker-hyperpod-eks-install-packages-using-helm-chart"></a>

Antes de crear un SageMaker HyperPod clúster y adjuntarlo a un clúster de Amazon EKS, debe instalar los paquetes con [Helm](https://helm.sh/), un administrador de paquetes para Kubernetes. Helm es una herramienta de código abierto para configurar un proceso de instalación para los clústeres de Kubernetes. Permite la automatización y la optimización de las instalaciones de dependencias y simplifica varias configuraciones necesarias para preparar el clúster de Amazon EKS como el orquestador (plano de control) de un clúster. SageMaker HyperPod 

El equipo SageMaker HyperPod de servicio proporciona un paquete de gráficos de Helm, que incluye las dependencias clave, como device/EFA complementos, [Kubeflow](https://www.kubeflow.org/docs/components/training/) Training Operator y las configuraciones de permisos asociadas.

**importante**  
Este paso de instalación de Helm es obligatorio. Si configura su clúster de Amazon EKS con [Consola de administración de AWS](sagemaker-hyperpod-eks-operate-console-ui-create-cluster.md) o [CloudFormation](smcluster-getting-started-eks-console-create-cluster-cfn.md), puede omitir este paso porque la instalación se gestiona automáticamente durante el proceso de configuración. Si configura el clúster directamente con las API, utilice el gráfico de Helm proporcionado para configurar el clúster de Amazon EKS. Si no configura su clúster de Amazon EKS con el diagrama de Helm proporcionado, es posible que el SageMaker HyperPod clúster no funcione correctamente o que el proceso de creación falle por completo. No se puede modificar el nombre del espacio de nombres de `aws-hyperpod`.

1. [Instale Helm](https://helm.sh/docs/intro/install/) en el equipo local.

1. Descargue los gráficos de Helm proporcionados SageMaker HyperPod `helm_chart/HyperPodHelmChart` en el [repositorio de SageMaker HyperPod CLI](https://github.com/aws/sagemaker-hyperpod-cli/tree/main/helm_chart).

   ```
   git clone https://github.com/aws/sagemaker-hyperpod-cli.git
   cd sagemaker-hyperpod-cli/helm_chart
   ```

1. Actualice las dependencias del gráfico de Helm, obtenga una vista previa de los cambios que se realizarán en el clúster de Kubernetes e instale el gráfico de Helm.

   ```
   helm dependencies update HyperPodHelmChart
   ```

   ```
   helm install hyperpod-dependencies HyperPodHelmChart --namespace kube-system --dry-run
   ```

   ```
   helm install hyperpod-dependencies HyperPodHelmChart --namespace kube-system
   ```

En resumen, la instalación de Helm configura varios componentes para el clúster de Amazon EKS, como la programación y las colas de trabajos (Kueue), la administración del almacenamiento, la integración de MLflow y Kubeflow. Además, los gráficos instalan los siguientes componentes para integrarlos con las funciones de resiliencia del SageMaker HyperPod clúster, que son componentes necesarios.
+ **Agente de monitoreo de salud**: instala el agente de monitoreo de salud proporcionado por. SageMaker HyperPod Esto es necesario si desea que su HyperPod clúster sea monitoreado. Health-monitoring los agentes se proporcionan como imágenes de Docker de la siguiente manera. En los `values.yaml` proporcionados de los gráficos de Helm, la imagen está preestablecida. El agente admite GPU-based instancias e Trainium-accelerator-based instancias (`trn1`,`trn1n`,`inf2`). Se instala en el espacio de nombres `aws-hyperpod`. Para encontrar su URI compatible, consulte [las regiones compatibles y sus URI de ECR en el repositorio sagemaker-hyperpod-cli en](https://github.com/aws/sagemaker-hyperpod-cli/blob/main/helm_chart/readme.md#6-notes). GitHub
+ **Verificación de estado profunda**: configura a`ClusterRole`, a ServiceAccount (`deep-health-check-service-account`) en el espacio de `aws-hyperpod` nombres y a para habilitar la función de verificación de estado profunda. `ClusterRoleBinding` SageMaker HyperPod Para obtener más información sobre el archivo RBAC de Kubernetes para una comprobación profunda del estado, consulte el archivo de configuración en [https://github.com/aws/sagemaker-hyperpod-cli/blob/main/helm_chart/HyperPodHelmChart/charts/deep-health-check/templates/deep-health-check-rbac.yaml](https://github.com/aws/sagemaker-hyperpod-cli/blob/main/helm_chart/HyperPodHelmChart/charts/deep-health-check/templates/deep-health-check-rbac.yaml)el repositorio de CLI. SageMaker HyperPod GitHub 
+ **`job-auto-restart`**- Esto configura a`ClusterRole`, a ServiceAccount (`job-auto-restart`) en el espacio de `aws-hyperpod` nombres y a`ClusterRoleBinding`, para habilitar la función de reinicio automático para los trabajos de PyTorch formación en. SageMaker HyperPod Para obtener más información sobre el archivo RBAC de Kubernetes`job-auto-restart`, consulte el archivo de configuración en [https://github.com/aws/sagemaker-hyperpod-cli/blob/main/helm_chart/HyperPodHelmChart/charts/job-auto-restart/templates/job-auto-restart-rbac.yaml](https://github.com/aws/sagemaker-hyperpod-cli/blob/main/helm_chart/HyperPodHelmChart/charts/job-auto-restart/templates/job-auto-restart-rbac.yaml)el repositorio CLI. SageMaker HyperPod GitHub 
+ Operador **MPI de Kubeflow: el operador MPI** [es un operador](https://github.com/kubeflow/mpi-operator) de Kubernetes que simplifica la ejecución de cargas de trabajo distribuidas de Machine Learning (ML) y High-Performance computación (HPC) mediante la interfaz de paso de mensajes (MPI) en los clústeres de Kubernetes. Instala MPI Operator v0.5. Se instala en el espacio de nombres `mpi-operator`.
+ **`nvidia-device-plugin`**: se trata de un complemento para dispositivos de Kubernetes que le permite exponer automáticamente las GPU de NVIDIA para que las consuman los contenedores del clúster de Amazon EKS. Permite a Kubernetes asignar y proporcionar acceso a las GPU solicitadas para dicho contenedor. Esto es necesario cuando se utiliza un tipo de instancia con GPU.
+ **`neuron-device-plugin`**: se trata de un complemento para dispositivos de Kubernetes que le permite exponer automáticamente chips de AWS Inferentia para que los consuman los contenedores del clúster de Amazon EKS. Permite a Kubernetes acceder a los chips Inferentia de los nodos del clúster y utilizarlos. AWS Esto es necesario cuando se utiliza un tipo de instancia de Neuron.
+ **`aws-efa-k8s-device-plugin`**— Se trata de un complemento para dispositivos de Kubernetes que permite el uso de AWS Elastic Fabric Adapter (EFA) en los clústeres de Amazon EKS. El EFA es un dispositivo de red que proporciona una comunicación de baja latencia y alto rendimiento entre las instancias de un clúster. Esto es necesario cuando se utiliza un tipo de instancia compatible con EFA.

Para obtener más información sobre el procedimiento de instalación mediante los gráficos de Helm proporcionados, consulte el [archivo README en el repositorio SageMaker HyperPod CLI](https://github.com/aws/sagemaker-hyperpod-cli/tree/main/helm_chart).