

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Installation de packages sur le cluster Amazon EKS à l’aide de Helm
<a name="sagemaker-hyperpod-eks-install-packages-using-helm-chart"></a>

Avant de créer un SageMaker HyperPod cluster et de l'associer à un cluster Amazon EKS, vous devez installer des packages à l'aide de [Helm](https://helm.sh/), un gestionnaire de packages pour Kubernetes. Helm est un outil open source permettant de configurer un processus d’installation pour les clusters Kubernetes. Il permet l'automatisation et la rationalisation des installations de dépendances et simplifie les différentes configurations nécessaires pour préparer le cluster Amazon EKS en tant qu'orchestrateur (plan de contrôle) d'un cluster. SageMaker HyperPod 

L'équipe SageMaker HyperPod de service fournit un package de diagrammes Helm, qui regroupe les principales dépendances telles que les plug-ins, les device/EFA plug-ins, [Kubeflow Training Operator](https://www.kubeflow.org/docs/components/training/) et les configurations d'autorisation associées.

**Important**  
Cette étape d’installation de Helm est requise. Si vous configurez votre cluster Amazon EKS à l’aide de la [AWS Management Console](sagemaker-hyperpod-eks-operate-console-ui-create-cluster.md) ou d’[CloudFormation](smcluster-getting-started-eks-console-create-cluster-cfn.md), vous pouvez ignorer cette étape, car l’installation est gérée automatiquement pendant le processus de configuration. Si vous configurez le cluster directement à l’aide des API, utilisez les Charts de Helm fournis pour configurer votre cluster Amazon EKS. Si vous ne configurez pas votre cluster Amazon EKS à l'aide du graphique Helm fourni, le SageMaker HyperPod cluster risque de ne pas fonctionner correctement ou d'échouer complètement le processus de création. Le nom de l’espace de noms `aws-hyperpod` ne peut pas être modifié.

1. [Installez Helm](https://helm.sh/docs/intro/install/) sur votre ordinateur local.

1. Téléchargez les graphiques Helm SageMaker HyperPod fournis `helm_chart/HyperPodHelmChart` dans le [référentiel SageMaker HyperPod CLI](https://github.com/aws/sagemaker-hyperpod-cli/tree/main/helm_chart).

   ```
   git clone https://github.com/aws/sagemaker-hyperpod-cli.git
   cd sagemaker-hyperpod-cli/helm_chart
   ```

1. Mettez à jour les dépendances des Charts de Helm, prévisualisez les modifications qui seront apportées à votre cluster Kubernetes et installez les Charts de Helm.

   ```
   helm dependencies update HyperPodHelmChart
   ```

   ```
   helm install hyperpod-dependencies HyperPodHelmChart --namespace kube-system --dry-run
   ```

   ```
   helm install hyperpod-dependencies HyperPodHelmChart --namespace kube-system
   ```

En résumé, l’installation de Helm configure différents composants pour votre cluster Amazon EKS, notamment la planification des tâches et la mise en file d’attente (Kueue), la gestion du stockage, l’intégration MLflow et Kubeflow. En outre, les graphiques installent les composants suivants pour les intégrer aux fonctionnalités de résilience du SageMaker HyperPod cluster, qui sont des composants obligatoires.
+ **Agent de surveillance de l'état** — Ceci installe l'agent de surveillance de l'état fourni par. SageMaker HyperPod Cela est nécessaire si vous souhaitez que votre HyperPod cluster soit surveillé. Health-monitoring les agents sont fournis sous forme d'images Docker comme suit. Dans les Charts de Helm fournis, dans `values.yaml`, l’image est prédéfinie. L'agent prend en charge GPU-based les Trainium-accelerator-based instances et les instances (`trn1``trn1n`,,`inf2`). Il est installé dans l’espace de noms `aws-hyperpod`. Pour trouver votre URI compatible, consultez la section [Régions prises en charge et leurs URI ECR dans le référentiel sagemaker-hyperpod-cli](https://github.com/aws/sagemaker-hyperpod-cli/blob/main/helm_chart/readme.md#6-notes) sur. GitHub
+ **Contrôle de santé approfondi** : cela permet de configurer a`ClusterRole`, a ServiceAccount (`deep-health-check-service-account`) dans l'espace de `aws-hyperpod` noms et a `ClusterRoleBinding` pour activer la fonctionnalité de contrôle de santé SageMaker HyperPod approfondi. Pour plus d'informations sur le fichier RBAC Kubernetes pour une vérification approfondie de l'état de santé, consultez le fichier de configuration dans [https://github.com/aws/sagemaker-hyperpod-cli/blob/main/helm_chart/HyperPodHelmChart/charts/deep-health-check/templates/deep-health-check-rbac.yaml](https://github.com/aws/sagemaker-hyperpod-cli/blob/main/helm_chart/HyperPodHelmChart/charts/deep-health-check/templates/deep-health-check-rbac.yaml)le référentiel CLI. SageMaker HyperPod GitHub 
+ **`job-auto-restart`**- Cela permet de configurer a`ClusterRole`, a ServiceAccount (`job-auto-restart`) dans l'espace de `aws-hyperpod` noms et a`ClusterRoleBinding`, pour activer la fonctionnalité de redémarrage automatique pour les tâches de PyTorch formation dans. SageMaker HyperPod Pour plus d'informations sur le fichier RBAC Kubernetes pour`job-auto-restart`, consultez le fichier de configuration dans [https://github.com/aws/sagemaker-hyperpod-cli/blob/main/helm_chart/HyperPodHelmChart/charts/job-auto-restart/templates/job-auto-restart-rbac.yaml](https://github.com/aws/sagemaker-hyperpod-cli/blob/main/helm_chart/HyperPodHelmChart/charts/job-auto-restart/templates/job-auto-restart-rbac.yaml)le référentiel CLI. SageMaker HyperPod GitHub 
+ Opérateur **MPI Kubeflow — L'opérateur MPI** [est un opérateur](https://github.com/kubeflow/mpi-operator) Kubernetes qui simplifie l'exécution des charges de travail distribuées de Machine Learning (ML) et d' High-Performance informatique (HPC) à l'aide de l'interface MPI (Message Passing Interface) sur les clusters Kubernetes. Il installe MPI Operator v0.5. Il est installé dans l’espace de noms `mpi-operator`.
+ **`nvidia-device-plugin`** : il s’agit d’un plug-in d’appareil Kubernetes qui vous permet d’exposer automatiquement les GPU NVIDIA pour qu’ils soient consommés par les conteneurs dans votre cluster Amazon EKS. Il permet à Kubernetes d’allouer et de fournir l’accès aux GPU demandés pour ce conteneur. Obligatoire lors de l’utilisation d’un type d’instance avec GPU.
+ **`neuron-device-plugin`** : il s’agit d’un plug-in d’appareil Kubernetes qui vous permet d’exposer automatiquement les puces AWS Inferentia pour qu’elles soient consommées par les conteneurs dans votre cluster Amazon EKS. Il permet à Kubernetes d'accéder aux puces AWS Inferentia sur les nœuds du cluster et de les utiliser. Obligatoire lors de l’utilisation d’un type d’instance Neuron.
+ **`aws-efa-k8s-device-plugin`**— Il s'agit d'un plug-in pour appareil Kubernetes qui permet d'utiliser AWS Elastic Fabric Adapter (EFA) sur les clusters Amazon EKS. EFA est un périphérique réseau qui fournit une communication à faible latence et à haut débit entre les instances d’un cluster. Obligatoire lors de l’utilisation d’un type d’instance compatible EFA.

Pour plus d'informations sur la procédure d'installation à l'aide des diagrammes Helm fournis, consultez le [fichier README dans le référentiel SageMaker HyperPod CLI](https://github.com/aws/sagemaker-hyperpod-cli/tree/main/helm_chart).