

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Instalar pacotes no cluster do Amazon EKS usando o Helm
<a name="sagemaker-hyperpod-eks-install-packages-using-helm-chart"></a>

Antes de criar um SageMaker HyperPod cluster e anexá-lo a um cluster Amazon EKS, você deve instalar pacotes usando o [Helm](https://helm.sh/), um gerenciador de pacotes para Kubernetes. O Helm é uma ferramenta de código aberto para configurar um processo de instalação para clusters Kubernetes. Ele permite a automação e a simplificação das instalações de dependências e simplifica várias configurações necessárias para preparar o cluster Amazon EKS como orquestrador (plano de controle) de um cluster. SageMaker HyperPod 

A equipe SageMaker HyperPod de serviço fornece um pacote de gráficos do Helm, que agrupa as principais dependências, como device/EFA plug-ins, plug-ins, [Kubeflow Training](https://www.kubeflow.org/docs/components/training/) Operator e configurações de permissão associadas.

**Importante**  
Essa etapa de instalação do Helm é obrigatória. Se você configurar o cluster do Amazon EKS usando o [Console de gerenciamento da AWS](sagemaker-hyperpod-eks-operate-console-ui-create-cluster.md)ou o [CloudFormation](smcluster-getting-started-eks-console-create-cluster-cfn.md), pode ignorar essa etapa porque a instalação é feita automaticamente durante o processo de configuração. Se você configurar o cluster diretamente usando as APIs, use o chart do Helm fornecido para configurar o cluster do Amazon EKS. A falha na configuração do seu cluster Amazon EKS usando o gráfico Helm fornecido pode fazer com que o SageMaker HyperPod cluster não funcione corretamente ou que o processo de criação falhe totalmente. O nome do namespace da `aws-hyperpod` não pode ser modificado.

1. [Instale o Helm](https://helm.sh/docs/intro/install/) na máquina local.

1. Faça o download dos gráficos do Helm fornecidos por SageMaker HyperPod localizados `helm_chart/HyperPodHelmChart` no repositório [SageMaker HyperPod CLI](https://github.com/aws/sagemaker-hyperpod-cli/tree/main/helm_chart).

   ```
   git clone https://github.com/aws/sagemaker-hyperpod-cli.git
   cd sagemaker-hyperpod-cli/helm_chart
   ```

1. Atualize as dependências do chart do helm, visualize as alterações que serão feitas no seu cluster Kubernetes e instale o chart do helm.

   ```
   helm dependencies update HyperPodHelmChart
   ```

   ```
   helm install hyperpod-dependencies HyperPodHelmChart --namespace kube-system --dry-run
   ```

   ```
   helm install hyperpod-dependencies HyperPodHelmChart --namespace kube-system
   ```

Em resumo, a instalação do Helm configura vários componentes para seu cluster Amazon EKS, incluindo agendamento e enfileiramento de trabalhos (Kueue), gerenciamento de armazenamento, integração com MLflow e Kubeflow. Além disso, os gráficos instalam os seguintes componentes para integração com os recursos de resiliência do SageMaker HyperPod cluster, que são componentes necessários.
+ **Agente de monitoramento de saúde** — Isso instala o agente de monitoramento de saúde fornecido por. SageMaker HyperPod Isso é necessário se você quiser que seu HyperPod cluster seja monitorado. Health-monitoring os agentes são fornecidos como imagens do Docker da seguinte forma. Conforme fornecido `values.yaml` nos charts do helm, a imagem é predefinida. O agente suporta GPU-based instâncias e Trainium-accelerator-based instâncias (`trn1`,`trn1n`,`inf2`). Ele é instalado no namespace `aws-hyperpod`. Para encontrar seu URI compatível, consulte [Regiões suportadas e seus URIs ECR no repositório sagemaker-hyperpod-cli em](https://github.com/aws/sagemaker-hyperpod-cli/blob/main/helm_chart/readme.md#6-notes). GitHub
+ **Verificação profunda de integridade** — Isso configura a`ClusterRole`, a ServiceAccount (`deep-health-check-service-account`) no `aws-hyperpod` namespace e a `ClusterRoleBinding` para ativar o recurso de verificação SageMaker HyperPod profunda de integridade. Para obter mais informações sobre o arquivo RBAC do Kubernetes para verificação profunda da integridade, consulte o arquivo de configuração no [https://github.com/aws/sagemaker-hyperpod-cli/blob/main/helm_chart/HyperPodHelmChart/charts/deep-health-check/templates/deep-health-check-rbac.yaml](https://github.com/aws/sagemaker-hyperpod-cli/blob/main/helm_chart/HyperPodHelmChart/charts/deep-health-check/templates/deep-health-check-rbac.yaml)repositório da CLI. SageMaker HyperPod GitHub 
+ **`job-auto-restart`**- Isso configura a`ClusterRole`, a ServiceAccount (`job-auto-restart`) no `aws-hyperpod` namespace e a`ClusterRoleBinding`, para ativar o recurso de reinicialização automática para trabalhos de PyTorch treinamento em. SageMaker HyperPod Para obter mais informações sobre o arquivo RBAC do Kubernetes para`job-auto-restart`, consulte o arquivo de configuração no [https://github.com/aws/sagemaker-hyperpod-cli/blob/main/helm_chart/HyperPodHelmChart/charts/job-auto-restart/templates/job-auto-restart-rbac.yaml](https://github.com/aws/sagemaker-hyperpod-cli/blob/main/helm_chart/HyperPodHelmChart/charts/job-auto-restart/templates/job-auto-restart-rbac.yaml)repositório CLI. SageMaker HyperPod GitHub 
+ **Operador Kubeflow MPI** — O Operador [MPI é um operador](https://github.com/kubeflow/mpi-operator) Kubernetes que simplifica a execução de cargas de trabalho distribuídas de Machine Learning (ML) e High-Performance Computação (HPC) usando a Message Passing Interface (MPI) em clusters Kubernetes. Ele instala o MPI Operator v0.5. Ele é instalado no namespace `mpi-operator`.
+ **`nvidia-device-plugin`**: Este é um plug-in de dispositivo Kubernetes que permite que você exponha automaticamente GPUs NVIDIA para consumo por contêineres em seu cluster Amazon EKS. Ele permite que o Kubernetes aloque e forneça acesso às GPUs solicitadas para esse contêiner. Obrigatório ao usar um tipo de instância com GPU.
+ **`neuron-device-plugin`**: Este é um plug-in de dispositivo Kubernetes que permite que você exponha automaticamente chips Inferentia da AWS para consumo por contêineres em seu cluster Amazon EKS. Ele permite que o Kubernetes acesse e utilize os chips AWS Inferentia nos nós do cluster. Obrigatório ao usar um tipo de instância Neuron.
+ **`aws-efa-k8s-device-plugin`**— Esse é um plug-in de dispositivo Kubernetes que permite o uso do AWS Elastic Fabric Adapter (EFA) em clusters Amazon EKS. O EFA é um dispositivo de rede que fornece comunicação de baixa latência e alta throughput entre instâncias em um cluster. Obrigatório ao usar um tipo de instância compatível com o EFA.

Para obter mais informações sobre o procedimento de instalação usando os gráficos Helm fornecidos, consulte o [arquivo README no repositório CLI SageMaker HyperPod ](https://github.com/aws/sagemaker-hyperpod-cli/tree/main/helm_chart).