

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Pré-requisitos para a observabilidade do cluster SageMaker HyperPod
<a name="sagemaker-hyperpod-cluster-observability-slurm-prerequisites"></a>

Antes de prosseguir com as etapas [Instalando pacotes de exportação de métricas em seu cluster HyperPod](sagemaker-hyperpod-cluster-observability-slurm-install-exporters.md), certifique-se de que os seguintes pré-requisitos foram atendidos:

## Habilitar o IAM Identity Center
<a name="sagemaker-hyperpod-cluster-observability-slurm-prerequisites-iam-id-center"></a>

Para habilitar a observabilidade do seu SageMaker HyperPod cluster, você deve primeiro habilitar o IAM Identity Center. Esse é um pré-requisito para implantar uma CloudFormation pilha que configure o espaço de trabalho Amazon Managed Grafana e o Amazon Managed Service for Prometheus. Ambos os serviços também exigem o IAM Identity Center para autenticação e autorização, garantindo o acesso seguro do usuário e o gerenciamento da infraestrutura de monitoramento.

Para orientações detalhadas a respeito de como habilitar o Centro de Identidade do IAM, consulte a seção [Habilitar o Centro de Identidade do IAM](https://docs.aws.amazon.com/singlesignon/latest/userguide/get-set-up-for-idc.html) no *Guia do usuário do Centro de Identidade do AWS IAM*. 

Depois de habilitar o Centro de Identidade do IAM com sucesso, configure uma conta de usuário que servirá como usuário administrativo em todos os procedimentos de configuração a seguir.

## Crie e implante uma CloudFormation pilha para observabilidade SageMaker HyperPod
<a name="sagemaker-hyperpod-cluster-observability-slurm-prerequisites-cloudformation-stack"></a>

Crie e implante uma CloudFormation pilha de SageMaker HyperPod observabilidade para monitorar métricas de HyperPod cluster em tempo real usando o Amazon Managed Service para Prometheus e o Amazon Managed Grafana. Para implantar a pilha, observe que você também deve habilitar o [Centro de Identidade do IAM](https://console.aws.amazon.com/singlesignon) com antecedência.

Use o CloudFormation script de amostra [https://github.com/aws-samples/awsome-distributed-training/blob/main/4.validation_and_observability/4.prometheus-grafana/cluster-observability.yaml](https://github.com/aws-samples/awsome-distributed-training/blob/main/4.validation_and_observability/4.prometheus-grafana/cluster-observability.yaml)que ajuda você a configurar as sub-redes Amazon VPC, os sistemas de arquivos FSx Amazon for Lustre, os buckets do Amazon S3 e as funções do IAM necessárias para criar uma pilha de observabilidade de clusters. HyperPod 