

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Utilisation des plans de formation pour les SageMaker HyperPod clusters Amazon
<a name="training-plan-utilization-for-hyperpod"></a>

Pour utiliser des plans de SageMaker formation pour votre SageMaker HyperPod cluster Amazon, vous devez spécifier le plan de formation que vous souhaitez utiliser au niveau de l'instance de cluster lors de la création ou de la mise à jour de votre cluster. 

**Note**  
Le plan de formation doit avoir le `Active` statut `Scheduled` ou pour être utilisé par un HyperPod cluster.
Assurez-vous que la configuration du cluster correspond à la zone de disponibilité (AZ) spécifiée dans votre plan d’entraînement.  
Pour la configuration du VPC, l'emplacement des ressources et la configuration des groupes de sécurité, reportez-vous [Configuration SageMaker HyperPod avec un Amazon VPC personnalisé](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-vpc) à la SageMaker HyperPod documentation.  
Si vous effectuez HyperPod une configuration avec Amazon FSx for Lustre, découvrez la sélection des régions et des zones, consultez les exigences de configuration des VPC et comprenez les meilleures pratiques en matière d'alignement des zones de disponibilité dans. [(Facultatif) Configuration SageMaker HyperPod avec Amazon FSx pour Lustre](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-fsx)
Vous pouvez sélectionner un plan pour chacun de vos groupes d’instances. Toutefois, nous vous déconseillons d’utiliser un plan d’entraînement pour le groupe d’instances principal d’un cluster, car les nœuds primaires nécessitent des ressources continues et stables qui ne correspondent pas à la durée fixe et à la nature potentiellement discontinue des capacités du plan d’entraînement.

**Topics**
+ [Créez un SageMaker HyperPod cluster sur les plans de formation à l'aide de la console SageMaker AI](use-training-plan-for-hyperpod-creation-using-console.md)
+ [Mettre à jour un SageMaker HyperPod cluster sur les plans de formation à l'aide de la console SageMaker AI](use-training-plan-for-hyperpod-update-using-console.md)
+ [Créez un SageMaker HyperPod cluster sur les plans de formation à l'aide de l' SageMaker API, ou AWS CLI](use-training-plan-for-hyperpod-creation-using-api-cli-sdk.md)
+ [Mettre à jour un SageMaker HyperPod cluster sur les plans de formation à l'aide de SageMaker l'API, ou AWS CLI](use-training-plan-for-hyperpod-update-using-api-cli-sdk.md)

# Créez un SageMaker HyperPod cluster sur les plans de formation à l'aide de la console SageMaker AI
<a name="use-training-plan-for-hyperpod-creation-using-console"></a>

Pour créer un SageMaker HyperPod cluster à l'aide de plans de formation depuis l'interface utilisateur de la console SageMaker AI, procédez comme suit :

1. Accédez à la console SageMaker AI à l'adresse [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Dans le volet de navigation de gauche, choisissez **Hyperpod**, puis **Créer un cluster**.

1. Lorsque vous configurez un groupe d’instances, vous pouvez sélectionner un plan adapté à vos besoins en capacité de calcul.

![\[SageMaker Interface de console AI affichant une fenêtre modale permettant de créer un groupe d'instances au sein d'un SageMaker HyperPod cluster. Le formulaire inclut des champs pour le nom du groupe d’instances, le type d’instance, la quantité, la capacité de l’instance (avec des options pour les plans d’entraînement et à la demande) et un chemin de répertoire pour le script de cycle de vie lors de la création.\]](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/images/training-plans/tp-create-hyperpod-cluster.png)


Vérifiez et créez votre cluster. Les groupes d’instances utilisant un plan d’entraînement effectuent une augmentation verticale jusqu’au nombre d’instances cible spécifié lorsque le plan d’entraînement devient `Active`, sous réserve de la capacité disponible. Trente minutes avant la fin de chaque période de capacité réservée, le groupe d’instances commence une réduction verticale jusqu’à zéro instance. Cet état verticalement réduit persiste jusqu’au début de la période de capacité réservée suivante ou jusqu’à la fin du plan. Tout au long de ce processus, un groupe d’instances saines conserve son statut `InService` après sa création initiale, quel que soit le nombre d’instances actuel.

# Mettre à jour un SageMaker HyperPod cluster sur les plans de formation à l'aide de la console SageMaker AI
<a name="use-training-plan-for-hyperpod-update-using-console"></a>

Vous pouvez mettre à jour, supprimer ou ajouter un plan de formation à un SageMaker HyperPod cluster existant à l'aide de l'interface utilisateur de la console SageMaker AI. Pour mettre à jour le groupe d'instances d'un SageMaker HyperPod cluster, procédez comme suit :

1. Accédez à la console SageMaker AI à l'adresse [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Dans le volet de navigation de gauche, choisissez **Hyperpod**.

1. Accédez à la page de détails du cluster en suivant le lien hypertexte associé au nom du cluster.

1. Lorsque vous configurez un groupe d’instances, vous pouvez mettre à jour votre plan pour l’adapter à vos besoins en capacité de calcul.

![\[SageMaker Interface de console AI affichant une fenêtre modale pour mettre à jour un groupe d'instances au sein d'un SageMaker HyperPod cluster. Le formulaire inclut des champs pour le nom du groupe d’instances, le type d’instance, la quantité, la capacité de l’instance (avec des options pour les plans d’entraînement et à la demande) et un chemin de répertoire pour le script de cycle de vie lors de la création.\]](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/images/training-plans/tp-update-hyperpod-clusters.png)


Vérifiez et mettez à jour votre cluster.

# Créez un SageMaker HyperPod cluster sur les plans de formation à l'aide de l' SageMaker API, ou AWS CLI
<a name="use-training-plan-for-hyperpod-creation-using-api-cli-sdk"></a>

Pour utiliser des plans de SageMaker formation pour votre SageMaker HyperPod cluster Amazon, spécifiez l'ARN du plan de formation que vous souhaitez utiliser dans le [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-TrainingPlanArn](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-TrainingPlanArn)paramètre de [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html)lorsque vous appelez l'opération [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html)d'API. 

Assurez-vous que le sous-réseau associé à l’AZ désignée de votre plan est inclus dans l’élément `VPCConfig` de la configuration de votre cluster. Vous pouvez récupérer le contenu `AvailabilityZone` d'un plan de formation en réponse à un appel d'[``DescribeTrainingPlan](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlan.html)API.

L'exemple suivant montre comment créer un nouveau SageMaker HyperPod cluster et fournir à un groupe d'instances un plan de formation dans l'`--instance-groups`attribut de la `create-cluster` AWS CLI commande. 

```
# Create a cluster         
aws sagemaker create-cluster \
  --cluster-name cluster-name \
  --instance-groups '[ \
        { \
            "InstanceCount": 1,\
            "InstanceGroupName": "controller-nodes",\
            "InstanceType": "ml.t3.xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
        },\
        { \
            "InstanceCount": 2, \
            "InstanceGroupName": "worker-nodes",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id}:role/execution_role}",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        }]'
```

Pour plus d'informations sur la création d'un HyperPod cluster à l'aide du AWS CLI, consultez [https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-cluster.html](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-cluster.html).

Après avoir créé le cluster, vous pouvez vérifier que la capacité de votre groupe d’instances a été correctement attribuée dans le plan d’entraînement en appelant l’API `DescribeCluster`.

```
aws sagemaker describe-cluster --cluster-name cluster-name
```

# Mettre à jour un SageMaker HyperPod cluster sur les plans de formation à l'aide de SageMaker l'API, ou AWS CLI
<a name="use-training-plan-for-hyperpod-update-using-api-cli-sdk"></a>

Vous pouvez ajouter, mettre à jour ou supprimer un plan de formation en mettant à jour le groupe d'instances d'un cluster existant à l'aide de la `update-cluster` AWS CLI commande. L'exemple suivant montre comment mettre à jour un SageMaker HyperPod cluster et fournir un nouveau plan de formation à un groupe d'instances.

```
# Update a cluster
aws sagemaker update-cluster \
  --cluster-name cluster-name \
  --instance-groups '[ \
        { \
            "InstanceCount": 1,\
            "InstanceGroupName": "controller-nodes",\
            "InstanceType": "ml.t3.xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
        },\
        { \
            "InstanceCount": 2, \
            "InstanceGroupName": "worker-nodes",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id}:role/execution_role}",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        },\
        {\
            "InstanceCount": 1,\
            "InstanceGroupName": "worker-nodes-2",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        }\
    ]'
```