

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Réservez des plans de formation pour vos postes ou HyperPod clusters de formation
<a name="reserve-capacity-with-training-plans"></a>

Les plans de SageMaker formation Amazon sont une fonctionnalité qui vous permet de réserver et d'optimiser l'utilisation de la capacité du GPU pour les charges de travail de formation de modèles d'IA à grande échelle. Cette fonctionnalité donne accès à des types d'instances très recherchés qui couvrent une gamme d'options informatiques accélérées par GPU, notamment les dernières technologies GPU NVIDIA et les puces Trainium. AWS Grâce aux plans de SageMaker formation, vous pouvez garantir un accès prévisible à ces ressources informatiques très demandées et à hautes performances dans les délais et les budgets que vous avez définis, sans avoir à gérer l'infrastructure sous-jacente. Cette flexibilité est particulièrement utile pour les entreprises confrontées aux défis liés à l’acquisition et à la planification de ces instances de calcul avec trop d’abonnements pour leurs charges de travail critiques liées à l’IA.

## Quels sont les plans SageMaker de formation
<a name="training-plans-what-is"></a>

SageMaker les plans de formation vous permettent de réserver une capacité de calcul adaptée à vos besoins en ressources cibles, tels que les postes de SageMaker formation ou les SageMaker HyperPod clusters. Le service gère automatiquement la réservation, le provisionnement de ressources de calcul accélérées, la configuration de l’infrastructure, l’exécution des charges de travail et la récupération en cas de défaillance de l’infrastructure.

SageMaker les plans de formation se composent d'un ou de plusieurs blocs de capacités réservées, chacun étant défini par les paramètres suivants :
+ Type d’instance spécifique
+ Quantité d’instances
+ Zone de disponibilité
+ Duration
+ Horaires de début et de fin

**Note**  
Les plans de formation sont spécifiques à leur ressource cible ( SageMaker Training Job ou SageMaker HyperPod) et ne peuvent pas être échangés.
Plusieurs blocs de capacité réservée dans un même plan d’entraînement peuvent être discontinus. Cela signifie qu’il peut y avoir des écarts entre les blocs de capacité réservée.

## Avantages des plans SageMaker de formation
<a name="training-plans-benefits"></a>

SageMaker les plans de formation offrent les avantages suivants :
+ **Accès prévisible** : réservez la capacité GPU pour vos charges de travail de machine learning dans des périodes spécifiées.
+ **Gestion des coûts** : planifiez et budgétisez à l’avance les besoins d’entraînement à grande échelle.
+ **Gestion automatisée des ressources** : les plans de SageMaker formation prennent en charge le provisionnement et la gestion de l'infrastructure.
+ **Flexibilité** : créez des plans de formation pour diverses ressources, y compris les emplois de SageMaker formation et les SageMaker HyperPod clusters.
+ **Tolérance aux pannes** : profitez de la restauration automatique en cas de défaillance de l'infrastructure et de la migration de la charge de travail entre les zones de disponibilité pour les tâches de formation à l' SageMaker IA.

## SageMaker plans de formation, réservation à l'avance et horaires de début flexibles
<a name="training-plan-reservation-timing"></a>

SageMaker les plans de formation vous permettent de réserver des capacités de calcul à l'avance, avec des heures de début et des durées flexibles. 
+ **Réservation à l’avance** : vous pouvez réserver un plan d’entraînement jusqu’à 8 semaines (56 jours) avant la date de début.
+ **Délai minimum** : les offres de plans de SageMaker formation peuvent être disponibles pour commencer dans les 30 minutes suivant la réservation, sous réserve de disponibilité.
**Note**  
Vous pouvez rechercher et acheter un plan qui sera accessible dans les 30 minutes. Pour garantir une activation rapide, la transaction de paiement doit être terminée avec succès au moins 5 minutes avant l’horaire de début souhaité. Par exemple, si vous souhaitez qu’un plan commence à 14h00, vous pouvez effectuer une recherche de dernière minute jusqu’à 13h30 et terminer votre achat avant 13h55 pour garantir que le plan sera prêt à 14h00.
+ **Durée de réservation et quantité d'instances** : les plans de SageMaker formation vous permettent de réserver des instances avec des options de durée et de quantité spécifiques. Pour les types d'instances disponibles dans une option donnée Région AWS, de durée et de quantité, consultez[Types d'instances pris Régions AWS en charge et tarifs](#training-plans-supported-instances-and-regions).
+ **Heure de fin** : les plans d’entraînement se terminent toujours à 11h30 UTC le dernier jour de la réservation.
+ **Fin du plan de formation** : si vous utilisez des tâches de formation comme ressource cible et qu'il reste 30 minutes dans une capacité réservée, les plans de SageMaker formation initient le processus consistant à mettre fin à toutes les instances en cours d'exécution au sein de ce bloc jusqu'à ce que la capacité réservée suivante devienne active. Vous conservez un accès complet à votre plan d’entraînement jusqu’à 30 minutes avant l’heure de fin du dernier bloc de capacité réservée.

  Si votre ressource cible est un SageMaker HyperPod cluster, ce délai est d'une heure.

## SageMaker plans de formation, flux de travail utilisateur
<a name="training-plans-workflow"></a>

SageMaker les plans de formation comportent les étapes suivantes :

Étapes d’administration :

1. **Recherche et révision** : recherchez les offres de plans disponibles qui répondent à vos besoins en matière de calcul, tels que le type d’instance, le nombre, l’heure de début et la durée.

1. **Création d’un plan** : réservez un plan d’entraînement qui répond à vos besoins en utilisant l’identifiant de l’offre de plan que vous avez choisie.

1. **Paiement et planification** : une fois le paiement initial réussi, le statut du plan devient `Scheduled`.

Étapes à suivre pour les utilisateurs du plan et les ingénieurs ML :

1. **Allocation de ressources** : utilisez votre plan pour mettre en file d'attente les tâches de formation à l' SageMaker IA ou pour les allouer à un groupe d'instances de SageMaker HyperPod cluster.

1. **Activation** : lorsque la date de début du plan arrive, elle devient `Active`. Sur la base de la capacité réservée disponible, les plans de SageMaker formation lancent automatiquement des tâches de formation ou fournissent des groupes d'instances.

**Note**  
Le statut du plan d’entraînement passe de `Scheduled` à `Active` au début d’une période de capacité réservée, puis revient à `Scheduled` en attendant le début de la période de capacité réservée suivante. 

Les diagrammes suivants fournissent un aperçu complet de la manière dont les plans de SageMaker formation interagissent avec les différents[target resources](#training-plans-target-resources), illustrant le cycle de vie d'un plan et son rôle dans l'allocation des ressources pour les tâches de SageMaker formation et les SageMaker HyperPod clusters.
+ **Plans de SageMaker formation pour Training Job** : Le premier diagramme illustre le end-to-end flux de travail de l'interaction entre un plan de formation et un SageMaker Training Job.   
![\[Facturation, réservation de capacité avec plans de formation et SageMaker Training Job. Illustration du cycle de vie des plans d’entraînement et des états de la tâche d’entraînement gérés par les administrateurs et les ingénieurs ML.\]](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/images/training-plans/tp-training-plan-for-training-jobs.png)
+ **Plans de formation pour les SageMaker HyperPod clusters** : le deuxième diagramme illustre le end-to-end flux de travail de l'interaction entre un plan de formation et un groupe d' SageMaker HyperPod instances.  
![\[Facturation, réserve de capacité avec plans d’entraînement et flux de travail de gestion du groupe d’instances. Illustration du cycle de vie du plan d’entraînement et des états du groupe d’instances gérés par les administrateurs et les ingénieurs ML.\]](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/images/training-plans/tp-training-plan-for-hyperpod.png)

## Types d'instances pris Régions AWS en charge et tarifs
<a name="training-plans-supported-instances-and-regions"></a>

Les plans d’entraînement prennent en charge les réservations pour les types d’instances hautes performances spécifiques suivants, chacun étant disponible dans certaines Régions AWS :
+ **ml.p4d.24xlarge**
+ **ml.p5.48xlarge**
+ **ml.p5e.48xlarge**
+ **ml.p5en.48xlarge**
+ **ml.trn1.32xlarge**
+ **ml.trn2.48xlarge**
+ **ml.p6-b200.48xlarge**
+ **ml.c6i-32xlargesc**

**UltraServers**
+ **ml.p6e-gb200.36xlarge**
+ **ml.p6e-gb200.72xlarge**

**Note**  
La disponibilité des types d’instances peut changer au fil du temps. Pour obtenir le plus up-to-date d'informations sur les types d'instances disponibles par région, ainsi que sur leurs prix respectifs, consultez la section [SageMaker Tarification](https://aws.amazon.com/sagemaker-ai/pricing/). Accédez à la section des **plans de formation SageMaker HyperPod flexibles d'Amazon** sous **Tarification à la demande**. Sélectionnez une région pour visualiser la liste des types d’instances disponibles.

La disponibilité dans plusieurs régions permet de choisir l’emplacement le plus adapté aux charges de travail, en tenant compte de facteurs tels que les exigences en matière de résidence des données et la proximité des autres services AWS .

**Important**  
Vous pouvez utiliser des plans de SageMaker formation pour réserver des instances avec les options de durée de réservation et de quantité d'instances suivantes.  
Les durées de réservation sont disponibles par incréments de 1 jour, de 1 à 182 jours.
Les options de quantité d’instances de réservation sont de 1, 2, 4, 8, 16, 32 ou 64 instances.
Assurez-vous que vos tâches de formation ou vos quotas de HyperPod service autorisent un nombre maximum d'instances par type d'instance supérieur au nombre d'instances spécifié dans votre plan. Pour consulter vos quotas actuels ou demander une augmentation des quotas, consultez [Afficher les quotas des plans de SageMaker formation à l'aide de la console AWS de gestion](training-plan-quotas.md).

## UltraServers en SageMaker IA
<a name="training-plans-ultraservers"></a>

UltraServers en SageMaker IA proposent un ensemble d'instances interconnectées via un domaine réseau à haut débit. Par exemple, le P6e- GB200 UltraServer connecte jusqu'à 18 `p6e-gb200.36xlarge` instances sous un même NVLink domaine NVIDIA. Avec 4 NVIDIA Blackwell GPUs par instance, chaque P6e- GB200 UltraServer en supporte 72 GPUs, ce qui vous permet d'exécuter vos plus grandes charges de travail d'IA avec des performances élevées en matière d'IA. SageMaker 

Lorsque vous utilisez l' UltraServers SageMaker IA, vous obtenez des performances combinées à l'infrastructure gérée de l' SageMaker IA, aux fonctionnalités intégrées de résilience aux pannes, aux capacités de surveillance intégrées et à l'intégration native avec d'autres SageMaker IA et AWS services. Cette intégration vous permet de vous concentrer sur le développement et le déploiement de modèles, tandis que l' SageMaker IA gère le gros du travail indifférencié lié à la gestion de l'infrastructure d'IA.

**Note**  
UltraServers sont disponibles uniquement dans la zone locale de Dallas (us-east-1-dfw-2a), qui est une extension de la région USA Est (Virginie du Nord). Pour plus d'informations, consultez [Getting started with Zone locale AWS s](https://docs.aws.amazon.com/local-zones/latest/ug/getting-started.html)

### Considérations
<a name="training-plans-ultraservers-considerations"></a>

Tenez compte des points suivants lors de l'utilisation UltraServers avec l' SageMaker IA :
+ Vous pouvez l'utiliser à UltraServers la fois pour des [tâches [ SageMaker HyperPod](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod.html)de SageMaker formation](https://docs.aws.amazon.com/sagemaker/latest/dg/train-model.html) et de formation.
+ Vous ne pouvez acheter qu' UltraServers en unités complètes. Pour plus d'informations sur les instances et les tarifs, consultez les plans de formation SageMaker HyperPod flexibles d'Amazon dans la section [Tarification d'Amazon SageMaker AI](https://aws.amazon.com/sagemaker-ai/pricing/).
+ Si vous utilisez UltraServers avec HyperPod, ajoute HyperPod automatiquement des étiquettes topologiques à vos ressources pour vous aider à allouer les ressources. Pour plus d'informations, consultez [Utilisation de la planification basée sur la topologie sur Amazon](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod-topology.html). SageMaker HyperPod
+ SageMaker L'intelligence artificielle UltraServers offre diverses fonctionnalités qui améliorent la résilience de vos charges de travail, notamment les contrôles préventifs et la détection et l'atténuation automatiques des pannes. En fonction du problème, l' SageMaker IA peut exécuter des actions pour récupérer vos charges de travail, telles que le redémarrage des instances, le remplacement des instances défaillantes par des pièces de rechange et le remplacement des instances défaillantes. UltraServers
+ Pour une résilience accrue, vous pouvez configurer des instances au sein d'un et UltraServer pour les utiliser comme pièces de rechange. Le fait de conserver une instance de rechange UltraServer permet à l' SageMaker IA de répondre rapidement à une panne d'instance tout en minimisant l'impact sur vos tâches. Nous vous recommandons de conserver une instance de rechange par instance UltraServer. Il n’est pas nécessaire de réserver des instances de rechange, mais cela peut entraver les options de support et ralentir la récupération en cas de défaillance. Vous achetez UltraServers par lots, de sorte que le nombre de pièces de rechange que vous réservez n'a aucune incidence sur les prix.
+ Pour voir le statut et les instances d'un UltraServer, utilisez le fonctionnement de l'[ ListTrainingPlans](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ListTrainingPlans.html)API ou la AWS console pour consulter les plans de formation. À l’aide de ces outils, vous pouvez voir le nombre total d’instances disponibles, les instances actuellement utilisées, les instances défectueuses, le nombre de pièces de rechange configurées et d’autres informations. Les statuts d’intégrité possibles sont `ok`, `impaired` et `insufficient-data`.

## SageMaker plans de formation, comportement de recherche
<a name="training-plans-search-behavior"></a>

Lorsque vous recherchez une offre de plan de formation, les plans de SageMaker formation utilisent l'approche suivante afin de maximiser la disponibilité des ressources et la flexibilité pour les utilisateurs, même lorsque la demande est forte et que les blocs de capacité réservée sont rares :
+ **Recherche continue initiale** : les plans de SageMaker formation tentent d'abord de trouver un seul bloc continu de capacité réservée correspondant à la durée spécifiée entre les dates de début et de fin, tout en répondant à tous les autres critères spécifiés, notamment la ressource cible, le type d'instance demandé et le nombre d'instances.
+ **Recherche en deux blocs** : les plans de SageMaker formation ne renvoient pas de résultat « aucune capacité » si un seul bloc continu de capacité réservée répondant à tous les critères n'est pas disponible. Au lieu de cela, ils tentent automatiquement de répondre à la demande en utilisant deux blocs de capacité réservée distincts, divisant ainsi la durée totale sur deux segments temporels.

  Cette approche à deux blocs offre une plus grande flexibilité d’allocation des ressources, sécurisant potentiellement les instances hautement demandées, qui ne seraient autrement pas disponibles.

**Note**  
SageMaker les plans de formation proposent jusqu'à trois offres d'un ou deux segments. Par exemple, pour un plan d'une durée de 48 heures, les plans de SageMaker formation peuvent proposer un plan comportant deux blocs de 24 heures, un bloc continu de 48 heures et deux blocs de durée inégale.

## Considérations
<a name="training-plans-considerations"></a>

**Important**  
Les plans d’entraînement ne peuvent pas être modifiés une fois achetés.
Les plans de formation ne peuvent pas être partagés entre AWS comptes ou au sein de votre AWS organisation.
+ Lors de la recherche d'offres de plans de SageMaker formation, Training Plans adapte sa stratégie de recherche en fonction des éléments [target resources](#training-plans-target-resources) suivants :

  **Pour les SageMaker HyperPod clusters** :
  + Les offres sont limitées à une seule zone de disponibilité (AZ).
  + Cela garantit des performances réseau et une localisation des données cohérentes au sein du cluster.

  **Pour les postes de SageMaker formation** :
  + Les offres peuvent s’étendre sur plusieurs zones de disponibilité. 
  + Cela est particulièrement pertinent lorsque l’offre du plan contient plusieurs capacités réservées discontinues.
  + Par exemple, un plan peut inclure de la capacité en AZ-A pour un bloc de capacité réservée et en AZ-B pour un autre. SageMaker les plans de formation peuvent déplacer automatiquement les charges de travail entre les zones de disponibilité (AZs) en fonction de la disponibilité des ressources.

    Cette approche multi-AZ pour les tâches d’entraînement offre une plus grande flexibilité d’allocation des ressources, augmentant ainsi les chances de trouver la capacité adaptée à votre charge de travail. Cependant, vous devez savoir que vos offres d'emploi peuvent être présentées différemment AZs au cours des différentes périodes de votre période de réservation.
+ Lorsqu’une offre à deux blocs est présentée, les utilisateurs doivent examiner attentivement si cette allocation divisée répond à leurs exigences en matière de charge de travail. Cela peut nécessiter un ajustement de la planification des tâches ou de la répartition des charges de travail pour tenir compte de la nature non continue de la réservation.

# IAM pour les plans de SageMaker formation
<a name="training-plan-iam-permissions"></a>

SageMaker les plans de formation nécessitent des autorisations spécifiques pour deux rôles distincts :

1. **Rôle de créateur de plan** : les utilisateurs auxquels le rôle *Créateur de plan* a été attribué doivent être autorisés à rechercher des offres de plans d’entraînement, à créer de nouveaux plans d’entraînement, ainsi qu’à répertorier et à décrire les plans d’entraînement.

1. **Rôle d'utilisateur du plan : les utilisateurs ayant le rôle** *d'utilisateur du plan* doivent être autorisés à utiliser les plans de formation dans le cadre de tâches de SageMaker formation ou lors de la création et de la mise à jour de SageMaker HyperPod clusters.

Avant d'utiliser les plans de SageMaker formation, mettez à jour les autorisations en fonction de votre méthode d'accès :
+ Pour AWS Management Console nos SageMaker SDKs utilisateurs : mettez à jour les autorisations du rôle IAM configuré pour l'utilisateur de la console ou de l'API.
+ Pour AWS CLI les utilisateurs : assurez-vous que votre AWS CLI profil est correctement configuré avec les informations d'identification et les autorisations appropriées.
+ Pour les utilisateurs de l'application Studio JupyterLab, par exemple, définissez des autorisations sur le rôle d'exécution associé à l'espace utilisé par l'application.

Vous pouvez définir ces autorisations à l’aide d’une politique gérée ou d’autorisations individuelles plus détaillées.

Pour en savoir plus sur la manière de mettre à jour la politique d’autorisations pour un rôle, consultez [Mise à jour des autorisations pour un rôle](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles_update-role-permissions.html). Pour en savoir plus sur la manière de rechercher et de mettre à jour un rôle d’exécution, consultez [Obtention de votre rôle d’exécution](sagemaker-roles.md#sagemaker-roles-get-execution-role).

**Note**  
Les administrateurs doivent soigneusement déterminer quels utilisateurs doivent être en mesure de créer des plans d’entraînement et d’attribuer des autorisations en conséquence.

## Politiques gérées
<a name="training-plan-managed-policies"></a>
+ Pour les créateurs de plans : [https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerTrainingPlanCreateAccess.html](https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerTrainingPlanCreateAccess.html) fournit un accès pour créer et gérer des plans d’entraînement.
+ Pour les utilisateurs de plans : [https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerFullAccess.html](https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerFullAccess.html) inclut les autorisations d’utilisation des plans d’entraînement.

**Note**  
La politique `AmazonSageMakerFullAccess` gérée est conçue comme une ease-of-use politique principalement à des fins d'expérimentation. Bien qu'il fournisse un accès étendu aux fonctionnalités de l' SageMaker IA, notamment à l'utilisation de plans de formation, il est important de noter que :  
Cette politique n’est pas recommandée pour les environnements de production en raison de ses autorisations étendues.
Elle n’inclut pas les autorisations pour créer des plans d’entraînement, car `CreateTrainingPlan` est considéré comme une action administrative nécessitant un paiement initial.
Pour les cas d’utilisation en production, nous recommandons vivement de créer des politiques personnalisées qui respectent le principe du moindre privilège, en accordant uniquement les autorisations spécifiques requises pour chaque rôle.

## Autorisations individuelles
<a name="training-plan-individual-permissions"></a>

La liste suivante détaille les autorisations granulaires qui doivent être définies dans les déclarations de politique IAM d'un rôle, en fonction des actions spécifiques que l'utilisateur doit effectuer dans le cadre des plans de SageMaker formation :

### Liste des autorisations des plans d’entraînement
<a name="training-plan-individual-permissions-list"></a>
+ `SearchTrainingPlanOfferings` : cette autorisation permet aux utilisateurs de rechercher les offres de plans d’entraînement disponibles.

  ```
  {
    "Sid": "SearchTrainingPlanOfferingsPermissions",
    "Effect": "Allow",
    "Action": [
      "sagemaker:SearchTrainingPlanOfferings"
    ],
    "Resource": "*"
  }
  ```
+ `CreateTrainingPlan` : cette autorisation permet aux utilisateurs de créer de nouveaux plans d’entraînement.
**Note**  
Vous devez également inclure des autorisations pour `CreateReservedCapacity` et `AddTags`, et spécifier les deux types de ressources `training-plan` et `reserved-capacity`.

  ```
  {
    "Sid": "CreateTrainingPlanPermissions",
    "Effect": "Allow",
    "Action": [
      "sagemaker:CreateTrainingPlan",
      "sagemaker:CreateReservedCapacity",
      "sagemaker:AddTags"
    ],
    "Resource": [
      "arn:aws:sagemaker:*:*:training-plan/*",
      "arn:aws:sagemaker:*:*:reserved-capacity/*"
    ]
  }
  ```
+ `DescribeTrainingPlan` : cette autorisation permet aux utilisateurs de visualiser les détails des plans d’entraînement existants.

  ```
  {
    "Sid": "DescribeTrainingPlanPermissions",
    "Effect": "Allow",
    "Action": [
      "sagemaker:DescribeTrainingPlan"
    ],
    "Resource": [
      "arn:aws:sagemaker:::training-plan/*"
    ]
  }
  ```
+ `ListTrainingPlans`: Cette autorisation permet aux utilisateurs de répertorier tous les plans de formation de leur AWS compte.

  ```
  {
    "Sid": "ListTrainingPlansPermissions",
    "Effect": "Allow",
    "Action": [
      "sagemaker:ListTrainingPlans"
    ],
    "Resource": "*"
  }
  ```

### Autorisations individuelles par type d’utilisateur
<a name="training-plan-permissions-per-user-type"></a>

Cette section fournit une répartition détaillée des autorisations individuelles requises pour chaque rôle, telles qu’indiquées dans la section [IAM pour les plans de SageMaker formation](#training-plan-iam-permissions). 

Pour les créateurs de plans, les autorisations suivantes sont nécessaires :
+ `sagemaker:SearchTrainingPlanOfferings`
+ `sagemaker:CreateTrainingPlan`
+ `sagemaker:CreateReservedCapacity`
+ `sagemaker:AddTags`
+ `sagemaker:DescribeTrainingPlan`
+ `sagemaker:ListTrainingPlans`

Les utilisateurs de plans ont besoin des autorisations suivantes :
+ `sagemaker:CreateTrainingJob`(pour SageMaker Training Job)
+ `sagemaker:CreateCluster`et `sagemaker:UpdateCluster` (pour SageMaker HyperPod)
+ Accès aux `reserved-capacity` ressources `training-plan` et ; lors de la configuration des politiques IAM pour les plans de SageMaker formation, incluez des autorisations pour les deux `training-plan` et pour les `reserved-capacity` ressources. Ces ressources sont nécessaires à la fois pour les emplois SageMaker de formation et pour les SageMaker HyperPod clusters. Cela permet à vos rôles IAM d'interagir avec les ressources des plans de SageMaker formation et de gérer les capacités réservées.
  + Pour les emplois de SageMaker formation, assurez-vous que votre politique inclut les `"arn:aws:sagemaker:::reserved-capacity/"` ressources `"arn:aws:sagemaker:::training-plan/"` et ARNs.

------
#### [ JSON ]

****  

```
{
  "Version":"2012-10-17",		 	 	 
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "sagemaker:CreateTrainingJob"
      ],
      "Resource": [
        "arn:aws:sagemaker:us-east-2:111122223333:training-job/",
        "arn:aws:sagemaker:us-east-2:111122223333:training-plan/",
        "arn:aws:sagemaker:us-east-2:111122223333:reserved-capacity/*"
      ]
    }
  ]
}
```

------

De même, pour les SageMaker HyperPod configurations, incluez-les ARNs en plus des ressources spécifiques au cluster.

------
#### [ JSON ]

****  

```
{
  "Version":"2012-10-17",		 	 	 
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "sagemaker:CreateCluster",
        "sagemaker:UpdateCluster"
      ],
      "Resource": [
        "arn:aws:sagemaker:us-east-2:111122223333:cluster/",
        "arn:aws:sagemaker:us-east-2:111122223333:training-plan/",
        "arn:aws:sagemaker:us-east-2:111122223333:reserved-capacity/*"
      ]
    }
  ]
}
```

------

# Création de plans d’entraînement
<a name="training-plan-creation"></a>

Pour réserver une capacité de calcul à l'aide de la fonctionnalité des plans de SageMaker formation, procédez comme suit :

1. **Identifiez votre ressource cible :** commencez par déterminer si vous avez besoin de capacités pour des postes de SageMaker formation ou SageMaker HyperPod des clusters.

1. **Spécifiez vos besoins en capacité :** définissez en détail vos besoins en termes de capacité. Cela inclut la sélection du type d’instance approprié pour votre charge de travail, la détermination du nombre d’instances requises et la spécification de la durée d’utilisation. Pour plus d'informations sur les types d'instances pris en charge dans les options données Région AWS, de durée et de quantité, consultez[Types d'instances pris Régions AWS en charge et tarifs](reserve-capacity-with-training-plans.md#training-plans-supported-instances-and-regions).

1. **Rechercher les offres de plans de formation disponibles :** une fois que vous avez défini vos besoins, utilisez la fonctionnalité de recherche des plans de SageMaker formation pour trouver les offres de plans de formation disponibles dans un ou plusieurs segments. Chaque offre inclut des détails, tels que l’heure de début, la zone de disponibilité spécifique pour la capacité réservée et le prix du plan. Passez en revue ces offres en tenant compte de facteurs tels que le rapport coût-efficacité, les préférences géographiques et l’adéquation avec vos besoins spécifiques.

   Si aucun plan adapté n’est disponible, ajustez vos critères de recherche et recherchez un nouvel ensemble d’offres.

1. **Créez un plan d’entraînement basé sur une offre adaptée :** après avoir identifié une offre adaptée, passez à la création de votre plan d’entraînement. Ce processus implique de sélectionner l’offre que vous avez choisie et d’initier la réservation.
   + La réservation du plan d’entraînement crée une facture.
   + Le paiement du montant total est collecté dans le cadre du processus de réalisation. Une fois le paiement effectué, le plan est prêt pour planifier vos tâches de SageMaker formation ou créer des HyperPod clusters.

   Pour savoir comment utiliser les plans de formation pour vos tâches de SageMaker formation, consultez[Utilisation des plans de formation pour les emplois SageMaker de formation](training-plan-utilization-for-training-jobs.md).

    Pour savoir comment utiliser les plans de formation pour vos HyperPod clusters, consultez[Utilisation des plans de formation pour les SageMaker HyperPod clusters Amazon](training-plan-utilization-for-hyperpod.md).

Vous pouvez créer un plan d'entraînement à l'aide de la console d' SageMaker intelligence artificielle ou de méthodes programmatiques. La console SageMaker AI propose une interface graphique visuelle avec une vue complète de vos options, tandis que la création programmatique peut être effectuée SageMaker SDKs à l'aide de l'API des plans de formation AWS CLI ou en interagissant directement avec celle-ci.

Pour les instructions relatives à la step-by-step console et les références détaillées des API, reportez-vous aux sections correspondantes de cette documentation.

**Topics**
+ [SageMaker création de plans de formation à l'aide de la console SageMaker AI](training-plan-creation-using-console.md)
+ [SageMaker création de plans de formation à l'aide de SageMaker l'API, ou AWS CLI](training-plan-creation-using-api-cli-sdk.md)

# SageMaker création de plans de formation à l'aide de la console SageMaker AI
<a name="training-plan-creation-using-console"></a>

SageMaker les plans de formation constituent un moyen pratique de créer des plans de formation via l'interface utilisateur de la console SageMaker AI, ce qui permet aux utilisateurs de planifier facilement leurs ressources de formation en apprentissage automatique. Ce guide explique le processus de création d'un plan de formation pour SageMaker les postes de formation et les SageMaker HyperPod clusters à l'aide de la console d' SageMaker intelligence artificielle. En suivant ces étapes, vous rechercherez des offres de plans d’entraînement, examinerez les options disponibles et achèterez le plan qui répond le mieux à vos besoins.

Pour créer un plan d’entraînement visuellement à l’aide d’une interface utilisateur :

1. Commencez par accéder à la console SageMaker AI à l'adresse [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Choisissez **Plans d’entraînement** dans le menu du volet de gauche.

1. À partir de là, choisissez le bouton **Créer un plan d’entraînement** dans la zone de contenu principale pour démarrer le processus de configuration de votre planification d’entraînement personnalisée.

![\[SageMaker Console AI affichant la page des plans d'entraînement. L’interface affiche des informations sur le fonctionnement des plans d’entraînement, y compris les étapes à suivre pour demander, surveiller et utiliser un plan. Le volet de navigation de gauche met en évidence l’option « Plans d’entraînement », et un bouton « Créer un plan d’entraînement » est visible dans la zone de contenu principale.\]](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/images/training-plans/tp-console.png)


Ensuite, recherchez les offres de plans qui correspondent à vos besoins en calcul.

**Topics**
+ [Recherche d’offres de plans d’entraînement](search-training-plan-offerings.md)
+ [Réservation du meilleur plan d’entraînement](choose-best-training-plan.md)
+ [Liste des plans d’entraînement](list-training-plans.md)
+ [Visualisation des détails d’un plan d’entraînement](training-plan-details.md)

# Recherche d’offres de plans d’entraînement
<a name="search-training-plan-offerings"></a>

Après avoir choisi **Plans d'entraînement** dans le volet gauche de la console SageMaker AI, puis **Créer un plan d'entraînement**, un formulaire **Rechercher un plan d'entraînement** s'ouvre. Ce formulaire vous permet de définir vos exigences et de rechercher des offres de plans d’entraînement adaptées.

Suivez les étapes ci-dessous pour remplir le formulaire :

1. Identifiez votre **cible** : les plans d’entraînement sont spécifiques à la ressource cible. Spécifiez si vous souhaitez utiliser un plan pour exécuter des tâches de SageMaker formation ou SageMaker HyperPod des clusters.

1. Pour le **type de calcul**, vous pouvez choisir entre **Instance** ou **UltraServer**. UltraServers connectent plusieurs instances Amazon EC2 à l'aide d'une interconnexion accélératrice à faible latence et à bande passante élevée. Pour de plus amples informations, veuillez consulter [Amazon EC2 UltraServers](https://aws.amazon.com/ec2/ultraservers/). Pour en savoir plus sur la façon dont vous pouvez utiliser UltraServers SageMaker l'IA, consultez[UltraServers en SageMaker IA](reserve-capacity-with-training-plans.md#training-plans-ultraservers).

1. Choisissez le **type d'instance** **et le nombre** d'instances que vous préférez : pour connaître les types d'instances disponibles dans des options données Région AWS, de durée et de quantité, consultez[Types d'instances pris Régions AWS en charge et tarifs](reserve-capacity-with-training-plans.md#training-plans-supported-instances-and-regions).

1. Définissez vos paramètres temporels : choisissez les dates de début et de fin souhaitées et spécifiez la durée du plan dans cette fenêtre.

1. Choisissez **Rechercher des plans d’entraînement**.

![\[SageMaker Console AI affichant la page des offres de plans de formation Search. L'interface affiche des options permettant de sélectionner la ressource cible pour le plan (tâche de formation ou HyperPod cluster), de spécifier le type et le nombre d'instances, de définir les dates de début et de fin et la durée de saisie. Un bouton Rechercher des plans d’entraînement est visible au bas du formulaire.\]](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/images/training-plans/tp-search-training-plan-offerings.png)


SageMaker les plans de formation recherchent des offres qui correspondent à vos besoins en matière de capacité. Lorsque des correspondances sont trouvées dans le délai que vous avez spécifié, elles apparaissent au bas de la page. Chaque offre de plan d’entraînement inclut les détails suivants :
+ Durée totale du plan
+ Dates de début et de fin
+ Prix initial total : 

  Passez la souris sur le prix pour afficher la répartition détaillée du taux horaire des instances, du nombre d’instances et du nombre total d’heures.
+ Nombre total de segments du plan

Cliquez sur le lien des détails des segments pour ouvrir une vue modale contenant des détails spécifiques aux segments :
+ Duration
+ Dates de début et de fin
+ Zone de disponibilité

![\[SageMaker Console AI affichant la page Rechercher des offres de formation avec des champs de saisie pour les exigences du plan et la section Plans disponibles affichant les détails de trois plans trouvés avec des durées, des prix et un statut de disponibilité variables.\]](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/images/training-plans/tp-available-offerings.png)


Si aucun plan adapté n’est trouvé ou si les plans disponibles ne répondent pas à vos besoins, ajustez vos critères de recherche en modifiant les paramètres du formulaire **Exigences relatives au plan d’entraînement**. Une fois que vous avez trouvé une offre adaptée, sélectionnez-la et choisissez **Suivant** pour passer à la page de réservation du plan. Sur cette page, vous pouvez donner un nom à votre plan, puis revoir et confirmer votre sélection avant de finaliser votre réservation.

**Note**  
Les plans marqués `Immediately available` débuteront dans les 30 minutes, à condition que le paiement soit effectué au moins 5 minutes avant l’heure de début planifiée.

# Réservation du meilleur plan d’entraînement
<a name="choose-best-training-plan"></a>

La recherche d’un plan d’entraînement a renvoyé les offres adaptées à vos besoins en termes de capacité et à votre budget. 

1. Entrez un nom pour votre plan, puis choisissez **Suivant**.

1. Passez en revue votre bon de commande et sélectionnez **Soumettre**.
**Important**  
Les plans d’entraînement ne peuvent pas être modifiés une fois achetés.
Les plans de formation ne peuvent pas être partagés entre AWS comptes ou au sein de votre AWS organisation.

   Après avoir soumis votre commande
   + Le plan d’entraînement apparaît initialement comme `Pending` dans votre liste de plans d’entraînement.
   + Une facture est générée automatiquement à la réception de la commande.
   + Le paiement total est collecté au cours du processus de réalisation.
   + Une fois le paiement traité avec succès, le statut du plan passe à `Scheduled` et le plan devient disponible pour être utilisé.

![\[SageMaker Console d'intelligence artificielle affichant la page « Révision et achat » d'un plan d'entraînement. La page affiche les détails du plan d’entraînement, les informations sur les segments, le prix, le nom du plan et les balises. Des options permettant de modifier, d’annuler, de revenir en arrière ou de créer le plan sont disponibles.\]](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/images/training-plans/tp-review-and-purchase-training-plan.png)


# Liste des plans d’entraînement
<a name="list-training-plans"></a>

Pour visualiser vos plans d’entraînement :

1. Accédez à la console SageMaker AI à l'adresse [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Choisissez **Plans d’entraînement** dans le menu du volet de gauche. Cela affiche la liste de tous vos plans d’entraînement, y compris leurs noms, leur statut, le type de ressource cible et d’autres détails clés.

   Après avoir acheté un plan, vous êtes redirigé vers cette liste. Les plans nouvellement créés apparaissent avec un statut `Pending` jusqu’à ce que le paiement soit effectué. Le statut est généralement mis à jour quelques minutes après le traitement du paiement.

![\[SageMaker Console AI affichant la page de liste des plans d'entraînement. Cette page inclut un tableau répertoriant les plans d’entraînement avec des détails tels que le nom, le statut, le nombre total d’instances, les instances en cours d’utilisation, la zone, la date de début et la date de fin. Un bouton permettant de créer un nouveau plan d’entraînement est visible.\]](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/images/training-plans/tp-list-training-plans.png)


# Visualisation des détails d’un plan d’entraînement
<a name="training-plan-details"></a>

Dans la liste des plans d’entraînement, suivez le nom d’un plan pour en afficher les détails. Plus précisément, vous pouvez vérifier votre utilisation actuelle de la capacité et répertorier vos charges de travail sur la page de détails de votre plan. 

La page de détails présente :
+ Une vue d’ensemble du plan d’entraînement : statut, cible, type d’instance et durée.
+ Les sections extensibles contenant les détails des segments, la tarification, le nom du plan et les balises.
+ L’utilisation de la capacité :
  + Total : nombre total d’instances réservées dans ce plan d’entraînement.
  + En cours d’utilisation : nombre d’instances actuellement utilisées dans le cadre de ce plan d’entraînement.
  + Instances disponibles : nombre d’instances actuellement disponibles pour être utilisées dans ce plan d’entraînement.

Au bas de la page, un lien vous permet de consulter les tâches de formation ou la liste des groupes d'instances de SageMaker HyperPod cluster associés à ce plan, en fonction de la ressource cible. 

![\[SageMaker Page de console AI affichant les détails d'un plan d'entraînement. Cette page présente les informations de base du plan, son statut et les détails des instances. Vous trouverez ci-dessous des sections extensibles pour plus de détails. En bas, une section sur l’utilisation de la capacité indique le nombre total d’instances, en cours d’utilisation et disponibles pour le plan.\]](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/images/training-plans/tp-view-training-plan.png)


# SageMaker création de plans de formation à l'aide de SageMaker l'API, ou AWS CLI
<a name="training-plan-creation-using-api-cli-sdk"></a>

SageMaker les plans de formation soutiennent la création programmatique de plans de formation via son API. Vous pouvez interagir avec l'API des plans de formation à l'aide du AWS CLI ou SageMaker SDKs.

SageMaker les actions d'API des plans de formation fournissent un flux de travail complet pour gérer les plans de formation de manière programmatique :
+ **`SearchTrainingPlanOfferings`** : permet aux utilisateurs d’interroger et de découvrir les ressources de calcul disponibles en spécifiant des paramètres tels que le type d’instance, le nombre et la fenêtre temporelle souhaitée. L’API renvoie une liste classée des offres de plans d’entraînement qui répondent le mieux aux besoins de l’utilisateur.
+ **`CreateTrainingPlan`** : permet de réserver une offre de plan d’entraînement spécifique, transformant une capacité de calcul potentielle en capacités réservées planifiées avec un ARN unique de plan d’entraînement.
+ **`ListTrainingPlans`:** fournit une méthode pour récupérer et examiner tous les plans de formation existants dans le AWS compte d'un utilisateur, avec des fonctionnalités de filtrage et de tri facultatives.
+ **`DescribeTrainingPlan`** : fournit des informations détaillées sur un plan d’entraînement spécifique, y compris les phases de son cycle de vie de `Pending` à `Active`, puis à `Expired`.
+ **`ExtendTrainingPlan`:** étend un plan de formation existant en achetant une offre d'extension. Pour de plus amples informations, veuillez consulter [Extension des plans de formation](training-plan-extension.md).
+ **`DescribeTrainingPlanExtensionHistory`:** Récupère l'historique des extensions pour un plan de formation. Pour de plus amples informations, veuillez consulter [Extension des plans de formation](training-plan-extension.md).

**Topics**
+ [Recherche d’offres de plans d’entraînement](search-training-plan-offerings-api-cli-sdk.md)
+ [Réservation du meilleur plan d’entraînement](choose-best-training-plan-using-api-cli-sdk.md)
+ [Liste des plans d’entraînement](list-training-plans-using-api-cli-sdk.md)
+ [Visualisation des détails d’un plan d’entraînement](training-plan-details-using-api-cli-sdk.md)

# Recherche d’offres de plans d’entraînement
<a name="search-training-plan-offerings-api-cli-sdk"></a>

Pour créer un plan d’entraînement, commencez par appeler l’opération d’API [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html), en transmettant les exigences de votre plan (telles que le type d’instance, le nombre et la fenêtre temporelle souhaitée) en tant que paramètres d’entrée. Les plans d’entraînement sont spécifiques à la ressource cible. Veillez à spécifier la ressource cible pour laquelle le plan sera utilisé (`training-job` ou `hyperpod-cluster`). L’API renvoie la liste des offres disponibles qui correspondent à vos exigences. Si aucune offre appropriée n’est trouvée, vous devrez peut-être ajuster vos exigences et effectuer une nouvelle recherche.

Cet appel d’API permet d’extraire les offres de plans d’entraînement qui répondent le mieux à vos besoins en capacité. Chaque élément [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TrainingPlanOffering.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TrainingPlanOffering.html) renvoyé en réponse est identifié par un identifiant d’offre unique. La première offre de la liste représente celle qui correspond le mieux à vos exigences. Si aucun plan d’entraînement adapté n’est disponible aux dates que vous avez spécifiées, la liste est vide. Ajustez vos critères de recherche et recherchez un nouvel ensemble d’offres.
+ Les durées de réservation sont disponibles par incréments de 1 jour, de 1 à 182 jours.
+ Les options de quantité d’instances de réservation sont de 1, 2, 4, 8, 16, 32 ou 64 instances.

Pour en savoir plus sur la liste des instances disponibles prises en charge par les plans de SageMaker formation, consultez[Types d'instances pris Régions AWS en charge et tarifs](reserve-capacity-with-training-plans.md#training-plans-supported-instances-and-regions).

L'exemple suivant utilise une AWS CLI commande pour demander des offres de plan de formation avec un type d'instance, un nombre et des informations temporelles spécifiés.

```
# List training plan offerings with instance type, instance count, duration in hours, start time after, and end time before.
aws sagemaker search-training-plan-offerings \
--target-resources "training-job" \
--instance-type "ml.p4d.24xlarge" \
--instance-count 1 \
--duration-hours 15 \
--start-time-after "1737484800"
--end-time-before "1737657600"
```

Ce document JSON est un exemple de réponse provenant de l'API des plans de SageMaker formation. Cette réponse fournit des informations sur plusieurs offres de plans d’entraînement disponibles qui répondent aux exigences de capacité spécifiées. Il comprend trois offres distinctes avec des durées, des frais initiaux et des start/end durées variables, qui utilisent toutes le même type d'instance et ciblent les tâches de formation.

```
{
    "TrainingPlanOfferings": [
        {
            "TrainingPlanOfferingId": "tpo-SHA-256-hash-value",
            "TargetResources": [
                "training-job"
            ],
            "RequestedStartTimeAfter": "2025-01-21T11:08:27.704000-08:00",
            "DurationHours": 15,
            "DurationMinutes": 51,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD",
            "ReservedCapacityOfferings": [
                {
                    "InstanceType": "ml.p4d.24xlarge",
                    "InstanceCount": 1,
                    "AvailabilityZone": "us-west-2a",
                    "DurationHours": 15,
                    "DurationMinutes": 51,
                    "StartTime": "2025-01-21T11:39:00-08:00",
                    "EndTime": "2025-01-22T03:30:00-08:00"
                }
            ]
        },
        {
            "TrainingPlanOfferingId": "tpo-SHA-256-hash-value",
            "TargetResources": [
                "training-job"
            ],
            "RequestedStartTimeAfter": "2025-01-21T11:08:27.704000-08:00",
            "DurationHours": 39,
            "DurationMinutes": 51,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD",
            "ReservedCapacityOfferings": [
                {
                    "InstanceType": "ml.p4d.24xlarge",
                    "InstanceCount": 1,
                    "AvailabilityZone": "us-west-2a",
                    "DurationHours": 39,
                    "DurationMinutes": 51,
                    "StartTime": "2025-01-21T11:39:00-08:00",
                    "EndTime": "2025-01-23T03:30:00-08:00"
                }
            ]
        },
        {
            "TrainingPlanOfferingId": "tpo-SHA-256-hash-value",
            "TargetResources": [
                "training-job"
            ],
            "RequestedStartTimeAfter": "2025-01-21T11:08:27.704000-08:00",
            "DurationHours": 24,
            "DurationMinutes": 0,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD",
            "ReservedCapacityOfferings": [
                {
                    "InstanceType": "ml.p4d.24xlarge",
                    "InstanceCount": 1,
                    "AvailabilityZone": "us-west-2a",
                    "DurationHours": 24,
                    "DurationMinutes": 0,
                    "StartTime": "2025-01-22T03:30:00-08:00",
                    "EndTime": "2025-01-23T03:30:00-08:00"
                }
            ]
        }
    ]
}
```

Voici un exemple de commande expliquant comment utiliser le AWS CLI pour rechercher des offres de plans de formation qui incluent UltraServers.

```
aws sagemaker search-training-plan-offerings \
--ultra-server-type ml.c6i-32xlargesc \
--ultra-server-count 1 \
--duration-hours 24 \
--target-resources hyperpod-cluster
--start-time-after "1737484800" \
--end-time-before "1737657600"
```

```
{
    "TrainingPlanOfferings": [
        {
            "TrainingPlanOfferingId": "tpo-SHA-256-hash-value",
            "TargetResources": [
                "training-job"
            ],
            "RequestedStartTimeAfter": "2025-07-21T16:59:25.760000+00:00",
            "DurationHours": 24,
            "DurationMinutes": 0,
            "UpfrontFee": "0.24",
            "CurrencyCode": "USD",
            "ReservedCapacityOfferings": [
                {
                    "ReservedCapacityType": "UltraServer",
                    "UltraServerType": "ml.u-p6e-gb200x72",
                    "UltraServerCount": 1,
                    "InstanceType": "ml.p6e-gb200.36xlarge",
                    "InstanceCount": 18,
                    "AvailabilityZone": "us-east-2a",
                    "DurationHours": 24,
                    "DurationMinutes": 0,
                    "StartTime": "2025-07-22T11:30:00+00:00",
                    "EndTime": "2025-07-23T11:30:00+00:00"
                }
            ]
        }
    ]
}
```

Les sections suivantes définissent les paramètres de demande d’entrée obligatoires et facultatifs pour l’opération d’API `SearchTrainingPlanOfferings`.

## Paramètres requis
<a name="search-training-plan-options-required-params"></a>

Lorsque vous appelez l’API [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html) pour répertorier les offres de plans d’entraînement qui répondent à vos exigences, vous devez fournir les valeurs suivantes :
+ `TargetResources` : les ressources cibles (`training-job` ou `hyperpod-cluster`) pour lesquelles le plan sera utilisé. La valeur par défaut est `training-job`. Les plans d’entraînement sont spécifiques à la ressource cible.
  + Un plan de formation conçu pour des tâches de SageMaker formation ne peut être utilisé que pour planifier et exécuter des tâches de formation.
  + Un plan de formation pour les HyperPod clusters peut être utilisé exclusivement pour fournir des ressources de calcul au groupe d'instances d'un cluster.
+ `InstanceType` : type d’instance à provisionner. `InstanceType` doit être d’un type pris en charge. 

  Pour en savoir plus sur la liste des instances disponibles prises en charge par les plans de SageMaker formation, consultez[Types d'instances pris Régions AWS en charge et tarifs](reserve-capacity-with-training-plans.md#training-plans-supported-instances-and-regions).
+ `InstanceCount` : nombre d’instances à provisionner. Si le nombre d’instances est supérieur à 1, il doit être une puissance de 2.
+ `DurationHour` : durée totale du plan que vous avez demandé en heures. La valeur de `DurationHour` est arrondie au multiple de 24 le plus proche.

## Paramètres facultatifs
<a name="search-training-plan-options-optional-params"></a>

Les sections suivantes fournissent des détails sur certains paramètres facultatifs que vous pouvez transmettre à votre demande d’API `SearchTrainingPlanOfferings`.
+ `StartTimeAfter` : spécifiez l’horaire de début demandé du plan. `StartTimeAfter` doit être un élément `timestamp` ou une valeur `ISO 8601 date/time` dans le futur.
+ `EndTimeBefore` : spécifiez l’horaire de fin demandé du plan dans un élément `timestamp` ou un format `ISO 8601 date/time`. `EndTimeBefore` doit être au moins 24 heures après l’horaire de début.
+ `UltraServerType`: Spécifiez le type UltraServer à rechercher. Pour plus d'informations sur UltraServers, voir[UltraServers en SageMaker IA](reserve-capacity-with-training-plans.md#training-plans-ultraservers).
+ `UltraServerCount`: Spécifiez le nombre de UltraServers à rechercher.

# Réservation du meilleur plan d’entraînement
<a name="choose-best-training-plan-using-api-cli-sdk"></a>

Après avoir examiné les offres de plans d’entraînement disponibles qui répondent le mieux à vos exigences, vous pouvez réserver un plan spécifique en appelant l’opération d’API [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html). Une fois créé, le plan entre initialement dans un état `Pending` et y reste jusqu’à ce que le processus de réservation soit terminé. La réponse à l’appel d’API renvoie un Amazon Resource Name (ARN) de plan d’entraînement. Notez cet ARN à des fins ultérieures de suivi et de surveillance. La réservation du plan d’entraînement est effectuée de manière asynchrone dans le système dorsal. Le paiement du montant total est automatiquement collecté dans le cadre du processus de réalisation. Une fois que la transaction de paiement est terminée et que les capacités réservées demandées sont sécurisées, le plan d’entraînement passe à l’état `Scheduled` et est prêt pour la planification.

**Important**  
Les plans d’entraînement ne peuvent pas être modifiés une fois achetés.
Les plans de formation ne peuvent pas être partagés entre AWS comptes ou au sein de votre AWS organisation.

L'exemple suivant utilise la AWS CLI commande an pour demander un plan d'entraînement spécifique, en transmettant l'ID du plan en tant que paramètre.

```
aws sagemaker create-training-plan \
--training-plan-offering-id "tpo-SHA-256-hash-value" \
--training-plan-name "name" \
```

Ce document JSON est un exemple de réponse provenant de l'API des plans de SageMaker formation. La réponse contient l’Amazon Resource Name (ARN) du plan d’entraînement qui a été créé avec succès.

**Note**  
Le plan d’entraînement conserve le statut `Pending` jusqu’à ce que le processus de réalisation soit terminé.

```
{
   "TrainingPlanArn":"arn:aws:sagemaker:us-east-1:123456789123:training-plan/large-models-fine-tuning"
}
```

Les sections suivantes définissent les paramètres de demande d’entrée obligatoires et facultatifs pour l’opération d’API [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html).

## Paramètres requis
<a name="choose-best-training-plan-using-api-cli-sdk-required-params"></a>

Lorsque vous appelez l’API [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html) pour réserver un plan d’entraînement particulier, vous devez fournir les valeurs suivantes :
+ `TrainingPlanOfferingId` : ID du plan que vous choisissez. Vous pouvez extraire l’ID d’une offre de plan dans la réponse de votre appel d’API `SearchTrainingPlanOfferings`. Son format doit commencer par `pto-*`.
+ `TrainingPlanName` : nom du plan que vous créez. 

# Liste des plans d’entraînement
<a name="list-training-plans-using-api-cli-sdk"></a>

Vous pouvez répertorier tous les plans de formation créés dans votre AWS compte et dans votre région en appelant l'[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ListTrainingPlans.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ListTrainingPlans.html)API.

L'exemple suivant utilise une AWS CLI commande pour récupérer la liste de vos plans d'entraînement.

```
aws sagemaker list-training-plans \
--start-time-after "2024-09-26T00:00:01.000Z"
```

Ce document JSON est un exemple de réponse provenant de l'API des plans de SageMaker formation. La réponse fournit des détails sur un plan d’entraînement qui a été créé et réservé avec succès.

```
{
   "[TrainingPlanSummaries](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TrainingPlanSummary.html)": [ 
      { 
         "AvailableInstanceCount": 2,
         "CurrencyCode": "USD",
         "DurationHours": 48,
         "DurationMinutes": 0,
         "EndTime": "2024-09-28T04:30:00-07:00",
         "InUseInstanceCount": 2,
         "[ReservedCapacitySummaries](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ReservedCapacitySummary.html)": [ 
            { 
               "AvailabilityZone": "string",
               "DurationHours": 48,
               "DurationMinutes": 0,
               "EndTime": "2024-09-28T04:30:00-07:00",
               "InstanceType": "ml.p5.48xlarge",
               "ReservedCapacityArn": "arn:aws:sagemaker:us-east-1:123456789123:reserved-capacity/large-models-fine-tuning-rc1",
               "StartTime": "2024-09-26T04:30:00-07:00",
               "Status": "Scheduled",
               "TotalInstanceCount": 4,
               "UltraServerCount": 4,
               "UltraServerType": "ml.p6e-gb200.36xlarge"
            }
         ],
         "StartTime": "2024-09-26T04:30:00-07:00",
         "Status": "Scheduled",
         "StatusMessage": "Payment confirmed, training plan scheduled."
         "TargetResources": [ "training-job" ],
         "TotalInstanceCount": 4,
         "TotalUltraServerCount": 4,
         "TrainingPlanArn": "arn:aws:sagemaker:us-east-1:123456789123:training-plan/large-models-fine-tuning",
         "TrainingPlanName": "large-models-fine-tuning",
         "UpfrontFee": "xxxx.xx"
      }
   ]
}
```

Les sections suivantes fournissent des détails sur certains paramètres facultatifs que vous pouvez transmettre à votre demande d’API `ListTrainingPlans`.

## Paramètres facultatifs
<a name="list-training-plans-optional-params"></a>

Les sections suivantes fournissent des détails sur certains paramètres facultatifs que vous pouvez transmettre à votre demande d’API `ListTrainingPlans`.
+ `StartTimeAfter` : horaire de début de la plage de temps réelle des plans répertoriés, spécifié en tant qu’élément `timestamp` ou `ISO 8601 date/time`. 
+ `StartTimeBefore` : horaire de fin de la plage de temps réelle des plans répertoriés, spécifié en tant qu’élément `timestamp` ou `ISO 8601 date/time`. 
+ `Filters`: Critères utilisés pour filtrer les résultats, avec jusqu'à 5 paires nom-valeur où « Nom » est le nom d'un champ de a [TrainingPlanSummary](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TrainingPlanSummary.html)et « Valeur » est la valeur à prendre en compte pour le filtre. Par exemple `Name=Status,Value=Active`.

L'exemple suivant utilise une AWS CLI commande pour récupérer votre liste de plans d'entraînement, en utilisant certains des paramètres facultatifs décrits ci-dessus.

```
aws sagemaker list-training-plans --max-results 10 --sort-by StartTime --sort-order Descending --start-time-after 13000000 --filters Name=Status,Value=Active
```

# Visualisation des détails d’un plan d’entraînement
<a name="training-plan-details-using-api-cli-sdk"></a>

Pour surveiller le statut ou extraire les détails d’un plan d’entraînement, vous pouvez utiliser l’API [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlan.html). La réponse de l’API inclut un champ `Status`, qui reflète l’état actuel du plan d’entraînement :
+ Si l’achat du plan échoue, le statut est défini sur `Failed`.
+ Une fois le paiement effectué, le statut passe de `Pending` à `Scheduled`, en fonction de la date de début du plan. 
+ Lorsque le plan atteint sa date de début, le statut passe à `Active`.
+ Pour les plans comportant plusieurs capacités réservées discontinues, le statut redevient `Scheduled` entre les périodes actives, jusqu’à la date de début de la capacité réservée suivante. 
+ Après la date de fin du plan, le statut devient `Expired`.

Une fois le statut atteint`Scheduled`, vous pouvez utiliser la capacité réservée dans le plan pour vos tâches de SageMaker formation ou vos charges de travail en HyperPod cluster.

**Note**  
Les tâches d’entraînement associées au plan conservent le statut `Pending` jusqu’à ce que le plan devienne `Active`. 
Pour les HyperPod clusters utilisant un plan de formation pour la capacité de calcul, le statut du groupe d'instances apparaît tel qu'il `InService` a été créé. 

L'exemple suivant utilise une AWS CLI commande pour récupérer les détails d'un plan d'entraînement par son nom.

```
aws sagemaker describe-training-plan \
--training-plan-name "name"
```

Ce document JSON est un exemple de réponse provenant de l'API des plans de SageMaker formation. Cette réponse fournit des détails sur un plan d’entraînement qui a été créé avec succès.

```
      { 
         "AvailableInstanceCount": 2,
         "CurrencyCode": "USD",
         "DurationHours": 48,
         "DurationMinutes": 0,
         "EndTime": "2024-09-28T04:30:00-07:00",
         "InUseInstanceCount": 2,
         "[ReservedCapacitySummaries](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ReservedCapacitySummary.html)": [ 
            { 
               "AvailabilityZone": "string",
               "DurationHours": 48,
               "DurationMinutes": 0,
               "EndTime": "2024-09-28T04:30:00-07:00",
               "InstanceType": "ml.p5.48xlarge",
               "ReservedCapacityArn": "arn:aws:sagemaker:us-east-1:123456789123:reserved-capacity/large-models-fine-tuning-rc1",
               "StartTime": "2024-09-26T04:30:00-07:00",
               "Status": "Scheduled",
               "TotalInstanceCount": 4,
               "UltraServerCount": 4,
               "UltraServerType": "ml.p6e-gb200.36xlarge"
            }
         ],
         "StartTime": "2024-09-26T04:30:00-07:00",
         "Status": "Scheduled",
         "StatusMessage": "Payment confirmed, training plan scheduled."
         "TargetResources": [ "training-job" ],
         "TotalInstanceCount": 4,
         "TotalUltraServerCount": 4,
         "TrainingPlanArn": "arn:aws:sagemaker:us-east-1:123456789123:training-plan/large-models-fine-tuning",
         "TrainingPlanName": "large-models-fine-tuning",
         "UpfrontFee": "xxxx.xx"
      }
```

La section suivante définit le paramètre de demande d’entrée obligatoire pour l’opération d’API `DescribeTrainingPlan`.

## Paramètres requis
<a name="training-plan-details-required-params"></a>
+ `TrainingPlanName` : nom du plan d’entraînement que vous voulez décrire.

# Extension des plans de formation
<a name="training-plan-extension"></a>

SageMaker les plans de formation vous permettent d'étendre vos plans de formation existants afin d'éviter les interruptions de charge de travail. Lorsqu'un plan de formation arrive à expiration, vous pouvez le prolonger directement via la console SageMaker AI ou par programmation à l'aide de l'API ou. AWS CLI Il n'est donc plus nécessaire de créer un nouveau plan et de reconfigurer votre charge de travail avec un nouveau plan de formation ARN.

Avec les extensions du plan de SageMaker formation, vos tâches ou SageMaker HyperPod clusters de formation en cours continuent de fonctionner sans interruption une fois le plan prolongé. Le plan prolongé reflète la nouvelle date de fin, et vous pouvez récupérer l'historique de toutes les extensions de votre plan de formation.

**Important**  
Veuillez noter que les extensions ne peuvent pas être annulées ou modifiées pour ajouter ou supprimer des instances.

## Fonctions principales
<a name="training-plan-extension-features"></a>
+ Étendre les plans de formation par le biais de la console ou de l'API
+ Prolongez les forfaits par tranches d'un jour jusqu'à 14 jours, ou par tranches de 7 jours jusqu'à 182 jours
+ Prolongez un plan autant de fois que vous le souhaitez
+ Afficher/répertorier l'historique des extensions de vos plans d'entraînement dans la console ou via l'API
+ Continuation fluide de l'exécution des charges de travail dans l' SageMaker IA sans reconfiguration

## Conditions préalables
<a name="training-plan-extension-prerequisites"></a>

Avant de prolonger un plan de formation, assurez-vous de ce qui suit :
+ Le plan de formation doit avoir le statut de `Active` ou`Scheduled`.
+ Le `Payment Pending` statut du plan ne doit pas être prolongé.
+ Des prolongations peuvent être demandées jusqu'à un minimum d'une heure ou un maximum de 56 jours avant l'expiration du plan.

**Topics**
+ [Fonctions principales](#training-plan-extension-features)
+ [Conditions préalables](#training-plan-extension-prerequisites)
+ [Étendre un plan de formation à l'aide de la console SageMaker AI](training-plan-extension-using-console.md)
+ [Prolongez un plan de formation à l'aide de SageMaker l'API ou AWS CLI](training-plan-extension-using-api-cli-sdk.md)

# Étendre un plan de formation à l'aide de la console SageMaker AI
<a name="training-plan-extension-using-console"></a>

SageMaker les plans d'entraînement constituent un moyen pratique d'étendre vos plans de formation existants via l'interface utilisateur de la console SageMaker AI. Ce guide explique le processus d'extension d'un plan de formation pour SageMaker les postes de formation et les SageMaker HyperPod clusters à l'aide de la console d' SageMaker intelligence artificielle.

Pour étendre un plan d'entraînement à l'aide de la console :

1. Accédez à la console SageMaker AI à l'adresse [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Choisissez **Training Plans** dans le volet de navigation de gauche.

1. Sélectionnez le plan de formation que vous souhaitez étendre dans la liste.

1. Cliquez sur le bouton **Étendre**.

1. Entrez la date de fin souhaitée pour votre extension et choisissez **Rechercher** pour trouver les offres d'extension disponibles.

1. Consultez la liste des offres d'extension, qui inclut des informations telles que la durée, la zone de disponibilité, les frais initiaux et les heures de début et de fin.

1. Sélectionnez l'offre d'extension qui répond le mieux à vos besoins.

1. Vérifiez les détails de l'extension dans la boîte de dialogue de confirmation, puis choisissez **Soumettre** pour confirmer votre achat.

Une fois l'extension achetée, la date de fin du plan de formation est mise à jour pour refléter la nouvelle durée prolongée.

## Afficher l'historique des extensions
<a name="training-plan-extension-history-console"></a>

Pour consulter l'historique des extensions d'un plan de formation, procédez comme suit :

1. Accédez à la page **Plans d'entraînement** dans la console SageMaker AI.

1. Sélectionnez le plan d'entraînement que vous souhaitez consulter.

1. Sur la page des détails du plan de formation, consultez la section **Extensions** pour voir toutes les extensions passées, y compris l'identifiant de l'offre d'extension, les dates de début et de fin, le statut et la date de création de l'extension.

## Valeurs d'état de l'extension
<a name="training-plan-extension-status-values-console"></a>

Les extensions peuvent avoir les valeurs de statut suivantes :
+ `Pending`: La prolongation a été demandée et attend le traitement du paiement.
+ `Active`: L'extension a été achetée avec succès et est active.
+ `Scheduled`: Il est prévu que l'extension commence à une date future.
+ `Failed`: L'achat de l'extension a échoué (par exemple, en raison de problèmes de paiement).
+ `Expired`: La période de prolongation est terminée.

# Prolongez un plan de formation à l'aide de SageMaker l'API ou AWS CLI
<a name="training-plan-extension-using-api-cli-sdk"></a>

SageMaker les plans de formation prennent en charge l'extension des plans de formation par programmation via son API. Vous pouvez interagir avec l'API des plans de formation à l'aide du AWS CLI ou SageMaker SDKs.

L'extension du plan de formation implique les actions d'API suivantes :
+ **`SearchTrainingPlanOfferings`:** recherchez les offres d'extension disponibles en spécifiant l'ARN de votre plan de formation et la durée de prolongation souhaitée. L'API renvoie les offres d'extension `TrainingPlanExtensionOfferings` sur le terrain.
+ **`ExtendTrainingPlan`:** Achetez une offre d'extension spécifique pour étendre votre plan de formation en fournissant le`TrainingPlanExtensionOfferingId`. Cela permet de réserver la capacité de calcul supplémentaire et de mettre à jour la date de fin de votre plan de formation.
+ **`DescribeTrainingPlanExtensionHistory`:** consultez l'historique complet des extensions d'un plan de formation, y compris toutes les extensions passées avec leur statut, leurs dates et leurs informations de paiement.

**Topics**
+ [Rechercher des offres d'extension](search-extension-offerings-api-cli-sdk.md)
+ [Acheter une extension](extend-training-plan-api-cli-sdk.md)
+ [Afficher l'historique des extensions](describe-extension-history-api-cli-sdk.md)

# Rechercher des offres d'extension
<a name="search-extension-offerings-api-cli-sdk"></a>

Utilisez l'[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html)API avec le `TrainingPlanArn` paramètre pour trouver les offres d'extension disponibles pour votre plan de formation.

L'exemple suivant utilise une AWS CLI commande pour rechercher des offres d'extension pour un plan de formation existant.

```
aws sagemaker search-training-plan-offerings \
--training-plan-arn "arn:aws:sagemaker:us-east-2:123456789012:training-plan/my-training-plan" \
--duration-hours 48
```

Ce document JSON est un exemple de réponse provenant de l'API des plans de SageMaker formation. La réponse `TrainingPlanExtensionOfferings` contient des offres d'extension disponibles pour le plan de formation spécifié.

```
{
    "TrainingPlanOfferings": [],
    "TrainingPlanExtensionOfferings": [
        {
            "TrainingPlanExtensionOfferingId": "tpeo-SHA-256-hash-value",
            "AvailabilityZone": "us-east-2a",
            "StartDate": "2025-09-23T12:00:00Z",
            "EndDate": "2025-09-25T12:00:00Z",
            "DurationHours": 48,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD"
        }
    ]
}
```

Les sections suivantes définissent les paramètres de demande d'entrée obligatoires et facultatifs pour le fonctionnement de l'`SearchTrainingPlanOfferings`API lors de la recherche d'offres d'extension.

## Paramètres requis
<a name="search-extension-offerings-required-params"></a>

Lorsque vous appelez l'[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html)API pour rechercher des offres d'extension, vous devez fournir la valeur suivante :
+ `TrainingPlanArn`: Le plan de formation que vous souhaitez prolonger. Ils `TrainingPlanArn` doivent faire référence à un plan de formation existant dont le statut est `Active` ou`Scheduled`.

## Paramètres facultatifs
<a name="search-extension-offerings-optional-params"></a>

Les sections suivantes fournissent des détails sur certains paramètres facultatifs que vous pouvez transmettre à votre demande d'`SearchTrainingPlanOfferings`API lorsque vous recherchez des offres d'extension.
+ `DurationHours`: durée souhaitée en heures pour la prolongation. La valeur de `DurationHours` est arrondie au multiple de 24 le plus proche.

# Acheter une extension
<a name="extend-training-plan-api-cli-sdk"></a>

Après avoir sélectionné une offre d'extension, utilisez l'[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html)API pour acheter l'extension.

L'exemple suivant utilise une AWS CLI commande pour étendre un plan d'entraînement.

```
aws sagemaker extend-training-plan \
--training-plan-extension-offering-id "tpeo-SHA-256-hash-value"
```

Ce document JSON est un exemple de réponse provenant de l'API des plans de SageMaker formation. La réponse inclut la liste des extensions du plan de formation.

```
{
    "TrainingPlanExtensions": [
        {
            "TrainingPlanExtensionOfferingId": "tpeo-SHA-256-hash-value",
            "ExtendedAt": "2025-09-17T10:00:00Z",
            "StartDate": "2025-09-23T12:00:00Z",
            "EndDate": "2025-09-25T12:00:00Z",
            "Status": "Pending",
            "PaymentStatus": "Pending",
            "AvailabilityZone": "us-east-2a",
            "DurationHours": 48,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD"
        }
    ]
}
```

La section suivante définit le paramètre de demande d'entrée obligatoire pour le fonctionnement de l'`ExtendTrainingPlan`API.

## Paramètres requis
<a name="extend-training-plan-required-params"></a>

Lorsque vous appelez l'[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html)API pour étendre un plan de formation, vous devez fournir la valeur suivante :
+ `TrainingPlanExtensionOfferingId`: ID de l'offre d'extension que vous êtes en train d'acheter. Vous pouvez récupérer cet identifiant `TrainingPlanExtensionOfferings` dans la réponse à votre appel d'`SearchTrainingPlanOfferings`API. Son format doit commencer par `tpeo-*`.

# Afficher l'historique des extensions
<a name="describe-extension-history-api-cli-sdk"></a>

Utilisez l'[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html)API pour consulter l'historique complet des extensions d'un plan de formation.

L'exemple suivant utilise une AWS CLI commande pour récupérer l'historique de l'extension.

```
aws sagemaker describe-training-plan-extension-history \
--training-plan-arn "arn:aws:sagemaker:us-east-2:123456789012:training-plan/my-training-plan"
```

Ce document JSON est un exemple de réponse provenant de l'API des plans de SageMaker formation. La réponse inclut une liste paginée de toutes les extensions du plan de formation.

```
{
    "TrainingPlanExtensions": [
        {
            "TrainingPlanExtensionOfferingId": "tpeo-SHA-256-hash-value",
            "ExtendedAt": "2025-09-17T10:00:00Z",
            "StartDate": "2025-09-23T12:00:00Z",
            "EndDate": "2025-09-25T12:00:00Z",
            "Status": "Active",
            "PaymentStatus": "Completed",
            "AvailabilityZone": "us-east-2a",
            "DurationHours": 48,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD"
        }
    ],
    "NextToken": null
}
```

Les sections suivantes définissent les paramètres de demande d’entrée obligatoires et facultatifs pour l’opération d’API `DescribeTrainingPlanExtensionHistory`.

## Paramètres requis
<a name="describe-extension-history-required-params"></a>

Lorsque vous appelez l'[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html)API, vous devez fournir la valeur suivante :
+ `TrainingPlanArn`: du plan de formation pour lequel récupérer l'historique des extensions.

## Paramètres facultatifs
<a name="describe-extension-history-optional-params"></a>

Les sections suivantes fournissent des détails sur certains paramètres facultatifs que vous pouvez transmettre à votre demande d’API `DescribeTrainingPlanExtensionHistory`.
+ `NextToken`: Si la réponse précédente a été tronquée, vous recevez ce jeton. Utilisez-le dans votre prochaine demande pour recevoir la prochaine série de résultats.
+ `MaxResults`: le nombre maximum d'extensions à renvoyer dans la réponse.

## Valeurs d'état de l'extension
<a name="extension-status-values-api"></a>

Les extensions peuvent avoir les valeurs de statut suivantes :
+ `Pending`: La prolongation a été demandée et attend le traitement du paiement.
+ `Active`: L'extension a été achetée avec succès et est active.
+ `Scheduled`: Il est prévu que l'extension commence à une date future.
+ `Failed`: L'achat de l'extension a échoué (par exemple, en raison de problèmes de paiement).
+ `Expired`: La période de prolongation est terminée.

# Utilisation des plans de formation pour les emplois SageMaker de formation
<a name="training-plan-utilization-for-training-jobs"></a>

Vous pouvez utiliser un plan de SageMaker formation pour vos tâches de formation en spécifiant le plan de votre choix lors de la création d'un poste de formation.

**Note**  
Le plan d’entraînement doit avoir le statut `Scheduled` ou `Active` pour être utilisé par une tâche d’entraînement.

Si la capacité requise n’est pas immédiatement disponible pour une tâche d’entraînement, la tâche attend qu’elle soit disponible, que la condition `StoppingCondition` soit satisfaite ou que la tâche soit à l’état `Pending` pour la capacité depuis 2 jours, selon la première éventualité. Si la condition d’arrêt est satisfaite, la tâche est arrêtée. Si une tâche est en attente depuis 2 jours, elle est interrompue avec une erreur `InsufficientCapacityError`.

**Important**  
**Processus de résiliation de la capacité réservée :** vous avez un accès complet à toutes les instances réservées jusqu’à 30 minutes avant l’horaire de fin de la capacité réservée. Lorsqu'il vous reste 30 minutes dans votre capacité réservée, les plans de SageMaker formation commencent le processus consistant à mettre fin à toutes les instances en cours d'exécution dans les limites de cette capacité réservée.  
Pour vous assurer de ne pas perdre votre progression à cause de ces résiliations, nous vous recommandons d’effectuer un point de contrôle de vos tâches d’entraînement.

## Création de points de contrôle dans votre tâche d’entraînement
<a name="training-jobs-checkpointing"></a>

Lorsque vous utilisez des plans de SageMaker formation pour vos tâches de SageMaker formation, veillez à intégrer le point de contrôle dans votre script de formation. Cela vous permet d’enregistrer la progression de votre entraînement avant l’expiration d’une capacité réservée. La création de points de contrôle est particulièrement importante lorsque vous travaillez avec des capacités réservées, car elle vous permet de reprendre l’entraînement à partir du dernier point enregistré si votre tâche est interrompue entre deux capacités réservées ou lorsque votre plan d’entraînement arrive à sa date de fin.

Pour cela, vous pouvez utiliser la variable d’environnement `SAGEMAKER_CURRENT_CAPACITY_BLOCK_EXPIRATION_TIMESTAMP`. Cette variable permet de déterminer à quel moment initier le processus de création de points de contrôle. En incorporant cette logique dans votre script d’entraînement, vous vous assurez que la progression de votre modèle est enregistrée à des intervalles appropriés.

Voici un exemple de la façon dont vous pouvez implémenter cette logique de création de points de contrôle dans votre script d’entraînement Python :

```
import os
import time
from datetime import datetime, timedelta

def is_close_to_expiration(threshold_minutes=30):
    # Retrieve the expiration timestamp from the environment variable
    expiration_time_str = os.environ.get('SAGEMAKER_CURRENT_CAPACITY_BLOCK_EXPIRATION_TIMESTAMP', '0')
    
    # If the timestamp is not set (default '0'), return False
    if expiration_time_str == '0':
        return False
    
    # Convert the timestamp string (in milliseconds) to a datetime object
    expiration_time = datetime(1970, 1, 1) + timedelta(milliseconds=int(expiration_time_str))
    
    # Calculate the time difference between now and the expiration time
    time_difference = expiration_time - datetime.now()
    
    # Return True if we're within the threshold time of expiration
    return time_difference < timedelta(minutes=threshold_minutes)

def start_checkpointing():
    # Placeholder function for checkpointing logic
    print("Starting checkpointing process...")
    # TODO: Implement actual checkpointing logic here
    # For example:
    # - Save model state
    # - Save optimizer state
    # - Save current epoch and iteration numbers
    # - Save any other relevant training state

# Main training loop
num_epochs = 100
final_checkpointing_done = False
for epoch in range(num_epochs):
    # TODO: Replace this with your actual training code
    # For example:
    # - Load a batch of data
    # - Forward pass
    # - Calculate loss
    # - Backward pass
    # - Update model parameters
    
    # Check if we're close to capacity expiration and haven't done final checkpointing
    if not final_checkpointing_done and is_close_to_expiration():
        start_checkpointing()
        final_checkpointing_done = True
    
    # Simulate some training time (remove this in actual implementation)
    time.sleep(1)
print("Training completed.")
```

**Note**  
Le provisionnement des tâches de formation suit un ordre First-In-First-Out (FIFO), mais une tâche de cluster plus petite créée ultérieurement peut se voir attribuer une capacité avant une tâche de cluster plus importante créée plus tôt, si la tâche la plus importante ne peut pas être exécutée.
SageMaker le warm-pool géré par l'entraînement est compatible avec les plans d' SageMaker entraînement. Pour une réutilisation du cluster, vous devez fournir des valeurs `TrainingPlanArn` identiques dans les demandes `CreateTrainingJob` suivantes afin de réutiliser le même cluster.

**Topics**
+ [Création de points de contrôle dans votre tâche d’entraînement](#training-jobs-checkpointing)
+ [Créez une tâche de formation à l'aide de la console SageMaker AI](use-training-plan-for-training-jobs-using-console.md)
+ [Créez une tâche de formation à l'aide de l'API AWS CLI, du SageMaker SDK](use-training-plan-for-training-jobs-using-api-cli-sdk.md)

# Créez une tâche de formation à l'aide de la console SageMaker AI
<a name="use-training-plan-for-training-jobs-using-console"></a>

Vous pouvez utiliser un plan de SageMaker formation pour vos tâches de formation à l'aide de l'interface utilisateur SageMaker AI. Lorsque vous créez une tâche d’entraînement, les plans disponibles vous sont suggérés si votre choix d’instance et votre région correspondent aux plans disponibles.

Pour créer une tâche de formation en utilisant la capacité réservée d'un plan de formation dans la SageMaker console :

1. Accédez à la console SageMaker AI à l'adresse [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Dans le volet de navigation de gauche, choisissez **Entraînement**, puis **Tâches d’entraînement**.

1. Choisissez le bouton **Créer une tâche d’entraînement**.

1. Lorsque vous configurez les ressources de votre tâche d’entraînement, recherchez la section **Capacité de l’instance**. S’il existe des plans disponibles qui correspondent au type d’instance et à la région que vous avez choisis, ils sont affichés ici. Sélectionnez un plan d’entraînement aligné sur vos besoins en matière de capacité de calcul.

   Si aucun plan adapté n’est disponible, vous pouvez ajuster le type d’instance ou la région, ou continuer sans utiliser de plan d’entraînement.

1. Après avoir sélectionné un plan d’entraînement (ou choisi de continuer sans plan), terminez le reste de la configuration de votre tâche d’entraînement et choisissez **Créer une tâche d’entraînement** pour démarrer le processus.

![\[SageMaker Page de console AI pour créer un nouveau poste de formation. La page affiche diverses options de configuration, notamment les paramètres de tâche, les options d’algorithme, la configuration des ressources, la sélection du plan d’entraînement et les conditions d’arrêt.\]](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/images/training-plans/tp-create-training-job.png)


Vérifiez et lancez votre tâche. Votre tâche commence à s’exécuter dès que le plan d’entraînement devient `Active`, en fonction de la capacité.

# Créez une tâche de formation à l'aide de l'API AWS CLI, du SageMaker SDK
<a name="use-training-plan-for-training-jobs-using-api-cli-sdk"></a>

Pour utiliser SageMaker des plans de SageMaker formation pour votre tâche de formation, spécifiez le `TrainingPlanArn` paramètre du plan souhaité `ResourceConfig` lors de l'appel de l'opération [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html)API. Vous pouvez utiliser un et un seul plan par tâche.

**Important**  
Le champ `InstanceType` défini dans la section `ResourceConfig` de la demande `CreateTrainingJob` doit correspondre à l’élément `InstanceType` de votre plan d’entraînement.

## Exécution d’une tâche d’entraînement sur un plan à l’aide de l’interface de ligne de commande
<a name="training-job-cli"></a>

L'exemple suivant montre comment créer une tâche de SageMaker formation et l'associer à un plan de formation fourni à l'aide de l'`TrainingPlanArn`attribut de la `create-training-job` AWS CLI commande. 

Pour plus d'informations sur la création d'une tâche de formation à l'aide de la AWS CLI [CreateTrainingJob](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html)commande, consultez [https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-training-job.html](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-training-job.html).

```
# Create a training job
aws sagemaker create-training-job \
  --training-job-name training-job-name \
  ...
    
  --resource-config '{
        "InstanceType": "ml.p5.48xlarge",
        "InstanceCount": 8,
        "VolumeSizeInGB": 10,
        "TrainingPlanArn": "training-plan-arn"
        }
    }' \
    ...
```

Cet AWS CLI exemple de commande crée une nouvelle tâche de formation en SageMaker IA en utilisant un plan de formation dans l'`--resource-config`argument.

```
aws sagemaker create-training-job \
  --training-job-name job-name \
  --role-arn arn:aws:iam::111122223333:role/DataAndAPIAccessRole \
  --algorithm-specification '{"TrainingInputMode": "File","TrainingImage": "111122223333.dkr.ecr.us-east-1.amazonaws.com/algo-image:tag", "ContainerArguments": [" "]}' \
  --input-data-config '[{"ChannelName":"training","DataSource":{"S3DataSource":{"S3DataType":"S3Prefix","S3Uri":"s3://bucketname/input","S3DataDistributionType":"ShardedByS3Key"}}}]' \
  --output-data-config '{"S3OutputPath": "s3://bucketname/output"}' \
  --resource-config '{"VolumeSizeInGB":10,"InstanceCount":4,"InstanceType":"ml.p5.48xlarge", "TrainingPlanArn" : "arn:aws:sagemaker:us-east-1:111122223333:training-plan/plan-name"}' \
  --stopping-condition '{"MaxRuntimeInSeconds": 1800}' \
  --region us-east-1
```

Après avoir créé la tâche d’entraînement, vous pouvez vérifier qu’elle a été correctement attribuée au plan d’entraînement en appelant l’API `DescribeTrainingJob`.

```
aws sagemaker describe-training-job --training-job-name training-job-name
```

## Exécutez une tâche de formation sur un plan à l'aide du SDK SageMaker AI Python
<a name="training-job-sdk"></a>

Vous pouvez également créer une tâche de formation associée à un plan de formation à l'aide du [SDK SageMaker Python](https://sagemaker.readthedocs.io/en/stable/v2.html).

Si vous utilisez le SDK SageMaker Python depuis JupyterLab Studio pour créer une tâche de formation, assurez-vous que le rôle d'exécution utilisé par l'espace exécutant votre JupyterLab application dispose des autorisations requises pour utiliser les plans de SageMaker formation. Pour en savoir plus sur les autorisations requises pour utiliser les plans de SageMaker formation, consultez[IAM pour les plans de SageMaker formation](training-plan-iam-permissions.md).

L'exemple suivant montre comment créer une tâche de SageMaker formation et l'associer à un plan de formation fourni à l'aide de l'`training_plan`attribut de l'`Estimator`objet lors de l'utilisation du SDK SageMaker Python.

Pour plus d'informations sur l' SageMaker estimateur, voir [Utiliser un SageMaker estimateur pour exécuter une tâche de formation](https://docs.aws.amazon.com/sagemaker/latest/dg/docker-containers-adapt-your-own-private-registry-estimator.html).

```
import sagemaker
import boto3
from sagemaker import get_execution_role
from sagemaker.estimator import Estimator
from sagemaker.inputs import TrainingInput

# Set up the session and SageMaker client
session = boto3.Session()
region = session.region_name
sagemaker_session = session.client('sagemaker')

# Get the execution role for the training job
role = get_execution_role()

# Define the input data configuration
trainingInput = TrainingInput(
    s3_data='s3://input-path',
    distribution='ShardedByS3Key',
    s3_data_type='S3Prefix'
)

estimator = Estimator(
    entry_point='train.py',
    image_uri="123456789123.dkr.ecr.{}.amazonaws.com/image:tag",
    role=role,
    instance_count=4,
    instance_type='ml.p5.48xlarge',
    training_plan="training-plan-arn",
    volume_size=20,
    max_run=3600,
    sagemaker_session=sagemaker_session,
    output_path="s3://output-path"
)

# Create the training job
estimator.fit(inputs=trainingInput, job_name=job_name)
```

Après avoir créé la tâche d’entraînement, vous pouvez vérifier qu’elle a été correctement attribuée au plan d’entraînement en appelant l’API `DescribeTrainingJob`.

```
# Check job details
sagemaker_session.describe_training_job(TrainingJobName=job_name)
```

# Utilisation des plans de formation pour les SageMaker HyperPod clusters Amazon
<a name="training-plan-utilization-for-hyperpod"></a>

Pour utiliser des plans de SageMaker formation pour votre SageMaker HyperPod cluster Amazon, vous devez spécifier le plan de formation que vous souhaitez utiliser au niveau de l'instance de cluster lors de la création ou de la mise à jour de votre cluster. 

**Note**  
Le plan de formation doit avoir le `Active` statut `Scheduled` ou pour être utilisé par un HyperPod cluster.
Assurez-vous que la configuration du cluster correspond à la zone de disponibilité (AZ) spécifiée dans votre plan d’entraînement.  
Pour la configuration du VPC, l'emplacement des ressources et la configuration des groupes de sécurité, reportez-vous [Configuration SageMaker HyperPod avec un Amazon VPC personnalisé](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-vpc) à la SageMaker HyperPod documentation.  
Si vous effectuez HyperPod une configuration avec Amazon FSx for Lustre, découvrez la sélection des régions et des zones, consultez les exigences de configuration des VPC et comprenez les meilleures pratiques en matière d'alignement des zones de disponibilité dans. [(Facultatif) Configuration SageMaker HyperPod avec Amazon FSx pour Lustre](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-fsx)
Vous pouvez sélectionner un plan pour chacun de vos groupes d’instances. Toutefois, nous vous déconseillons d’utiliser un plan d’entraînement pour le groupe d’instances principal d’un cluster, car les nœuds primaires nécessitent des ressources continues et stables qui ne correspondent pas à la durée fixe et à la nature potentiellement discontinue des capacités du plan d’entraînement.

**Topics**
+ [Créez un SageMaker HyperPod cluster sur les plans de formation à l'aide de la console SageMaker AI](use-training-plan-for-hyperpod-creation-using-console.md)
+ [Mettre à jour un SageMaker HyperPod cluster sur les plans de formation à l'aide de la console SageMaker AI](use-training-plan-for-hyperpod-update-using-console.md)
+ [Créez un SageMaker HyperPod cluster sur les plans de formation à l'aide de l' SageMaker API, ou AWS CLI](use-training-plan-for-hyperpod-creation-using-api-cli-sdk.md)
+ [Mettre à jour un SageMaker HyperPod cluster sur les plans de formation à l'aide de SageMaker l'API, ou AWS CLI](use-training-plan-for-hyperpod-update-using-api-cli-sdk.md)

# Créez un SageMaker HyperPod cluster sur les plans de formation à l'aide de la console SageMaker AI
<a name="use-training-plan-for-hyperpod-creation-using-console"></a>

Pour créer un SageMaker HyperPod cluster à l'aide de plans de formation depuis l'interface utilisateur de la console SageMaker AI, procédez comme suit :

1. Accédez à la console SageMaker AI à l'adresse [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Dans le volet de navigation de gauche, choisissez **Hyperpod**, puis **Créer un cluster**.

1. Lorsque vous configurez un groupe d’instances, vous pouvez sélectionner un plan adapté à vos besoins en capacité de calcul.

![\[SageMaker Interface de console AI affichant une fenêtre modale permettant de créer un groupe d'instances au sein d'un SageMaker HyperPod cluster. Le formulaire inclut des champs pour le nom du groupe d’instances, le type d’instance, la quantité, la capacité de l’instance (avec des options pour les plans d’entraînement et à la demande) et un chemin de répertoire pour le script de cycle de vie lors de la création.\]](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/images/training-plans/tp-create-hyperpod-cluster.png)


Vérifiez et créez votre cluster. Les groupes d’instances utilisant un plan d’entraînement effectuent une augmentation verticale jusqu’au nombre d’instances cible spécifié lorsque le plan d’entraînement devient `Active`, sous réserve de la capacité disponible. Trente minutes avant la fin de chaque période de capacité réservée, le groupe d’instances commence une réduction verticale jusqu’à zéro instance. Cet état verticalement réduit persiste jusqu’au début de la période de capacité réservée suivante ou jusqu’à la fin du plan. Tout au long de ce processus, un groupe d’instances saines conserve son statut `InService` après sa création initiale, quel que soit le nombre d’instances actuel.

# Mettre à jour un SageMaker HyperPod cluster sur les plans de formation à l'aide de la console SageMaker AI
<a name="use-training-plan-for-hyperpod-update-using-console"></a>

Vous pouvez mettre à jour, supprimer ou ajouter un plan de formation à un SageMaker HyperPod cluster existant à l'aide de l'interface utilisateur de la console SageMaker AI. Pour mettre à jour le groupe d'instances d'un SageMaker HyperPod cluster, procédez comme suit :

1. Accédez à la console SageMaker AI à l'adresse [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Dans le volet de navigation de gauche, choisissez **Hyperpod**.

1. Accédez à la page de détails du cluster en suivant le lien hypertexte associé au nom du cluster.

1. Lorsque vous configurez un groupe d’instances, vous pouvez mettre à jour votre plan pour l’adapter à vos besoins en capacité de calcul.

![\[SageMaker Interface de console AI affichant une fenêtre modale pour mettre à jour un groupe d'instances au sein d'un SageMaker HyperPod cluster. Le formulaire inclut des champs pour le nom du groupe d’instances, le type d’instance, la quantité, la capacité de l’instance (avec des options pour les plans d’entraînement et à la demande) et un chemin de répertoire pour le script de cycle de vie lors de la création.\]](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/images/training-plans/tp-update-hyperpod-clusters.png)


Vérifiez et mettez à jour votre cluster.

# Créez un SageMaker HyperPod cluster sur les plans de formation à l'aide de l' SageMaker API, ou AWS CLI
<a name="use-training-plan-for-hyperpod-creation-using-api-cli-sdk"></a>

Pour utiliser des plans de SageMaker formation pour votre SageMaker HyperPod cluster Amazon, spécifiez l'ARN du plan de formation que vous souhaitez utiliser dans le [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-TrainingPlanArn](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-TrainingPlanArn)paramètre de [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html)lorsque vous appelez l'opération [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html)d'API. 

Assurez-vous que le sous-réseau associé à l’AZ désignée de votre plan est inclus dans l’élément `VPCConfig` de la configuration de votre cluster. Vous pouvez récupérer le contenu `AvailabilityZone` d'un plan de formation en réponse à un appel d'[``DescribeTrainingPlan](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlan.html)API.

L'exemple suivant montre comment créer un nouveau SageMaker HyperPod cluster et fournir à un groupe d'instances un plan de formation dans l'`--instance-groups`attribut de la `create-cluster` AWS CLI commande. 

```
# Create a cluster         
aws sagemaker create-cluster \
  --cluster-name cluster-name \
  --instance-groups '[ \
        { \
            "InstanceCount": 1,\
            "InstanceGroupName": "controller-nodes",\
            "InstanceType": "ml.t3.xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
        },\
        { \
            "InstanceCount": 2, \
            "InstanceGroupName": "worker-nodes",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id}:role/execution_role}",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        }]'
```

Pour plus d'informations sur la création d'un HyperPod cluster à l'aide du AWS CLI, consultez [https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-cluster.html](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-cluster.html).

Après avoir créé le cluster, vous pouvez vérifier que la capacité de votre groupe d’instances a été correctement attribuée dans le plan d’entraînement en appelant l’API `DescribeCluster`.

```
aws sagemaker describe-cluster --cluster-name cluster-name
```

# Mettre à jour un SageMaker HyperPod cluster sur les plans de formation à l'aide de SageMaker l'API, ou AWS CLI
<a name="use-training-plan-for-hyperpod-update-using-api-cli-sdk"></a>

Vous pouvez ajouter, mettre à jour ou supprimer un plan de formation en mettant à jour le groupe d'instances d'un cluster existant à l'aide de la `update-cluster` AWS CLI commande. L'exemple suivant montre comment mettre à jour un SageMaker HyperPod cluster et fournir un nouveau plan de formation à un groupe d'instances.

```
# Update a cluster
aws sagemaker update-cluster \
  --cluster-name cluster-name \
  --instance-groups '[ \
        { \
            "InstanceCount": 1,\
            "InstanceGroupName": "controller-nodes",\
            "InstanceType": "ml.t3.xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
        },\
        { \
            "InstanceCount": 2, \
            "InstanceGroupName": "worker-nodes",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id}:role/execution_role}",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        },\
        {\
            "InstanceCount": 1,\
            "InstanceGroupName": "worker-nodes-2",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        }\
    ]'
```

# Afficher les quotas des plans de SageMaker formation à l'aide de la console AWS de gestion
<a name="training-plan-quotas"></a>

**Important**  
Pour obtenir des informations sur les tarifs des plans de SageMaker formation, consultez la page de [ SageMaker tarification d'Amazon](https://aws.amazon.com/sagemaker/pricing/). Accédez à la section des **plans de formation SageMaker HyperPod flexibles d'Amazon** sous **Tarification à la demande**. Choisissez la région que vous souhaitez pour visualiser les types d’instances disponibles et leurs prix correspondants.
Assurez-vous que vos tâches de formation ou vos quotas de HyperPod service autorisent un nombre maximum d'instances par type d'instance supérieur au nombre d'instances spécifié dans votre plan.

Vous pouvez consulter les quotas et limites actuels des plans de SageMaker formation à l'aide de la console AWS de gestion. 

Pour rechercher une valeur de quota spécifique :

1. Ouvrez la [console Service Quotas](https://console.aws.amazon.com/servicequotas/home/services/sagemaker/quotas).

1. Dans le panneau de navigation de gauche, sélectionnez **Services AWS **.

1. Dans la liste des AWS services, recherchez et sélectionnez **Amazon SageMaker AI**.

1. Dans la liste des **quotas de service**, vous pouvez voir le nom du quota de service, la valeur appliquée (si elle est disponible), le quota AWS par défaut et si la valeur du quota est ajustable.

Pour rechercher des quotas spécifiques, vous pouvez utiliser la barre de recherche en haut de la liste **Quotas de service**. Saisissez l’élément `Limit Name` du quota que vous recherchez. Par exemple, pour rechercher le quota du nombre de plans d’entraînement par région, vous devez taper **training-plan-total\$1count** dans la barre de recherche.

Le tableau suivant indique les noms des limites de quotas pour les plans de SageMaker formation.


**SageMaker plans de formation, limites de quotas**  

| Nom de la limite | Nom d’affichage | 
| --- | --- | 
| training-plan-total\$1compter | Nombre de plans d’entraînement par région | 
| reserved-capacity-ml-p4 x 24 x large | Nombre d’instances ml.p4d.24xlarge figurant dans la capacité réservée sur l’ensemble des plans d’entraînement par région | 
| reserved-capacity-ml-p5 à 48 x large | Nombre d’instances ml.p5.48xlarge figurant dans la capacité réservée sur l’ensemble des plans d’entraînement par région | 
| reserved-capacity-ml-p5e-48 x large | Nombre d’instances ml.p5e.48xlarge figurant dans la capacité réservée sur l’ensemble des plans d’entraînement par région | 
| reserved-capacity-ml-p5 en 48 x large | Nombre d’instances ml.p5en.48xlarge figurant dans la capacité réservée sur l’ensemble des plans d’entraînement par région | 
| reserved-capacity-ml-trn1 à 32 x large | Nombre d’instances ml-trn1-32xlarge figurant dans la capacité réservée sur l’ensemble des plans d’entraînement par région | 
| reserved-capacity-ml-trn2 à 48 x large | Nombre d’instances ml.trn2.48xlarg figurant dans la capacité réservée sur l’ensemble des plans d’entraînement par région | 

Si vous avez besoin de limites plus élevées pour vos plans d' SageMaker entraînement, vous pouvez peut-être demander une augmentation de quota. La possibilité d’augmenter un quota dépend de son caractère ajustable, comme vous pouvez le voir dans la console **Service Quotas**.

Pour demander une augmentation de quota :

1. Accédez au quota spécifique dans la console **Service Quotas**.

1. Si les quotas sont ajustables, vous pouvez demander une augmentation des quotas au niveau du compte ou au niveau des ressources en fonction de la valeur indiquée dans la colonne **Ajustabilité**.

1. Pour **Augmenter la valeur du quota**, saisissez la nouvelle valeur. Elle doit être supérieure à la valeur actuelle.

1. Cliquez sur **Demander**.

1. Les demandes d'augmentation de quota sont soumises à l'examen et à l'approbation de AWS. Pour afficher les demandes en attente ou récemment résolues dans la console, accédez à l’onglet **Historique des demandes** depuis la page de détails du service ou choisissez **Tableau de bord** dans le volet de navigation. Pour les demandes en attente, choisissez l’état de la demande pour ouvrir le reçu de la demande. L’état initial d’une demande est `Pending`. Lorsque le statut est passé à`Quota requested`, le numéro de dossier s'affiche avec AWS Support. Choisissez le numéro de dossier pour ouvrir le billet pour votre demande.

Pour en avoir plus sur la demande d’une augmentation de quota en général, consultez [Demande d’augmentation de quota](https://docs.aws.amazon.com/servicequotas/latest/userguide/request-quota-increase.html) dans le *Guide de l’utilisateur AWS Service Quotas*.

# Notes de mise à jour
<a name="training-plan-release-notes"></a>

Consultez les notes de publication suivantes pour suivre les dernières mises à jour des plans de SageMaker formation.

## Notes de publication des plans de SageMaker formation Amazon : 4 décembre 2024
<a name="training-plan-release-notes-20241204"></a>

**Nouvelles fonctionnalités**
+ A lancé les plans SageMaker de formation Amazon à l'occasion de AWS re:Invent 2024.