

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Reserva planes de formación para tus HyperPod grupos o trabajos de formación
<a name="reserve-capacity-with-training-plans"></a>

Los planes de SageMaker entrenamiento de Amazon son una capacidad que te permite reservar y maximizar el uso de la capacidad de la GPU para cargas de trabajo de entrenamiento de modelos de IA a gran escala. Esta función proporciona acceso a tipos de instancias muy codiciados que cubren una amplia gama de opciones de computación acelerada por la GPU, incluidas las últimas tecnologías de GPU de NVIDIA y los chips Trainium. AWS Con los planes de SageMaker formación, puede garantizar un acceso predecible a estos recursos computacionales de alto rendimiento y alta demanda dentro de los plazos y presupuestos especificados, sin necesidad de administrar la infraestructura subyacente. Esta flexibilidad es especialmente valiosa para las organizaciones que se enfrentan al desafío de adquirir y programar estas instancias de computación con un exceso de suscripciones para sus cargas de trabajo de IA esenciales.

## ¿Qué son SageMaker los planes de formación
<a name="training-plans-what-is"></a>

SageMaker Los planes de formación le permiten reservar capacidad de cómputo adaptada a sus necesidades de recursos objetivo, como los trabajos de SageMaker formación o SageMaker HyperPod los clústeres. Este servicio gestiona automáticamente la reserva, el aprovisionamiento de los recursos computacionales acelerados, la configuración de la infraestructura, la ejecución de las cargas de trabajo y la recuperación en caso de errores en la infraestructura.

SageMaker Los planes de formación constan de uno o más bloques de capacidad reservada, cada uno definido por los siguientes parámetros:
+ Tipo de instancia específico
+ Cantidad de instancias
+ Zona de disponibilidad
+ Duración
+ Hora de inicio y finalización

**nota**  
Los planes de formación son específicos para su recurso objetivo ( SageMaker Training Job o SageMaker HyperPod) y no se pueden intercambiar.
Varios bloques de capacidad reservada en un mismo plan de entrenamiento pueden ser discontinuos. Esto significa que puede haber lagunas entre los bloques de la capacidad reservada.

## Ventajas de los planes de SageMaker formación
<a name="training-plans-benefits"></a>

SageMaker los planes de formación ofrecen las siguientes ventajas:
+ **Acceso predecible**: puede reservar la capacidad de la GPU para sus cargas de trabajo de machine learning para intervalos de tiempo específicos.
+ **Administración de los costos**: puede planificar y presupuestar con antelación los requisitos de entrenamiento a gran escala.
+ **Gestión automatizada de los recursos**: los planes de SageMaker formación se ocupan del aprovisionamiento y la gestión de la infraestructura.
+ **Flexibilidad**: cree planes de formación para diversos recursos, incluidos los trabajos de SageMaker formación y SageMaker HyperPod los clústeres.
+ **Tolerancia a los fallos**: benefíciese de la recuperación automática en caso de fallos de infraestructura y de la migración de la carga de trabajo entre zonas de disponibilidad para SageMaker realizar tareas de formación en IA.

## SageMaker planes de formación, reserva anticipada y horarios de inicio flexibles
<a name="training-plan-reservation-timing"></a>

SageMaker Los planes de formación te permiten reservar la capacidad de cómputo con antelación, con horarios de inicio y duración flexibles. 
+ **Reserva anticipada**: puede reservar un plan de entrenamiento con hasta 8 semanas (56 días) de antelación a la fecha de inicio.
+ **Plazo de entrega mínimo**: las ofertas de planes de SageMaker formación pueden empezar a ofrecerse en un plazo de 30 minutos a partir de la reserva (sujeto a disponibilidad).
**nota**  
Puede buscar y comprar un plan al que puede acceder en 30 minutos. Para garantizar la activación a tiempo, la transacción de pago debe completarse correctamente al menos 5 minutos antes de la hora de inicio deseada. Por ejemplo, si quiere que un plan comience a las 14:00 horas, puede hacer una búsqueda de última hora a las 13:30 horas y completar la compra antes de las 13:55 horas para garantizar que el plan esté listo antes de las 14:00 horas.
+ **Duración de la reserva y cantidad de instancias**: los planes de SageMaker formación le permiten reservar instancias con opciones específicas de duración y cantidad. Para ver los tipos de instancias disponibles en Región de AWS determinadas opciones de duración y cantidad, consulte[Tipos de instancias compatibles y precios Regiones de AWS](#training-plans-supported-instances-and-regions).
+ **Hora de finalización**: los planes de entrenamiento siempre finalizan a las 11:30 horas UTC del último día de la reserva.
+ **Finalización del plan de formación**: si utilizas tareas de formación como recurso objetivo y permanecen 30 minutos en una capacidad reservada, los planes de SageMaker formación inician el proceso de cerrar cualquier instancia en ejecución dentro de ese bloque hasta que se active la siguiente capacidad reservada. Conservará el acceso total a su plan de entrenamiento hasta 30 minutos antes de la hora de finalización del último bloque de la capacidad reservada.

  Si el recurso objetivo es un SageMaker HyperPod clúster, este límite de tiempo es de una hora.

## SageMaker planes de formación, flujo de trabajo de usuarios
<a name="training-plans-workflow"></a>

SageMaker los planes de formación se basan en los siguientes pasos:

Pasos de administración:

1. **Buscar y revisar**: encuentre las ofertas de planes disponibles que se adapten a sus requisitos computacionales, como el tipo de instancia, el recuento, la hora de inicio y la duración.

1. **Crear un plan**: reserve un plan de entrenamiento que se adapte a sus necesidades con el ID de la oferta de planes que haya elegido.

1. **Pagar y programar**: si el pago por adelantado se realiza correctamente, el estado del plan pasa a ser `Scheduled`.

Pasos que deben realizar los usuarios o los ingenieros de ML del plan:

1. **Asignación de recursos**: usa tu plan para poner en cola los trabajos de formación de SageMaker IA o asignarlos a un grupo de instancias de SageMaker HyperPod clúster.

1. **Activar**: cuando llega la fecha de inicio del plan, pasa a estar `Active`. En función de la capacidad reservada disponible, los planes de SageMaker formación lanzan automáticamente los trabajos de formación o aprovisionan grupos de instancias.

**nota**  
El estado del plan de entrenamiento pasa de `Scheduled` a `Active` cuando comienza un período de capacidad reservada y, luego, vuelve a `Scheduled` cuando espera a que comience el siguiente período de capacidad reservada. 

Los siguientes diagramas ofrecen una visión general completa de cómo interactúan los planes de SageMaker formación con los diferentes [target resources](#training-plans-target-resources) e ilustran el ciclo de vida de un plan y su función en la asignación de recursos tanto para las tareas de SageMaker formación como para SageMaker HyperPod los clústeres.
+ **Planes de formación para SageMaker Training Job**: el primer diagrama ilustra el end-to-end flujo de trabajo de la interacción entre un plan de formación y SageMaker Training Job.   
![\[Facturación, reserva de capacidad con planes de formación y SageMaker Training Job. Ilustración del ciclo de vida del plan de entrenamiento y de los estados de los trabajos de entrenamiento administrados por administradores e ingenieros de ML.\]](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/images/training-plans/tp-training-plan-for-training-jobs.png)
+ **Planes de formación para SageMaker HyperPod clústeres**: el segundo diagrama ilustra el end-to-end flujo de trabajo de la interacción entre un plan de formación y un grupo de SageMaker HyperPod instancias.  
![\[Facturación, reserva de capacidad con planes de entrenamiento y flujo de trabajo de administración de grupos de instancias. Ilustración de los estados del ciclo de vida del plan de entrenamiento y de los grupos de instancias administrados por administradores e ingenieros de ML.\]](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/images/training-plans/tp-training-plan-for-hyperpod.png)

## Tipos de instancias compatibles y precios Regiones de AWS
<a name="training-plans-supported-instances-and-regions"></a>

Los planes de entrenamiento admiten reservas para los siguientes tipos específicos de instancia de alto rendimiento, disponibles en determinadas Regiones de AWS:
+ **ml.p4d.24xlarge**
+ **ml.p5.48xlarge**
+ **ml.p5e.48xlarge**
+ **ml.p5en.48xlarge**
+ **ml.trn1.32xlarge**
+ **ml.trn2.48xlarge**
+ **ml.p6-b200.48xlarge**
+ **ml.c6i-32xlargesc**

**UltraServers**
+ **ml.p6e-gb200.36xlarge**
+ **ml.p6e-gb200.72xlarge**

**nota**  
La disponibilidad de los tipos de instancia puede cambiar con el tiempo. [Para up-to-date obtener más información sobre los tipos de instancias disponibles por región, así como sus precios respectivos, consulta los precios. SageMaker ](https://aws.amazon.com/sagemaker-ai/pricing/) Desplázate hacia abajo hasta la sección de **planes de formación SageMaker HyperPod flexibles de Amazon**, en **Precios bajo demanda**. Seleccione una región para ver la lista de tipos de instancia disponibles.

La disponibilidad en varias regiones permite elegir la ubicación más adecuada para las cargas de trabajo, teniendo en cuenta factores como los requisitos de residencia de los datos y la proximidad a otros servicios de AWS .

**importante**  
Puede utilizar los planes de SageMaker formación para reservar instancias con las siguientes opciones de duración de reserva y cantidad de instancias.  
La duración de las reservas está disponible en incrementos de 1 día, de 1 a 182 días.
Las opciones de cantidad de instancias de reserva son 1, 2, 4, 8, 16, 32 o 64 instancias.
Asegúrese de que sus cuotas de HyperPod servicios o trabajos de formación permitan un número máximo de instancias por tipo de instancia que supere el número de instancias especificado en su plan. Para ver las cuotas actuales o solicitar un aumento de cuotas, consulte [Consulta las cuotas SageMaker de los planes de formación mediante la consola AWS de administración](training-plan-quotas.md).

## UltraServers en SageMaker IA
<a name="training-plans-ultraservers"></a>

UltraServers en SageMaker IA ofrecen un conjunto de instancias interconectadas a través de un dominio de red de gran ancho de banda. Por ejemplo, el P6e- GB200 UltraServer conecta hasta 18 `p6e-gb200.36xlarge` instancias en un dominio NVIDIA NVLink . Con 4 NVIDIA Blackwell GPUs por instancia, cada P6e- GB200 UltraServer admite 72 GPUs, por lo que puede ejecutar sus mayores cargas de trabajo de IA con un alto rendimiento en IA. SageMaker 

Cuando lo utilizas UltraServers con SageMaker IA, el rendimiento se combina con la infraestructura gestionada de la SageMaker IA, las funciones integradas de resistencia a los fallos, las capacidades de monitorización integradas y la integración nativa con otros servicios y IA. SageMaker AWS Esta integración le permite centrarse en el desarrollo y la implementación de modelos, mientras que la SageMaker IA se ocupa del pesado e indiferenciado trabajo de gestionar la infraestructura de IA.

**nota**  
UltraServers están disponibles únicamente en la zona local de Dallas (us-east-1-dfw-2a), que es una extensión de la región EE.UU. Este (Norte de Virginia). [Para obtener más información, consulte Cómo empezar con s Zona local AWS](https://docs.aws.amazon.com/local-zones/latest/ug/getting-started.html)

### Consideraciones
<a name="training-plans-ultraservers-considerations"></a>

Tenga en cuenta lo siguiente cuando lo utilice UltraServers con SageMaker IA:
+ Se puede utilizar tanto UltraServers [ SageMaker HyperPod](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod.html)para trabajos de formación como para [trabajos de SageMaker formación](https://docs.aws.amazon.com/sagemaker/latest/dg/train-model.html).
+ Solo se pueden comprar UltraServers unidades completas. Para obtener más información sobre las instancias y los precios, consulta los planes de formación SageMaker HyperPod flexibles de [Amazon en los precios de Amazon SageMaker AI](https://aws.amazon.com/sagemaker-ai/pricing/).
+ Si lo utilizas UltraServers con HyperPod, añade HyperPod automáticamente etiquetas topológicas a tus recursos para ayudarte a asignarlos. Para obtener más información, consulte [Uso de la programación compatible con la topología en Amazon](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod-topology.html). SageMaker HyperPod
+ SageMaker La IA y UltraServers ofrecen diversas funciones que mejoran la resiliencia de sus cargas de trabajo, incluidas las comprobaciones preventivas y la detección y mitigación automáticas de errores. Según cuál sea el problema, la SageMaker IA puede tomar medidas para recuperar las cargas de trabajo, como reiniciar las instancias, sustituir las instancias defectuosas por otras o sustituir las que hayan fallado. UltraServers
+ Para aumentar la resiliencia, puede configurar las instancias internas y utilizarlas como instancias UltraServer de repuesto. Tener una instancia de repuesto dentro de ella UltraServer garantiza que la SageMaker IA pueda responder rápidamente a un fallo de la instancia y, al mismo tiempo, minimizar cualquier impacto en sus trabajos. Te recomendamos que guardes una instancia de repuesto por cada instancia UltraServer. No tiene que reservar ninguna instancia de repuesto, pero esto podría entorpecer las opciones de soporte y ralentizar la recuperación de los errores. Si compra UltraServers por lotes, la cantidad de repuestos que reserve no afectará al precio.
+ Para ver el estado y las instancias de una UltraServer, usa la operación de la [ ListTrainingPlans](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ListTrainingPlans.html)API o la AWS consola para ver los planes de formación. Con estas herramientas, puede ver la cantidad total de instancias disponibles, las instancias que se utilizan actualmente, las instancias en mal estado, la cantidad de piezas de repuesto configuradas y otra información. Los estados posibles son `ok`, `impaired` y `insufficient-data`.

## SageMaker planes de formación, comportamiento de búsqueda
<a name="training-plans-search-behavior"></a>

Al buscar una oferta de planes de formación, los planes de SageMaker formación utilizan el siguiente enfoque para maximizar la disponibilidad de recursos y la flexibilidad para los usuarios, incluso cuando la demanda es alta y los bloques de capacidad reservada son escasos:
+ **Búsqueda continua inicial**: los planes de SageMaker formación intentan primero encontrar un único bloque continuo de capacidad reservada que coincida con la duración especificada dentro de las fechas de inicio y finalización, y que cumpla con todos los demás criterios especificados, incluidos el recurso objetivo, el tipo de instancia solicitada y el número de instancias.
+ **Búsqueda en dos bloques**: los planes de SageMaker formación no arrojan un resultado de «sin capacidad» si no está disponible un único bloque continuo de capacidad reservada que cumpla todos los criterios. En cambio, intentan satisfacer automáticamente la solicitud con dos bloques de capacidad reservada independientes, dividiendo la duración total en dos segmentos de tiempo.

  Este enfoque de dos bloques proporciona más flexibilidad a la asignación de recursos, lo que podría proteger las instancias de alta demanda que, de otro modo, no estarían disponibles.

**nota**  
SageMaker Los planes de formación muestran hasta tres ofertas de uno o dos segmentos. Por ejemplo, para un plan de 48 horas de duración, los planes de SageMaker formación pueden ofrecer un plan con dos bloques de 24 horas, un bloque continuo de 48 horas y dos bloques con una duración irregular.

## Consideraciones
<a name="training-plans-considerations"></a>

**importante**  
Los planes de entrenamiento no se pueden modificar una vez comprados.
Los planes de formación no se pueden compartir entre AWS cuentas ni dentro de tu organización. AWS 
+ Al buscar ofertas de planes de formación, SageMaker Training Plans adapta su estrategia de búsqueda en función de[target resources](#training-plans-target-resources):

  **Para SageMaker HyperPod clústeres**:
  + Las ofertas se limitan a una sola zona de disponibilidad (AZ).
  + Esto garantiza un rendimiento consistente de la red y una ubicación de los datos dentro del clúster.

  **Para trabajos SageMaker de formación**:
  + Las ofertas pueden abarcar varias zonas de disponibilidad. 
  + Esto es particularmente relevante cuando la oferta del plan contiene múltiples capacidades reservadas discontinuas.
  + Por ejemplo, un plan podría incluir capacidad en AZ-A para un bloque de capacidad reservada y en AZ-B para otro. SageMaker Los planes de formación pueden mover automáticamente las cargas de trabajo entre las zonas de disponibilidad (AZs) en función de la disponibilidad de los recursos.

    Este enfoque de múltiples AZ para los trabajos de entrenamiento proporciona una mayor flexibilidad en la asignación de recursos, lo que aumenta las posibilidades de encontrar la capacidad adecuada para su carga de trabajo. Sin embargo, debes tener en cuenta que es posible que tus trabajos se ejecuten de forma diferente AZs durante distintos momentos del período de reserva.
+ Cuando se les presente una oferta de dos bloques, los usuarios deben considerar detenidamente si esta asignación dividida cumple con sus requisitos de carga de trabajo. Esto puede requerir ajustar la programación del trabajo o la distribución de la carga de trabajo para adaptarse a la naturaleza discontinua de la reserva.

# IAM para planes de SageMaker formación
<a name="training-plan-iam-permissions"></a>

SageMaker los planes de formación requieren permisos específicos para dos funciones distintas:

1. **Rol de creador de planes**: los usuarios a los que se les asigne el rol *Creador de planes* necesitan permisos para buscar ofertas de planes de entrenamiento, crear nuevos planes de entrenamiento y enumerarlos y describirlos.

1. **Función de usuario del plan**: los usuarios con el rol de *usuario del plan* necesitan permisos para utilizar los planes de SageMaker formación en tareas de formación o al crear y actualizar SageMaker HyperPod clústeres.

Antes de usar los planes de SageMaker formación, actualiza los permisos en función de tu método de acceso:
+ Para nuestros Consola de administración de AWS SageMaker SDKs usuarios: actualice los permisos del rol de IAM configurado para el usuario de la consola o el usuario de la API.
+ Para AWS CLI los usuarios: asegúrese de que su AWS CLI perfil esté configurado correctamente con las credenciales y los permisos adecuados.
+ Para los usuarios de aplicaciones de Studio JupyterLab, por ejemplo, defina los permisos en la función de ejecución asociada al espacio utilizado por la aplicación.

Puede configurar estos permisos con una política administrada o usando permisos individuales más detallados.

Para obtener más información acerca de cómo actualizar la política de permisos de un rol, consulte [Actualización de los permisos de un rol](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles_update-role-permissions.html). Para obtener más información sobre cómo buscar y ejecutar un rol de ejecución, consulte [Obtención del rol de ejecución](sagemaker-roles.md#sagemaker-roles-get-execution-role).

**nota**  
Los administradores deben considerar detenidamente qué usuarios necesitan poder crear planes de entrenamiento y asignar los permisos en consecuencia.

## Políticas administradas
<a name="training-plan-managed-policies"></a>
+ Para los creadores de planes: [https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerTrainingPlanCreateAccess.html](https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerTrainingPlanCreateAccess.html) otorga acceso para crear y administrar planes de entrenamiento.
+ Para los usuarios de planes: [https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerFullAccess.html](https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerFullAccess.html) incluye los permisos para usar los planes de entrenamiento.

**nota**  
La política `AmazonSageMakerFullAccess` gestionada está diseñada como una ease-of-use política principalmente con fines de experimentación. Si bien proporciona un amplio acceso a las funciones de la SageMaker IA, incluido el uso de planes de formación, es importante tener en cuenta lo siguiente:  
Esta política no se recomienda para entornos de producción debido a sus amplios permisos.
No incluye permisos para crear planes de entrenamiento, ya que `CreateTrainingPlan` se considera una acción administrativa que requiere pagar por adelantado.
Para los casos de uso de producción, recomendamos encarecidamente crear políticas personalizadas que respeten el principio de privilegios mínimos y concedan solo los permisos específicos necesarios para cada rol.

## Permisos individuales
<a name="training-plan-individual-permissions"></a>

La siguiente lista detalla los permisos detallados que deben establecerse en las declaraciones de política de IAM de un rol, en función de las acciones específicas que un usuario debe realizar con los planes de SageMaker formación:

### Lista de permisos de los planes de entrenamiento
<a name="training-plan-individual-permissions-list"></a>
+ `SearchTrainingPlanOfferings`: permite a los usuarios buscar las ofertas de planes de entrenamiento disponibles.

  ```
  {
    "Sid": "SearchTrainingPlanOfferingsPermissions",
    "Effect": "Allow",
    "Action": [
      "sagemaker:SearchTrainingPlanOfferings"
    ],
    "Resource": "*"
  }
  ```
+ `CreateTrainingPlan`: permite a los usuarios crear nuevos planes de entrenamiento.
**nota**  
También debe incluir los permisos para `CreateReservedCapacity` y `AddTags` y especificar ambos tipos de recurso `training-plan` y `reserved-capacity`.

  ```
  {
    "Sid": "CreateTrainingPlanPermissions",
    "Effect": "Allow",
    "Action": [
      "sagemaker:CreateTrainingPlan",
      "sagemaker:CreateReservedCapacity",
      "sagemaker:AddTags"
    ],
    "Resource": [
      "arn:aws:sagemaker:*:*:training-plan/*",
      "arn:aws:sagemaker:*:*:reserved-capacity/*"
    ]
  }
  ```
+ `DescribeTrainingPlan`: permite a los usuarios ver los detalles de los planes de entrenamiento existentes.

  ```
  {
    "Sid": "DescribeTrainingPlanPermissions",
    "Effect": "Allow",
    "Action": [
      "sagemaker:DescribeTrainingPlan"
    ],
    "Resource": [
      "arn:aws:sagemaker:::training-plan/*"
    ]
  }
  ```
+ `ListTrainingPlans`: Este permiso permite a los usuarios enumerar todos los planes de formación de su AWS cuenta.

  ```
  {
    "Sid": "ListTrainingPlansPermissions",
    "Effect": "Allow",
    "Action": [
      "sagemaker:ListTrainingPlans"
    ],
    "Resource": "*"
  }
  ```

### Permisos individuales por tipo de usuario
<a name="training-plan-permissions-per-user-type"></a>

En esta sección se proporciona un desglose detallado de los permisos individuales necesarios para cada rol, tal como se menciona en la sección [IAM para planes de SageMaker formación](#training-plan-iam-permissions). 

Los creadores de planes necesitan los siguientes permisos:
+ `sagemaker:SearchTrainingPlanOfferings`
+ `sagemaker:CreateTrainingPlan`
+ `sagemaker:CreateReservedCapacity`
+ `sagemaker:AddTags`
+ `sagemaker:DescribeTrainingPlan`
+ `sagemaker:ListTrainingPlans`

Los usuarios de planes necesitan los siguientes permisos:
+ `sagemaker:CreateTrainingJob`(para SageMaker Training Job)
+ `sagemaker:CreateCluster`y `sagemaker:UpdateCluster` (para SageMaker HyperPod)
+ Acceso a los `reserved-capacity` recursos `training-plan` y; al configurar las políticas de IAM para los planes de SageMaker formación, incluya los permisos tanto para ellos como para `training-plan` los `reserved-capacity` recursos. Estos recursos son necesarios tanto para los trabajos de SageMaker formación como para los SageMaker HyperPod clústeres. Esto permite que sus funciones de IAM interactúen con los recursos de los planes de SageMaker formación y gestionen la capacidad reservada.
  + En el SageMaker caso de los trabajos de formación, asegúrese de que su política incluya el `"arn:aws:sagemaker:::reserved-capacity/"` recurso `"arn:aws:sagemaker:::training-plan/"` ARNs y.

------
#### [ JSON ]

****  

```
{
  "Version":"2012-10-17",		 	 	 
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "sagemaker:CreateTrainingJob"
      ],
      "Resource": [
        "arn:aws:sagemaker:us-east-2:111122223333:training-job/",
        "arn:aws:sagemaker:us-east-2:111122223333:training-plan/",
        "arn:aws:sagemaker:us-east-2:111122223333:reserved-capacity/*"
      ]
    }
  ]
}
```

------

Del mismo modo, en el caso de SageMaker HyperPod las configuraciones, ARNs inclúyalos además de los recursos específicos del clúster.

------
#### [ JSON ]

****  

```
{
  "Version":"2012-10-17",		 	 	 
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "sagemaker:CreateCluster",
        "sagemaker:UpdateCluster"
      ],
      "Resource": [
        "arn:aws:sagemaker:us-east-2:111122223333:cluster/",
        "arn:aws:sagemaker:us-east-2:111122223333:training-plan/",
        "arn:aws:sagemaker:us-east-2:111122223333:reserved-capacity/*"
      ]
    }
  ]
}
```

------

# Creación de planes de entrenamiento
<a name="training-plan-creation"></a>

Para reservar la capacidad de cómputo utilizando la capacidad de los planes de SageMaker entrenamiento, sigue estos pasos:

1. **Identifique su recurso objetivo:** comience por determinar si necesita capacidad para tareas de SageMaker capacitación o SageMaker HyperPod clústeres.

1. **Especifique sus requisitos de capacidad:** defina sus necesidades de capacidad con detalle. Esto incluye seleccionar el tipo de instancia adecuado para su carga de trabajo, determinar la cantidad de instancias necesarias y especificar la duración del uso. Para obtener información sobre los tipos de instancias compatibles en una determinada Región de AWS opción de duración y cantidad, consulte[Tipos de instancias compatibles y precios Regiones de AWS](reserve-capacity-with-training-plans.md#training-plans-supported-instances-and-regions).

1. **Busque las ofertas de planes de formación disponibles:** una vez que especifique sus requisitos, utilice la función de búsqueda de los planes de SageMaker formación para encontrar las ofertas de planes de formación disponibles en uno o más segmentos. Cada oferta incluye detalles como la hora de inicio, la zona de disponibilidad específica para la capacidad reservada y el precio del plan. Revise estas ofertas teniendo en cuenta factores como la rentabilidad, las preferencias geográficas y la adecuación a sus necesidades específicas.

   Si no hay ningún plan adecuado disponible, adapte sus criterios de búsqueda y busque un nuevo conjunto de ofertas.

1. **Cree un plan de entrenamiento basado en una oferta adecuada:** tras identificar una oferta adecuada, proceda a crear su plan de entrenamiento. Este proceso implica seleccionar la oferta elegida e iniciar la reserva.
   + La reserva del plan de entrenamiento genera una factura.
   + El pago del importe total se cobra como parte del proceso de cumplimiento. Una vez realizado el pago, el plan estará listo para programar tus trabajos de SageMaker formación o crear HyperPod clústeres.

   Para obtener información sobre cómo utilizar los planes de formación para sus trabajos de SageMaker formación, consulte[Utilización de los planes de SageMaker formación para trabajos de formación](training-plan-utilization-for-training-jobs.md).

    Para obtener información sobre cómo utilizar los planes de formación para sus HyperPod clústeres, consulte[Utilización de planes de formación para SageMaker HyperPod clústeres de Amazon](training-plan-utilization-for-hyperpod.md).

Puedes crear un plan de entrenamiento con la consola de SageMaker IA o con métodos programáticos. La consola de SageMaker IA ofrece una interfaz gráfica y visual con una visión completa de tus opciones, mientras que la creación programática se puede realizar mediante la API de planes de formación AWS CLI o SageMaker SDKs interactuar directamente con ella.

Para obtener instrucciones sobre la step-by-step consola y referencias detalladas sobre la API, consulta las secciones correspondientes de esta documentación.

**Topics**
+ [SageMaker creación de planes de entrenamiento mediante la consola de SageMaker IA](training-plan-creation-using-console.md)
+ [SageMaker creación de planes de formación mediante la SageMaker API, o AWS CLI](training-plan-creation-using-api-cli-sdk.md)

# SageMaker creación de planes de entrenamiento mediante la consola de SageMaker IA
<a name="training-plan-creation-using-console"></a>

SageMaker Los planes de formación ofrecen una forma cómoda de crear planes de formación a través de la interfaz de usuario de la consola de SageMaker IA, lo que permite a los usuarios programar fácilmente sus recursos de formación en aprendizaje automático. En esta guía, se explica el proceso de creación de un plan de SageMaker formación para tareas y SageMaker HyperPod clústeres de formación mediante la consola de SageMaker IA. Si sigue estos pasos, buscará las ofertas de planes de entrenamiento, revisará las opciones disponibles y comprará el plan que mejor se adapte a sus necesidades.

Para crear un plan de entrenamiento visualmente desde una interfaz de usuario:

1. Para empezar, dirígete a la consola de SageMaker IA en [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Seleccione **Planes de entrenamiento** en el menú del panel izquierdo.

1. Desde allí, pulse el botón **Crear plan de entrenamiento** en el área de contenido principal para iniciar el proceso de configuración del programa de entrenamiento personalizado.

![\[SageMaker Consola de IA que muestra la página de planes de entrenamiento. La interfaz muestra información sobre el funcionamiento de los planes de entrenamiento, incluidos los pasos para solicitar, supervisar y utilizar un plan. En el panel de navegación izquierdo se resalta la opción “Planes de entrenamiento” y en el área de contenido principal aparece el botón “Crear plan de entrenamiento”.\]](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/images/training-plans/tp-console.png)


A continuación, busque ofertas de planes que se ajusten a sus necesidades computacionales.

**Topics**
+ [Búsqueda de ofertas de planes de entrenamiento](search-training-plan-offerings.md)
+ [Reserva del mejor plan de entrenamiento](choose-best-training-plan.md)
+ [Lista de planes de entrenamiento](list-training-plans.md)
+ [Visualización de los detalles del plan de entrenamiento](training-plan-details.md)

# Búsqueda de ofertas de planes de entrenamiento
<a name="search-training-plan-offerings"></a>

Después de elegir **Planes de entrenamiento** en el panel izquierdo de la consola de SageMaker IA y luego **Crear plan de entrenamiento**, se abre el formulario **Buscar plan de entrenamiento**. Este formulario le permite especificar sus requisitos y buscar las ofertas de planes de entrenamiento adecuadas.

Siga los pasos para completar el formulario:

1. Identifique su **Objetivo**: los planes de entrenamiento son específicos del recurso objetivo. Especifica si quieres usar un plan para ejecutar tareas de SageMaker formación o SageMaker HyperPod clústeres.

1. Para el **tipo de cómputo**, puede elegir entre **Instancia** o **UltraServer**. UltraServers son conectar varias instancias de Amazon EC2 mediante una interconexión aceleradora de baja latencia y gran ancho de banda. Para obtener más información, consulte [Amazon EC2 UltraServers](https://aws.amazon.com/ec2/ultraservers/). Para obtener más información sobre cómo utilizar UltraServers la IA, consulte. SageMaker [UltraServers en SageMaker IA](reserve-capacity-with-training-plans.md#training-plans-ultraservers)

1. Elija el **tipo de instancia** **y el número** de instancias que prefiera: para ver los tipos de instancias disponibles en determinadas opciones de duración y cantidad, consulte[Tipos de instancias compatibles y precios Regiones de AWS](reserve-capacity-with-training-plans.md#training-plans-supported-instances-and-regions). Región de AWS

1. Defina los parámetros de tiempo: elija las fechas de inicio y finalización que desee y especifique la duración del plan en esta ventana.

1. Seleccione **Buscar planes de entrenamiento**.

![\[SageMaker Consola de IA que muestra la página de ofertas de planes de formación de Search. La interfaz muestra opciones para seleccionar el recurso objetivo del plan (trabajo de formación o HyperPod clúster), especificar el tipo y el número de instancias, establecer las fechas de inicio y finalización e introducir la duración. En la parte inferior del formulario aparece el botón Buscar planes de entrenamiento.\]](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/images/training-plans/tp-search-training-plan-offerings.png)


SageMaker Los planes de formación buscan ofertas que se ajusten a sus requisitos de capacidad. Cuando se encuentran coincidencias dentro del período de tiempo especificado, estas aparecen en la parte inferior de la página. Cada oferta de plan de entrenamiento incluye los datos siguientes:
+ Duración total del plan
+ Fechas de inicio y finalización
+ Precio total por adelantado: 

  Coloque el cursor sobre el precio para ver el desglose detallado de la tarifa por hora de la instancia, el recuento de instancias y el total de horas.
+ Número total de segmentos del plan

Al hacer clic en el enlace de detalles del segmento, se abre una vista modal con detalles específicos del segmento:
+ Duración
+ Fechas de inicio y finalización
+ Zona de disponibilidad

![\[SageMaker La consola de IA muestra la página de búsqueda de ofertas de planes de formación con campos de entrada para los requisitos del plan y la sección de planes disponibles que muestra los detalles de los tres planes encontrados con diferentes duraciones, precios y estado de disponibilidad.\]](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/images/training-plans/tp-available-offerings.png)


Si no encuentra ningún plan adecuado o los planes disponibles no se ajustan a sus necesidades, ajuste los criterios de búsqueda modificando los parámetros del formulario en el formulario **Requisitos de los planes de entrenamiento**. Cuando encuentre una oferta adecuada, selecciónela y pulse **Siguiente** para ir a la página de reserva del plan. En esta página, puede asignar un nombre al plan y, a continuación, revisar y confirmar su selección antes de finalizar la reserva.

**nota**  
Los planes marcados como `Immediately available` comenzarán en 30 minutos, siempre que el pago se complete al menos 5 minutos antes de la hora de inicio programada.

# Reserva del mejor plan de entrenamiento
<a name="choose-best-training-plan"></a>

La búsqueda de un plan de entrenamiento ha arrojado ofertas que se ajustan a sus necesidades de capacidad y al presupuesto. 

1. Escriba un nombre para el plan y después elija **Siguiente**.

1. Revise su pedido y elija **Enviar**.
**importante**  
Los planes de entrenamiento no se pueden modificar una vez comprados.
Los planes de formación no se pueden compartir entre AWS cuentas ni dentro de su AWS organización.

   Después de enviar el pedido
   + El plan de entrenamiento aparece inicialmente como `Pending` en su lista de planes de entrenamiento.
   + La factura se genera automáticamente al recibir el pedido.
   + El pago total se cobra durante el proceso de cumplimiento.
   + Cuando el pago se procese correctamente, el estado del plan pasará a `Scheduled` y el plan ya se podrá usar.

![\[SageMaker La consola de IA muestra la página «Revisar y comprar» de un plan de formación. La página muestra los detalles del plan de entrenamiento, la información del segmento, el precio, el nombre del plan y las etiquetas. Hay opciones para editar, cancelar, volver atrás o crear el plan.\]](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/images/training-plans/tp-review-and-purchase-training-plan.png)


# Lista de planes de entrenamiento
<a name="list-training-plans"></a>

Cómo ver sus planes de entrenamiento:

1. Dirígete a la consola de SageMaker IA en [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Seleccione **Planes de entrenamiento** en el menú del panel izquierdo. Se mostrará una lista de todos sus planes de entrenamiento, incluidos los nombres, estado, tipo de recurso objetivo y otros detalles clave.

   Después de comprar un plan, accederá a esta lista. Los planes recién creados aparecen con el estado `Pending` hasta que se complete el pago. Por lo general, el estado se actualiza a los pocos minutos del procesamiento del pago.

![\[SageMaker La consola de IA muestra la página con la lista de planes de entrenamiento. La página incluye una tabla con los planes de entrenamiento con detalles como el nombre, el estado, el total de instancias, las instancias en uso, la zona, la fecha de inicio y la fecha de finalización. Aparece un botón para crear un nuevo plan de entrenamiento.\]](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/images/training-plans/tp-list-training-plans.png)


# Visualización de los detalles del plan de entrenamiento
<a name="training-plan-details"></a>

En la lista de planes de entrenamiento, siga el nombre del plan para consultar sus detalles. En concreto, puede comprobar su uso de capacidad actual y enumerar sus cargas de trabajo en la página de detalles de su plan. 

La página de detalles muestra:
+ La descripción general del plan de entrenamiento: estado, objetivo, tipo de instancia y duración.
+ Secciones ampliables para ver los detalles del segmento, los precios, el nombre del plan y las etiquetas.
+ Uso de la capacidad:
  + Total: número total de instancias reservadas en este plan de entrenamiento.
  + En uso: número de instancias de este plan de entrenamiento que se utiliza actualmente.
  + Instancias disponibles: número de instancias disponibles actualmente para usarlas en este plan de entrenamiento.

En la parte inferior de la página, hay un enlace que te permite ver los trabajos de formación o la lista de grupos de instancias de SageMaker HyperPod clúster asociados a este plan, en función del recurso al que se destine. 

![\[SageMaker Página de la consola de IA que muestra los detalles de un plan de formación. La página muestra la información básica del plan, el estado y los detalles de la instancia. A continuación, encontrará secciones ampliables para obtener detalles adicionales. En la parte inferior, una sección de uso de la capacidad muestra las instancias totales, en uso y disponibles del plan.\]](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/images/training-plans/tp-view-training-plan.png)


# SageMaker creación de planes de formación mediante la SageMaker API, o AWS CLI
<a name="training-plan-creation-using-api-cli-sdk"></a>

SageMaker los planes de formación apoyan la creación programática de planes de formación a través de su API. Puede interactuar con la API de los planes de formación mediante la AWS CLI o SageMaker SDKs.

SageMaker Las acciones de la API de los planes de formación proporcionan un flujo de trabajo integral para gestionar los planes de formación mediante programación:
+ **`SearchTrainingPlanOfferings`:** permite a los usuarios consultar y descubrir los recursos de computación disponibles especificando parámetros como el tipo de instancia, el recuento y el intervalo de tiempo deseado. La API devuelve una lista clasificada de las ofertas de planes de entrenamiento que mejor se adaptan a los requisitos del usuario.
+ **`CreateTrainingPlan`:** permite reservar una oferta de plan de entrenamiento específica, lo que transforma una capacidad de computación potencial en capacidades reservadas programadas con un ARN de plan de entrenamiento único.
+ **`ListTrainingPlans`:** Proporciona un método para recuperar y revisar todos los planes de formación existentes en la AWS cuenta de un usuario, con funciones opcionales de filtrado y clasificación.
+ **`DescribeTrainingPlan`:** ofrece información detallada sobre un plan de entrenamiento específico, incluidas las etapas de su ciclo de vida de `Pending` a `Active` hasta `Expired`.
+ **`ExtendTrainingPlan`:** Amplía un plan de formación existente mediante la compra de una oferta de extensión. Para obtener más información, consulte [Extensión de los planes de formación](training-plan-extension.md).
+ **`DescribeTrainingPlanExtensionHistory`:** Recupera el historial de extensiones de un plan de formación. Para obtener más información, consulte [Extensión de los planes de formación](training-plan-extension.md).

**Topics**
+ [Búsqueda de ofertas de planes de entrenamiento](search-training-plan-offerings-api-cli-sdk.md)
+ [Reserva del mejor plan de entrenamiento](choose-best-training-plan-using-api-cli-sdk.md)
+ [Lista de planes de entrenamiento](list-training-plans-using-api-cli-sdk.md)
+ [Visualización de los detalles del plan de entrenamiento](training-plan-details-using-api-cli-sdk.md)

# Búsqueda de ofertas de planes de entrenamiento
<a name="search-training-plan-offerings-api-cli-sdk"></a>

Para crear un plan de entrenamiento, comience por llamar a la operación de la API [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html) e incorpore los requisitos del plan (como el tipo de instancia, el recuento y el intervalo de tiempo deseado) como parámetros de entrada. Los planes de entrenamiento son específicos para el recurso objetivo. Asegúrese de especificar para qué recurso objetivo se utilizará el plan (`training-job` o `hyperpod-cluster`). La API devuelve una lista de ofertas disponibles que coinciden con sus requisitos. Si no encuentra ninguna oferta adecuada, es posible que tenga que ajustar sus requisitos y volver a buscar.

Esta llamada a la API obtiene las ofertas de planes de entrenamiento que mejor se adaptan a sus necesidades de capacidad. Cada [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TrainingPlanOffering.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TrainingPlanOffering.html) devuelta en la respuesta se identifica con un ID de oferta único. La primera oferta de la lista representa la que mejor se adapta a sus necesidades. Si no hay ningún plan de entrenamiento adecuado disponible en las fechas especificadas, la lista estará vacía. Adapte sus criterios de búsqueda y busque un nuevo conjunto de ofertas.
+ La duración de las reservas está disponible en incrementos de 1 día, de 1 a 182 días.
+ Las opciones de cantidad de instancias de reserva son 1, 2, 4, 8, 16, 32 o 64 instancias.

Para obtener más información sobre la lista de instancias disponibles compatibles con los planes de SageMaker formación, consulte[Tipos de instancias compatibles y precios Regiones de AWS](reserve-capacity-with-training-plans.md#training-plans-supported-instances-and-regions).

En el siguiente ejemplo, se utiliza un AWS CLI comando para solicitar ofertas de planes de formación con un tipo de instancia, un recuento y una información de tiempo específicos.

```
# List training plan offerings with instance type, instance count, duration in hours, start time after, and end time before.
aws sagemaker search-training-plan-offerings \
--target-resources "training-job" \
--instance-type "ml.p4d.24xlarge" \
--instance-count 1 \
--duration-hours 15 \
--start-time-after "1737484800"
--end-time-before "1737657600"
```

Este documento JSON es un ejemplo de respuesta de la API de planes de SageMaker formación. La respuesta proporciona información sobre las distintas ofertas de planes de entrenamiento disponibles que cumplen los requisitos de capacidad especificados. Incluye tres ofertas distintas con diferentes duraciones, tarifas anticipadas y start/end horarios, todas ellas con el mismo tipo de instancia y orientadas a trabajos de formación.

```
{
    "TrainingPlanOfferings": [
        {
            "TrainingPlanOfferingId": "tpo-SHA-256-hash-value",
            "TargetResources": [
                "training-job"
            ],
            "RequestedStartTimeAfter": "2025-01-21T11:08:27.704000-08:00",
            "DurationHours": 15,
            "DurationMinutes": 51,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD",
            "ReservedCapacityOfferings": [
                {
                    "InstanceType": "ml.p4d.24xlarge",
                    "InstanceCount": 1,
                    "AvailabilityZone": "us-west-2a",
                    "DurationHours": 15,
                    "DurationMinutes": 51,
                    "StartTime": "2025-01-21T11:39:00-08:00",
                    "EndTime": "2025-01-22T03:30:00-08:00"
                }
            ]
        },
        {
            "TrainingPlanOfferingId": "tpo-SHA-256-hash-value",
            "TargetResources": [
                "training-job"
            ],
            "RequestedStartTimeAfter": "2025-01-21T11:08:27.704000-08:00",
            "DurationHours": 39,
            "DurationMinutes": 51,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD",
            "ReservedCapacityOfferings": [
                {
                    "InstanceType": "ml.p4d.24xlarge",
                    "InstanceCount": 1,
                    "AvailabilityZone": "us-west-2a",
                    "DurationHours": 39,
                    "DurationMinutes": 51,
                    "StartTime": "2025-01-21T11:39:00-08:00",
                    "EndTime": "2025-01-23T03:30:00-08:00"
                }
            ]
        },
        {
            "TrainingPlanOfferingId": "tpo-SHA-256-hash-value",
            "TargetResources": [
                "training-job"
            ],
            "RequestedStartTimeAfter": "2025-01-21T11:08:27.704000-08:00",
            "DurationHours": 24,
            "DurationMinutes": 0,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD",
            "ReservedCapacityOfferings": [
                {
                    "InstanceType": "ml.p4d.24xlarge",
                    "InstanceCount": 1,
                    "AvailabilityZone": "us-west-2a",
                    "DurationHours": 24,
                    "DurationMinutes": 0,
                    "StartTime": "2025-01-22T03:30:00-08:00",
                    "EndTime": "2025-01-23T03:30:00-08:00"
                }
            ]
        }
    ]
}
```

El siguiente es un ejemplo de comando sobre cómo usarlo AWS CLI para buscar ofertas de planes de formación que incluyan. UltraServers

```
aws sagemaker search-training-plan-offerings \
--ultra-server-type ml.c6i-32xlargesc \
--ultra-server-count 1 \
--duration-hours 24 \
--target-resources hyperpod-cluster
--start-time-after "1737484800" \
--end-time-before "1737657600"
```

```
{
    "TrainingPlanOfferings": [
        {
            "TrainingPlanOfferingId": "tpo-SHA-256-hash-value",
            "TargetResources": [
                "training-job"
            ],
            "RequestedStartTimeAfter": "2025-07-21T16:59:25.760000+00:00",
            "DurationHours": 24,
            "DurationMinutes": 0,
            "UpfrontFee": "0.24",
            "CurrencyCode": "USD",
            "ReservedCapacityOfferings": [
                {
                    "ReservedCapacityType": "UltraServer",
                    "UltraServerType": "ml.u-p6e-gb200x72",
                    "UltraServerCount": 1,
                    "InstanceType": "ml.p6e-gb200.36xlarge",
                    "InstanceCount": 18,
                    "AvailabilityZone": "us-east-2a",
                    "DurationHours": 24,
                    "DurationMinutes": 0,
                    "StartTime": "2025-07-22T11:30:00+00:00",
                    "EndTime": "2025-07-23T11:30:00+00:00"
                }
            ]
        }
    ]
}
```

En las siguientes secciones se definen los parámetros de solicitud de entrada obligatorios y opcionales para la operación de la API `SearchTrainingPlanOfferings`.

## Parámetros necesarios
<a name="search-training-plan-options-required-params"></a>

Al llamar a la API [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html) para ver una lista de las ofertas de planes de entrenamiento que cumplen sus requisitos, debe proporcionar los siguientes valores:
+ `TargetResources`: son los recursos objetivo (`training-job` o `hyperpod-cluster`) para los que se utilizará el plan. El valor predeterminado es `training-job`. Los planes de entrenamiento son específicos para el recurso objetivo.
  + Un plan de formación diseñado para tareas de SageMaker formación solo se puede utilizar para programar y ejecutar tareas de formación.
  + Un plan de capacitación para HyperPod clústeres se puede usar exclusivamente para proporcionar recursos de cómputo al grupo de instancias de un clúster.
+ `InstanceType`: es el tipo de instancia que se va a aprovisionar. El `InstanceType` debe ser de un tipo compatible. 

  Para obtener más información sobre la lista de instancias disponibles compatibles con los planes de SageMaker formación, consulta[Tipos de instancias compatibles y precios Regiones de AWS](reserve-capacity-with-training-plans.md#training-plans-supported-instances-and-regions).
+ `InstanceCount`: es el número de instancias que se va a aprovisionar. Si el número de instancias es superior a 1, debe ser una potencia de 2.
+ `DurationHour`: es la duración total del plan solicitado en horas. La `DurationHour` se redondea al múltiplo de 24 más cercano.

## Parámetros opcionales
<a name="search-training-plan-options-optional-params"></a>

En las siguientes secciones, se proporcionan detalles sobre algunos parámetros opcionales que puede transferir a su solicitud de la API `SearchTrainingPlanOfferings`.
+ `StartTimeAfter`: especifique la hora de inicio solicitada del plan. `StartTimeAfter` debería ser un valor `timestamp` o `ISO 8601 date/time` del futuro.
+ `EndTimeBefore`: especifique la hora de finalización solicitada del plan en un formato `timestamp` o `ISO 8601 date/time`. `EndTimeBefore` debe ocurrir al menos 24 horas después de la hora de inicio.
+ `UltraServerType`: especifique el tipo UltraServer de búsqueda. Para obtener más información al respecto UltraServers, consulte[UltraServers en SageMaker IA](reserve-capacity-with-training-plans.md#training-plans-ultraservers).
+ `UltraServerCount`: especifique el número de UltraServers que desea buscar.

# Reserva del mejor plan de entrenamiento
<a name="choose-best-training-plan-using-api-cli-sdk"></a>

Tras revisar las ofertas de planes de entrenamiento disponibles que mejor se adapten a sus necesidades, puede reservar un plan específico llamando a la operación de la API [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html). Cuando se crea, el plan tiene inicialmente al estado `Pending` y lo mantiene hasta que se complete el proceso de reserva. La respuesta a la llamada a la API devuelve un Nombre de recurso de Amazon (ARN) de plan de entrenamiento. Anote este ARN para el seguimiento y supervisión futuras. La reserva del plan de entrenamiento se realiza de forma asíncrona en el backend. El pago del importe total se cobra automáticamente como parte del proceso de cumplimiento. Una vez finalizada la transacción de pago y aseguradas las capacidades reservadas solicitadas, el plan de entrenamiento pasa a tener el estado `Scheduled` y ya se puede programar.

**importante**  
Los planes de entrenamiento no se pueden modificar una vez comprados.
Los planes de formación no se pueden compartir entre AWS cuentas ni dentro de su AWS organización.

En el siguiente ejemplo, se utiliza el AWS CLI comando an para solicitar un plan de formación específico, pasando el identificador del plan como parámetro.

```
aws sagemaker create-training-plan \
--training-plan-offering-id "tpo-SHA-256-hash-value" \
--training-plan-name "name" \
```

Este documento JSON es un ejemplo de respuesta de la API de planes de SageMaker formación. La respuesta contiene el nombre de recurso de Amazon (ARN) del plan de entrenamiento que se ha creado correctamente.

**nota**  
El plan de entrenamiento conserva el estado `Pending` hasta que se complete el proceso de cumplimiento.

```
{
   "TrainingPlanArn":"arn:aws:sagemaker:us-east-1:123456789123:training-plan/large-models-fine-tuning"
}
```

En las siguientes secciones se definen los parámetros de solicitud de entrada obligatorios y opcionales para la operación de la API [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html).

## Parámetros necesarios
<a name="choose-best-training-plan-using-api-cli-sdk-required-params"></a>

Al llamar a la API [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html) para reservar un plan de entrenamiento concreto, debe proporcionar los siguientes valores:
+ `TrainingPlanOfferingId`: es el ID del plan que va a elegir. Puede obtener el ID de la oferta de un plan en respuesta a su llamada a la API `SearchTrainingPlanOfferings`. Su formato debe empezar por `pto-*`.
+ `TrainingPlanName`: es el nombre del plan que está creando. 

# Lista de planes de entrenamiento
<a name="list-training-plans-using-api-cli-sdk"></a>

Puedes hacer una lista de todos los planes de formación que se han creado en tu AWS cuenta y región llamando a la [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ListTrainingPlans.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ListTrainingPlans.html)API.

En el siguiente ejemplo, se utiliza un AWS CLI comando para recuperar la lista de tus planes de formación.

```
aws sagemaker list-training-plans \
--start-time-after "2024-09-26T00:00:01.000Z"
```

Este documento JSON es un ejemplo de respuesta de la API de planes de SageMaker formación. La respuesta proporciona detalles sobre un plan de entrenamiento que se ha creado y reservado correctamente.

```
{
   "[TrainingPlanSummaries](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TrainingPlanSummary.html)": [ 
      { 
         "AvailableInstanceCount": 2,
         "CurrencyCode": "USD",
         "DurationHours": 48,
         "DurationMinutes": 0,
         "EndTime": "2024-09-28T04:30:00-07:00",
         "InUseInstanceCount": 2,
         "[ReservedCapacitySummaries](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ReservedCapacitySummary.html)": [ 
            { 
               "AvailabilityZone": "string",
               "DurationHours": 48,
               "DurationMinutes": 0,
               "EndTime": "2024-09-28T04:30:00-07:00",
               "InstanceType": "ml.p5.48xlarge",
               "ReservedCapacityArn": "arn:aws:sagemaker:us-east-1:123456789123:reserved-capacity/large-models-fine-tuning-rc1",
               "StartTime": "2024-09-26T04:30:00-07:00",
               "Status": "Scheduled",
               "TotalInstanceCount": 4,
               "UltraServerCount": 4,
               "UltraServerType": "ml.p6e-gb200.36xlarge"
            }
         ],
         "StartTime": "2024-09-26T04:30:00-07:00",
         "Status": "Scheduled",
         "StatusMessage": "Payment confirmed, training plan scheduled."
         "TargetResources": [ "training-job" ],
         "TotalInstanceCount": 4,
         "TotalUltraServerCount": 4,
         "TrainingPlanArn": "arn:aws:sagemaker:us-east-1:123456789123:training-plan/large-models-fine-tuning",
         "TrainingPlanName": "large-models-fine-tuning",
         "UpfrontFee": "xxxx.xx"
      }
   ]
}
```

En las siguientes secciones, se proporcionan detalles sobre algunos parámetros opcionales que puede transferir a su solicitud de la API `ListTrainingPlans`.

## Parámetros opcionales
<a name="list-training-plans-optional-params"></a>

En las siguientes secciones, se proporcionan detalles sobre algunos parámetros opcionales que puede transferir a su solicitud de la API `ListTrainingPlans`.
+ `StartTimeAfter`: es la hora de inicio del intervalo de tiempo real de los planes de la lista, especificada como `timestamp` o `ISO 8601 date/time`. 
+ `StartTimeBefore`: es la hora de finalización del intervalo de tiempo real de los planes de la lista, especificada como `timestamp` o `ISO 8601 date/time`. 
+ `Filters`: Criterios utilizados para filtrar los resultados, con hasta 5 pares nombre-valor, donde «Nombre» es el nombre de un campo de a [TrainingPlanSummary](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TrainingPlanSummary.html)y «Valor» es el valor a tener en cuenta para el filtro. Por ejemplo, `Name=Status,Value=Active`.

En el siguiente ejemplo, se utiliza un AWS CLI comando para recuperar la lista de planes de entrenamiento mediante algunos de los parámetros opcionales descritos anteriormente.

```
aws sagemaker list-training-plans --max-results 10 --sort-by StartTime --sort-order Descending --start-time-after 13000000 --filters Name=Status,Value=Active
```

# Visualización de los detalles del plan de entrenamiento
<a name="training-plan-details-using-api-cli-sdk"></a>

Para supervisar el estado o recuperar los detalles de un plan de entrenamiento, puede utilizar la API [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlan.html). La respuesta de la API incluye un campo `Status` que refleja el estado actual del plan de entrenamiento:
+ Si el plan genera un error, el estado se establece en `Failed`.
+ Si el pago se realiza correctamente, el estado pasa de `Pending` a `Scheduled`, en función de la fecha de inicio del plan. 
+ Cuando el plan alcanza la fecha de inicio, su estado cambia a `Active`.
+ En el caso de los planes con varias capacidades reservadas discontinuas, el estado vuelve al estado `Scheduled` entre períodos activos, hasta la fecha de inicio de la siguiente capacidad reservada. 
+ Tras la fecha de finalización del plan, el estado pasa a `Expired`.

Una vez obtenido el estado`Scheduled`, puede utilizar la capacidad reservada en el plan para sus trabajos de SageMaker formación o cargas de trabajo en HyperPod clústeres.

**nota**  
Los trabajos de entrenamiento asociados al plan conservan el estado `Pending` hasta que el plan pase a estar `Active`. 
En el caso de HyperPod los clústeres que utilizan un plan de capacitación para la capacidad de cómputo, el estado del grupo de instancias aparece como `InService` una vez creado. 

En el siguiente ejemplo, se usa un AWS CLI comando para recuperar los detalles de un plan de entrenamiento por su nombre.

```
aws sagemaker describe-training-plan \
--training-plan-name "name"
```

Este documento JSON es un ejemplo de respuesta de la API de planes de SageMaker formación. Esta respuesta proporciona detalles sobre un plan de entrenamiento que se ha creado correctamente.

```
      { 
         "AvailableInstanceCount": 2,
         "CurrencyCode": "USD",
         "DurationHours": 48,
         "DurationMinutes": 0,
         "EndTime": "2024-09-28T04:30:00-07:00",
         "InUseInstanceCount": 2,
         "[ReservedCapacitySummaries](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ReservedCapacitySummary.html)": [ 
            { 
               "AvailabilityZone": "string",
               "DurationHours": 48,
               "DurationMinutes": 0,
               "EndTime": "2024-09-28T04:30:00-07:00",
               "InstanceType": "ml.p5.48xlarge",
               "ReservedCapacityArn": "arn:aws:sagemaker:us-east-1:123456789123:reserved-capacity/large-models-fine-tuning-rc1",
               "StartTime": "2024-09-26T04:30:00-07:00",
               "Status": "Scheduled",
               "TotalInstanceCount": 4,
               "UltraServerCount": 4,
               "UltraServerType": "ml.p6e-gb200.36xlarge"
            }
         ],
         "StartTime": "2024-09-26T04:30:00-07:00",
         "Status": "Scheduled",
         "StatusMessage": "Payment confirmed, training plan scheduled."
         "TargetResources": [ "training-job" ],
         "TotalInstanceCount": 4,
         "TotalUltraServerCount": 4,
         "TrainingPlanArn": "arn:aws:sagemaker:us-east-1:123456789123:training-plan/large-models-fine-tuning",
         "TrainingPlanName": "large-models-fine-tuning",
         "UpfrontFee": "xxxx.xx"
      }
```

En las siguientes secciones se definen los parámetros de solicitud de entrada obligatorios para la operación de la API `DescribeTrainingPlan`.

## Parámetros necesarios
<a name="training-plan-details-required-params"></a>
+ `TrainingPlanName`: es el nombre del plan de entrenamiento que desea describir.

# Extensión de los planes de formación
<a name="training-plan-extension"></a>

SageMaker Los planes de formación le permiten ampliar sus planes de formación actuales para evitar interrupciones en la carga de trabajo. Cuando un plan de formación está a punto de caducar, puedes ampliarlo directamente a través de la consola de SageMaker IA o mediante programación mediante la API o. AWS CLI Esto elimina la necesidad de crear un nuevo plan y reconfigurar la carga de trabajo con un nuevo plan de formación (ARN).

Con las ampliaciones del plan de formación, sus tareas de SageMaker formación en ejecución o sus SageMaker HyperPod clústeres seguirán funcionando sin interrupciones una vez que se amplíe el plan. El plan ampliado refleja la nueva fecha de finalización y puedes recuperar el historial de todas las extensiones de tu plan de entrenamiento.

**importante**  
Ten en cuenta que las extensiones no se pueden cancelar ni modificar para añadir o eliminar instancias.

## Características principales de
<a name="training-plan-extension-features"></a>
+ Amplíe los planes de formación a través de la consola o la API
+ Amplíe los planes con incrementos de 1 día hasta 14 días o incrementos de 7 días hasta 182 días
+ Amplíe un plan cualquier cantidad de veces
+ Consulta o enumera el historial de extensiones de tus planes de entrenamiento en la consola o a través de la API
+ Continuación perfecta de la ejecución de las cargas de trabajo en la SageMaker IA sin necesidad de volver a configurarlas

## Requisitos previos
<a name="training-plan-extension-prerequisites"></a>

Antes de ampliar un plan de formación, asegúrese de lo siguiente:
+ El plan de formación debe tener un estado de `Active` o`Scheduled`.
+ El plan no debe tener ninguna extensión de `Payment Pending` estado.
+ Las extensiones se pueden solicitar hasta un mínimo de 1 hora o un máximo de 56 días antes de que venza el plan.

**Topics**
+ [Características principales de](#training-plan-extension-features)
+ [Requisitos previos](#training-plan-extension-prerequisites)
+ [Amplía un plan de entrenamiento con la consola de SageMaker IA](training-plan-extension-using-console.md)
+ [Amplíe un plan de formación mediante la SageMaker API o AWS CLI](training-plan-extension-using-api-cli-sdk.md)

# Amplía un plan de entrenamiento con la consola de SageMaker IA
<a name="training-plan-extension-using-console"></a>

SageMaker Los planes de entrenamiento ofrecen una forma cómoda de ampliar los planes de entrenamiento existentes a través de la interfaz de usuario de la consola SageMaker AI. Esta guía te explica el proceso de ampliar un plan de SageMaker formación para formar trabajos y SageMaker HyperPod clústeres mediante la consola de SageMaker IA.

Para ampliar un plan de entrenamiento mediante la consola:

1. Ve a la consola de SageMaker IA en [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Selecciona **Planes de entrenamiento** en el panel de navegación izquierdo.

1. Seleccione de la lista el plan de formación que desee ampliar.

1. Pulsa el botón **Ampliar**.

1. Introduzca la fecha de finalización deseada para la extensión y pulse **Buscar** para encontrar las ofertas de extensiones disponibles.

1. Revisa la lista de ofertas de extensiones, que incluye detalles como la duración, la zona de disponibilidad, la tarifa inicial y las horas de inicio y finalización.

1. Seleccione la oferta de extensión que mejor se adapte a sus necesidades.

1. Revisa los detalles de la extensión en el cuadro de diálogo de confirmación y, a continuación, selecciona **Enviar** para confirmar la compra.

Una vez comprada la extensión, la fecha de finalización del plan de formación se actualiza para reflejar la nueva duración ampliada.

## Ver el historial de extensiones
<a name="training-plan-extension-history-console"></a>

Para ver el historial de extensiones de un plan de formación:

1. Ve a la página **de planes de entrenamiento** en la consola de SageMaker IA.

1. Selecciona el plan de entrenamiento que quieres ver.

1. En la página de detalles del plan de formación, consulta la sección **Extensiones** para ver todas las extensiones anteriores, incluido el identificador de oferta de la extensión, las fechas de inicio y finalización, el estado y la fecha de creación de la extensión.

## Valores del estado de la extensión
<a name="training-plan-extension-status-values-console"></a>

Las extensiones pueden tener los siguientes valores de estado:
+ `Pending`: La extensión se ha solicitado y está pendiente de procesamiento de pago.
+ `Active`: La extensión se ha comprado correctamente y está activa.
+ `Scheduled`: Está previsto que la prórroga comience en un futuro.
+ `Failed`: La compra de la extensión no se pudo realizar (por ejemplo, debido a problemas de pago).
+ `Expired`: El período de prórroga ha finalizado.

# Amplíe un plan de formación mediante la SageMaker API o AWS CLI
<a name="training-plan-extension-using-api-cli-sdk"></a>

SageMaker los planes de formación permiten ampliar los planes de formación mediante programación a través de su API. Puede interactuar con la API de los planes de formación mediante la AWS CLI o. SageMaker SDKs

La extensión del plan de formación incluye las siguientes acciones de la API:
+ **`SearchTrainingPlanOfferings`:** busque las ofertas de extensión disponibles especificando el ARN de su plan de formación y la duración de la extensión deseada. La API muestra las ofertas de extensión `TrainingPlanExtensionOfferings` sobre el terreno.
+ **`ExtendTrainingPlan`:** Adquiera una oferta de extensión específica para ampliar su plan de formación proporcionando la`TrainingPlanExtensionOfferingId`. Esto reserva la capacidad informática adicional y actualiza la fecha de finalización de su plan de formación.
+ **`DescribeTrainingPlanExtensionHistory`:** Consulta el historial completo de ampliaciones de un plan de formación, incluidas todas las ampliaciones anteriores con su estado, fechas e información de pago.

**Topics**
+ [Busque ofertas de extensiones](search-extension-offerings-api-cli-sdk.md)
+ [Compra una extensión](extend-training-plan-api-cli-sdk.md)
+ [Ver el historial de extensiones](describe-extension-history-api-cli-sdk.md)

# Busque ofertas de extensiones
<a name="search-extension-offerings-api-cli-sdk"></a>

Utilice la [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html)API con el `TrainingPlanArn` parámetro para encontrar las ofertas de extensión disponibles para su plan de formación.

En el siguiente ejemplo, se utiliza un AWS CLI comando para buscar ofertas de extensión para un plan de formación existente.

```
aws sagemaker search-training-plan-offerings \
--training-plan-arn "arn:aws:sagemaker:us-east-2:123456789012:training-plan/my-training-plan" \
--duration-hours 48
```

Este documento JSON es un ejemplo de respuesta de la API de planes de SageMaker formación. La respuesta incluye `TrainingPlanExtensionOfferings` las ofertas de extensión disponibles para el plan de formación especificado.

```
{
    "TrainingPlanOfferings": [],
    "TrainingPlanExtensionOfferings": [
        {
            "TrainingPlanExtensionOfferingId": "tpeo-SHA-256-hash-value",
            "AvailabilityZone": "us-east-2a",
            "StartDate": "2025-09-23T12:00:00Z",
            "EndDate": "2025-09-25T12:00:00Z",
            "DurationHours": 48,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD"
        }
    ]
}
```

En las siguientes secciones se definen los parámetros de solicitud de entrada obligatorios y opcionales para la operación de la `SearchTrainingPlanOfferings` API al buscar ofertas de extensiones.

## Parámetros necesarios
<a name="search-extension-offerings-required-params"></a>

Al llamar a la [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html)API para buscar ofertas de extensiones, debes proporcionar el siguiente valor:
+ `TrainingPlanArn`: El del plan de formación que deseas ampliar. `TrainingPlanArn`Deben hacer referencia a un plan de formación existente con un estado de `Active` o`Scheduled`.

## Parámetros opcionales
<a name="search-extension-offerings-optional-params"></a>

En las siguientes secciones se proporcionan detalles sobre algunos parámetros opcionales que puedes incluir en tu solicitud de `SearchTrainingPlanOfferings` API cuando busques ofertas de extensiones.
+ `DurationHours`: La duración deseada en horas para la extensión. La `DurationHours` se redondea al múltiplo de 24 más cercano.

# Compra una extensión
<a name="extend-training-plan-api-cli-sdk"></a>

Después de seleccionar una oferta de extensión, usa la [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html)API para comprarla.

En el siguiente ejemplo, se utiliza un AWS CLI comando para ampliar un plan de formación.

```
aws sagemaker extend-training-plan \
--training-plan-extension-offering-id "tpeo-SHA-256-hash-value"
```

Este documento JSON es un ejemplo de respuesta de la API de planes de SageMaker formación. La respuesta incluye la lista de extensiones del plan de formación.

```
{
    "TrainingPlanExtensions": [
        {
            "TrainingPlanExtensionOfferingId": "tpeo-SHA-256-hash-value",
            "ExtendedAt": "2025-09-17T10:00:00Z",
            "StartDate": "2025-09-23T12:00:00Z",
            "EndDate": "2025-09-25T12:00:00Z",
            "Status": "Pending",
            "PaymentStatus": "Pending",
            "AvailabilityZone": "us-east-2a",
            "DurationHours": 48,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD"
        }
    ]
}
```

En la siguiente sección se define el parámetro de solicitud de entrada obligatorio para la operación de la `ExtendTrainingPlan` API.

## Parámetros necesarios
<a name="extend-training-plan-required-params"></a>

Al llamar a la [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html)API para ampliar un plan de formación, debes proporcionar el siguiente valor:
+ `TrainingPlanExtensionOfferingId`: El identificador de la oferta de extensión que vas a comprar. Puedes recuperar este identificador `TrainingPlanExtensionOfferings` en la respuesta a tu llamada a la `SearchTrainingPlanOfferings` API. Su formato debe empezar por `tpeo-*`.

# Ver el historial de extensiones
<a name="describe-extension-history-api-cli-sdk"></a>

Usa la [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html)API para ver el historial completo de extensiones de un plan de formación.

En el siguiente ejemplo, se utiliza un AWS CLI comando para recuperar el historial de extensiones.

```
aws sagemaker describe-training-plan-extension-history \
--training-plan-arn "arn:aws:sagemaker:us-east-2:123456789012:training-plan/my-training-plan"
```

Este documento JSON es un ejemplo de respuesta de la API de planes de SageMaker formación. La respuesta incluye una lista paginada de todas las extensiones del plan de formación.

```
{
    "TrainingPlanExtensions": [
        {
            "TrainingPlanExtensionOfferingId": "tpeo-SHA-256-hash-value",
            "ExtendedAt": "2025-09-17T10:00:00Z",
            "StartDate": "2025-09-23T12:00:00Z",
            "EndDate": "2025-09-25T12:00:00Z",
            "Status": "Active",
            "PaymentStatus": "Completed",
            "AvailabilityZone": "us-east-2a",
            "DurationHours": 48,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD"
        }
    ],
    "NextToken": null
}
```

En las siguientes secciones se definen los parámetros de solicitud de entrada obligatorios y opcionales para la operación de la API `DescribeTrainingPlanExtensionHistory`.

## Parámetros necesarios
<a name="describe-extension-history-required-params"></a>

Al llamar a la [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html)API, debes proporcionar el siguiente valor:
+ `TrainingPlanArn`: El del plan de formación del que se va a recuperar el historial de extensiones.

## Parámetros opcionales
<a name="describe-extension-history-optional-params"></a>

En las siguientes secciones, se proporcionan detalles sobre algunos parámetros opcionales que puede transferir a su solicitud de la API `DescribeTrainingPlanExtensionHistory`.
+ `NextToken`: Si la respuesta anterior estaba truncada, recibirás este token. Úsalo en tu próxima solicitud para recibir el siguiente conjunto de resultados.
+ `MaxResults`: el número máximo de extensiones que se devolverán en la respuesta.

## Valores de estado de la extensión
<a name="extension-status-values-api"></a>

Las extensiones pueden tener los siguientes valores de estado:
+ `Pending`: La extensión se ha solicitado y está pendiente de procesamiento de pago.
+ `Active`: La extensión se ha comprado correctamente y está activa.
+ `Scheduled`: Está previsto que la prórroga comience en un futuro.
+ `Failed`: La compra de la extensión no se pudo realizar (por ejemplo, debido a problemas de pago).
+ `Expired`: El período de prórroga ha finalizado.

# Utilización de los planes de SageMaker formación para trabajos de formación
<a name="training-plan-utilization-for-training-jobs"></a>

Puede utilizar un plan de SageMaker formación para sus trabajos de formación especificando el plan de su elección al crear un trabajo de formación.

**nota**  
El plan de entrenamiento debe tener el estado `Scheduled` o `Active` para poder utilizarlo en un trabajo de entrenamiento.

Si la capacidad requerida no está disponible de inmediato para un trabajo de entrenamiento, el trabajo debe esperar hasta que esté disponible, hasta que se cumpla `StoppingCondition` o hasta que el trabajo haya estado `Pending` de capacidad durante 2 días, lo que ocurra primero. Si se cumple la condición de parada, el trabajo se detiene. Si un trabajo ha estado pendiente durante 2 días, se termina con un `InsufficientCapacityError`.

**importante**  
**Proceso de terminación de la capacidad reservada:** tiene acceso completo a todas las instancias reservadas hasta 30 minutos antes de la hora de finalización de la capacidad reservada. Cuando queden 30 minutos de capacidad reservada, los planes de SageMaker formación inician el proceso de finalización de cualquier instancia en ejecución dentro de esa capacidad reservada.  
Para asegurarse de no perder el progreso debido a estas terminaciones, le recomendamos revisar sus trabajos de entrenamiento.

## Punto de comprobación del trabajo de entrenamiento
<a name="training-jobs-checkpointing"></a>

Cuando utilice planes de SageMaker formación para sus trabajos de SageMaker formación, asegúrese de incluir puntos de control en su guion de formación. Esto le permite guardar el progreso del entrenamiento antes de que caduque la capacidad reservada. Los puntos de comprobación son especialmente importantes cuando se trabaja con capacidades reservadas, ya que permiten reanudar el entrenamiento desde el último punto guardado si el trabajo se interrumpe entre dos capacidades reservadas o cuando el plan de entrenamiento alcance la fecha de finalización.

Para ello, puede usar la variable de entorno `SAGEMAKER_CURRENT_CAPACITY_BLOCK_EXPIRATION_TIMESTAMP`. Esta variable ayuda a determinar cuándo iniciar el proceso de puntos de comprobación. Al incorporar esta lógica en el script de entrenamiento, debe asegurarse de que el progreso del modelo se guarde en los intervalos adecuados.

Este es un ejemplo de cómo puede implementar esta lógica de puntos de comprobación en el script de entrenamiento de Python:

```
import os
import time
from datetime import datetime, timedelta

def is_close_to_expiration(threshold_minutes=30):
    # Retrieve the expiration timestamp from the environment variable
    expiration_time_str = os.environ.get('SAGEMAKER_CURRENT_CAPACITY_BLOCK_EXPIRATION_TIMESTAMP', '0')
    
    # If the timestamp is not set (default '0'), return False
    if expiration_time_str == '0':
        return False
    
    # Convert the timestamp string (in milliseconds) to a datetime object
    expiration_time = datetime(1970, 1, 1) + timedelta(milliseconds=int(expiration_time_str))
    
    # Calculate the time difference between now and the expiration time
    time_difference = expiration_time - datetime.now()
    
    # Return True if we're within the threshold time of expiration
    return time_difference < timedelta(minutes=threshold_minutes)

def start_checkpointing():
    # Placeholder function for checkpointing logic
    print("Starting checkpointing process...")
    # TODO: Implement actual checkpointing logic here
    # For example:
    # - Save model state
    # - Save optimizer state
    # - Save current epoch and iteration numbers
    # - Save any other relevant training state

# Main training loop
num_epochs = 100
final_checkpointing_done = False
for epoch in range(num_epochs):
    # TODO: Replace this with your actual training code
    # For example:
    # - Load a batch of data
    # - Forward pass
    # - Calculate loss
    # - Backward pass
    # - Update model parameters
    
    # Check if we're close to capacity expiration and haven't done final checkpointing
    if not final_checkpointing_done and is_close_to_expiration():
        start_checkpointing()
        final_checkpointing_done = True
    
    # Simulate some training time (remove this in actual implementation)
    time.sleep(1)
print("Training completed.")
```

**nota**  
El aprovisionamiento de tareas de formación sigue un orden First-In-First-Out (FIFO), pero a un trabajo de clúster más pequeño que se cree más adelante se le puede asignar capacidad antes que a un trabajo de clúster más grande creado anteriormente, si no se puede cumplir con el trabajo más grande.
SageMaker la formación de una piscina caliente gestionada es compatible con los planes de formación. SageMaker Para volver a utilizar el clúster, debe proporcionar valores `TrainingPlanArn` idénticos en las solicitudes `CreateTrainingJob` posteriores.

**Topics**
+ [Punto de comprobación del trabajo de entrenamiento](#training-jobs-checkpointing)
+ [Crea un trabajo de entrenamiento con la consola de IA SageMaker](use-training-plan-for-training-jobs-using-console.md)
+ [Cree un trabajo de formación con la API y AWS CLI el SageMaker SDK](use-training-plan-for-training-jobs-using-api-cli-sdk.md)

# Crea un trabajo de entrenamiento con la consola de IA SageMaker
<a name="use-training-plan-for-training-jobs-using-console"></a>

Puedes usar un plan de SageMaker entrenamiento para tus trabajos de entrenamiento mediante la interfaz de usuario de SageMaker IA. Al crear un trabajo de entrenamiento, se le sugieren los planes disponibles si la instancia elegida y la región coinciden con los planes disponibles.

Para crear un trabajo de entrenamiento utilizando la capacidad reservada de un plan de entrenamiento en la SageMaker consola:

1. Ve a la consola de SageMaker IA en [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. En el panel de navegación izquierdo, elija **Entrenamiento** y, a continuación, **Trabajos de entrenamiento**.

1. Elija el botón **Crear trabajo de entrenamiento**.

1. Al configurar los recursos para el trabajo de entrenamiento, busque la sección **Capacidad de instancia**. Si hay planes disponibles que coincidan con el tipo de instancia y la región que haya elegido, se mostrarán aquí. Seleccione un plan de entrenamiento que se ajuste a sus necesidades de capacidad de computación.

   Si no hay planes adecuados disponibles, puede ajustar el tipo de instancia o la región o continuar sin utilizar ningún plan de entrenamiento.

1. Tras seleccionar un plan de entrenamiento (o si decide continuar sin plan), complete la configuración del trabajo de entrenamiento y elija **Crear trabajo de entrenamiento** para iniciar el proceso.

![\[SageMaker Página de la consola de IA para crear un nuevo trabajo de formación. La página muestra varias opciones de configuración, como los ajustes del trabajo, las opciones de algoritmo, la configuración de los recursos, la selección del plan de entrenamiento y las condiciones de detención.\]](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/images/training-plans/tp-create-training-job.png)


Revise y lance el trabajo. El trabajo se ejecutará en cuando el plan de entrenamiento esté `Active`, pero pendiente de la capacidad.

# Cree un trabajo de formación con la API y AWS CLI el SageMaker SDK
<a name="use-training-plan-for-training-jobs-using-api-cli-sdk"></a>

Para utilizar planes de SageMaker formación para su trabajo de SageMaker formación, especifique el `TrainingPlanArn` parámetro del plan deseado en la operación de la [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html)API `ResourceConfig` al llamar. Puede utilizar exactamente un plan por trabajo.

**importante**  
El campo `InstanceType` establecido en la sección `ResourceConfig` de la solicitud `CreateTrainingJob` debe coincidir con el `InstanceType` de su plan de entrenamiento.

## Ejecute un trabajo de entrenamiento en un plan mediante la CLI
<a name="training-job-cli"></a>

El siguiente ejemplo muestra cómo crear un trabajo de SageMaker formación y asociarlo a un plan de formación proporcionado mediante el `TrainingPlanArn` atributo del `create-training-job` AWS CLI comando. 

Para obtener más información sobre cómo crear un trabajo de formación mediante el AWS CLI [CreateTrainingJob](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html)comando, consulte [https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-training-job.html](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-training-job.html).

```
# Create a training job
aws sagemaker create-training-job \
  --training-job-name training-job-name \
  ...
    
  --resource-config '{
        "InstanceType": "ml.p5.48xlarge",
        "InstanceCount": 8,
        "VolumeSizeInGB": 10,
        "TrainingPlanArn": "training-plan-arn"
        }
    }' \
    ...
```

Este comando de AWS CLI ejemplo crea un nuevo trabajo de entrenamiento en SageMaker IA al incluir un plan de entrenamiento en el `--resource-config` argumento.

```
aws sagemaker create-training-job \
  --training-job-name job-name \
  --role-arn arn:aws:iam::111122223333:role/DataAndAPIAccessRole \
  --algorithm-specification '{"TrainingInputMode": "File","TrainingImage": "111122223333.dkr.ecr.us-east-1.amazonaws.com/algo-image:tag", "ContainerArguments": [" "]}' \
  --input-data-config '[{"ChannelName":"training","DataSource":{"S3DataSource":{"S3DataType":"S3Prefix","S3Uri":"s3://bucketname/input","S3DataDistributionType":"ShardedByS3Key"}}}]' \
  --output-data-config '{"S3OutputPath": "s3://bucketname/output"}' \
  --resource-config '{"VolumeSizeInGB":10,"InstanceCount":4,"InstanceType":"ml.p5.48xlarge", "TrainingPlanArn" : "arn:aws:sagemaker:us-east-1:111122223333:training-plan/plan-name"}' \
  --stopping-condition '{"MaxRuntimeInSeconds": 1800}' \
  --region us-east-1
```

Tras crear el trabajo de entrenamiento, puede comprobar que se haya asignado correctamente al plan de entrenamiento llamando a la API `DescribeTrainingJob`.

```
aws sagemaker describe-training-job --training-job-name training-job-name
```

## Ejecute un trabajo de formación según un plan con el SDK de Python para SageMaker IA
<a name="training-job-sdk"></a>

Como alternativa, puedes crear un trabajo de formación asociado a un plan de formación mediante el [SDK de SageMaker Python](https://sagemaker.readthedocs.io/en/stable/v2.html).

Si utilizas el SDK de SageMaker Python de JupyterLab Studio para crear un trabajo de formación, asegúrate de que la función de ejecución utilizada por el espacio que ejecuta la JupyterLab aplicación tenga los permisos necesarios para utilizar los planes de SageMaker formación. Para obtener más información sobre los permisos necesarios para usar los planes de SageMaker formación, consulte[IAM para planes de SageMaker formación](training-plan-iam-permissions.md).

El siguiente ejemplo muestra cómo crear un trabajo de SageMaker formación y asociarlo a un plan de formación proporcionado mediante el `training_plan` atributo del `Estimator` objeto cuando se utiliza el SDK de SageMaker Python.

Para obtener más información sobre el SageMaker estimador, consulte [Usar un SageMaker estimador para ejecutar un](https://docs.aws.amazon.com/sagemaker/latest/dg/docker-containers-adapt-your-own-private-registry-estimator.html) trabajo de formación.

```
import sagemaker
import boto3
from sagemaker import get_execution_role
from sagemaker.estimator import Estimator
from sagemaker.inputs import TrainingInput

# Set up the session and SageMaker client
session = boto3.Session()
region = session.region_name
sagemaker_session = session.client('sagemaker')

# Get the execution role for the training job
role = get_execution_role()

# Define the input data configuration
trainingInput = TrainingInput(
    s3_data='s3://input-path',
    distribution='ShardedByS3Key',
    s3_data_type='S3Prefix'
)

estimator = Estimator(
    entry_point='train.py',
    image_uri="123456789123.dkr.ecr.{}.amazonaws.com/image:tag",
    role=role,
    instance_count=4,
    instance_type='ml.p5.48xlarge',
    training_plan="training-plan-arn",
    volume_size=20,
    max_run=3600,
    sagemaker_session=sagemaker_session,
    output_path="s3://output-path"
)

# Create the training job
estimator.fit(inputs=trainingInput, job_name=job_name)
```

Tras crear el trabajo de entrenamiento, puede comprobar que se haya asignado correctamente al plan de entrenamiento llamando a la API `DescribeTrainingJob`.

```
# Check job details
sagemaker_session.describe_training_job(TrainingJobName=job_name)
```

# Utilización de planes de formación para SageMaker HyperPod clústeres de Amazon
<a name="training-plan-utilization-for-hyperpod"></a>

Para usar planes de SageMaker formación para tu SageMaker HyperPod clúster de Amazon, debes especificar el plan de formación que quieres usar a nivel de instancia de clúster al crear o actualizar tu clúster. 

**nota**  
El plan de formación debe tener el `Active` estado `Scheduled` o para que lo utilice un HyperPod clúster.
Asegúrese de que la configuración del clúster se ajuste a la zona de disponibilidad (AZ) especificada en su plan de entrenamiento.  
Para obtener información sobre la configuración de la VPC, la ubicación de los recursos y la configuración del grupo de seguridad, consulte [Configuración SageMaker HyperPod con una Amazon VPC personalizada](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-vpc) la SageMaker HyperPod documentación.  
Si está configurando HyperPod con Amazon FSx for Lustre, obtenga información sobre la selección de regiones y zonas de disponibilidad, consulte los requisitos de configuración de la VPC y comprenda las prácticas recomendadas de alineación de zonas de disponibilidad en. [(Opcional) Configuración SageMaker HyperPod con Amazon FSx for Lustre](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-fsx)
Puede seleccionar un plan para cada uno de sus grupos de instancias. Sin embargo, no recomendamos usar un plan de entrenamiento para el grupo de instancias principal de un clúster, ya que los nodos principales requieren recursos continuos y estables que no se ajustan a la duración fijada y a la naturaleza potencialmente discontinua de las capacidades del plan de entrenamiento.

**Topics**
+ [Cree un SageMaker HyperPod clúster de planes de formación mediante la consola de IA SageMaker](use-training-plan-for-hyperpod-creation-using-console.md)
+ [Actualice los planes de entrenamiento de un SageMaker HyperPod clúster mediante la consola de SageMaker IA](use-training-plan-for-hyperpod-update-using-console.md)
+ [Crea un SageMaker HyperPod clúster sobre los planes de formación mediante la SageMaker API, o AWS CLI](use-training-plan-for-hyperpod-creation-using-api-cli-sdk.md)
+ [Actualice un SageMaker HyperPod clúster según los planes de formación mediante la SageMaker API, o AWS CLI](use-training-plan-for-hyperpod-update-using-api-cli-sdk.md)

# Cree un SageMaker HyperPod clúster de planes de formación mediante la consola de IA SageMaker
<a name="use-training-plan-for-hyperpod-creation-using-console"></a>

Para crear un SageMaker HyperPod clúster con los planes de entrenamiento de la interfaz de usuario de la consola de SageMaker IA, sigue estos pasos:

1. Ve a la consola de SageMaker IA en [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Seleccione **HyperPod** en el panel de navegación izquierdo y, a continuación, **Crear clúster**.

1. Al configurar un grupo de instancias, puede seleccionar un plan que se ajuste a sus necesidades de capacidad de computación.

![\[SageMaker La interfaz de la consola de IA muestra una ventana modal para crear un grupo de instancias dentro de un SageMaker HyperPod clúster. El formulario incluye campos como el nombre del grupo de instancias, el tipo de instancia, la cantidad, la capacidad de la instancia (con opciones para planes de entrenamiento y bajo demanda) y una ruta de directorio para el script del ciclo de vida en el momento de la creación.\]](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/images/training-plans/tp-create-hyperpod-cluster.png)


Revise y cree su clúster. Los grupos de instancias que utilizan un plan de entrenamiento se escalan verticalmente hasta el número de instancias objetivo especificado cuando el plan de entrenamiento está `Active`, en función de la capacidad disponible. Treinta minutos antes de que finalice cada período de capacidad reservada, el grupo de instancias comienza a reducirse verticalmente a cero instancias. Este estado de reducción vertical se mantiene hasta que comience el siguiente período de capacidad reservada o hasta que finalice el plan. A lo largo de este proceso, un grupo de instancias en buen estado mantiene su estado `InService` tras su creación inicial, independientemente del recuento de instancias actual.

# Actualice los planes de entrenamiento de un SageMaker HyperPod clúster mediante la consola de SageMaker IA
<a name="use-training-plan-for-hyperpod-update-using-console"></a>

Puedes actualizar, eliminar o añadir un plan de entrenamiento a un SageMaker HyperPod clúster existente mediante la interfaz de usuario de la consola de SageMaker IA. Para actualizar el grupo de instancias de un SageMaker HyperPod clúster, sigue estos pasos:

1. Ve a la consola de SageMaker IA en [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. En el panel de navegación izquierdo, elija **HyperPod**.

1. Vaya a la página de detalles del clúster desde el hipervínculo asociado al nombre del clúster.

1. Al configurar un grupo de instancias, puede actualizar su plan para que se ajuste a sus necesidades de capacidad de computación.

![\[SageMaker La interfaz de la consola de IA muestra una ventana modal para actualizar un grupo de instancias dentro de un SageMaker HyperPod clúster. El formulario incluye campos como el nombre del grupo de instancias, el tipo de instancia, la cantidad, la capacidad de la instancia (con opciones para planes de entrenamiento y bajo demanda) y una ruta de directorio para el script del ciclo de vida en el momento de la creación.\]](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/images/training-plans/tp-update-hyperpod-clusters.png)


Revise y actualice su clúster.

# Crea un SageMaker HyperPod clúster sobre los planes de formación mediante la SageMaker API, o AWS CLI
<a name="use-training-plan-for-hyperpod-creation-using-api-cli-sdk"></a>

Para usar planes de SageMaker entrenamiento para tu SageMaker HyperPod clúster de Amazon, especifica el ARN del plan de entrenamiento que deseas usar en el [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-TrainingPlanArn](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-TrainingPlanArn)parámetro de la operación [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html)al llamar a la [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html)API. 

Asegúrese de que la subred asociada a la zona de disponibilidad designada de su plan esté incluida en la `VPCConfig` de la configuración de su clúster. Puedes recuperar el plan `AvailabilityZone` de formación en respuesta a una llamada a la [``DescribeTrainingPlan](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlan.html)API.

En el siguiente ejemplo, se muestra cómo crear un SageMaker HyperPod clúster nuevo y proporcionar a un grupo de instancias un plan de entrenamiento en el `--instance-groups` atributo del `create-cluster` AWS CLI comando. 

```
# Create a cluster         
aws sagemaker create-cluster \
  --cluster-name cluster-name \
  --instance-groups '[ \
        { \
            "InstanceCount": 1,\
            "InstanceGroupName": "controller-nodes",\
            "InstanceType": "ml.t3.xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
        },\
        { \
            "InstanceCount": 2, \
            "InstanceGroupName": "worker-nodes",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id}:role/execution_role}",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        }]'
```

Para obtener información sobre cómo crear un HyperPod clúster con el AWS CLI, consulte [https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-cluster.html](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-cluster.html).

Tras crear el clúster, puede comprobar que se haya asignado capacidad del plan de entrenamiento a su grupo de instancias llamando a la API `DescribeCluster`.

```
aws sagemaker describe-cluster --cluster-name cluster-name
```

# Actualice un SageMaker HyperPod clúster según los planes de formación mediante la SageMaker API, o AWS CLI
<a name="use-training-plan-for-hyperpod-update-using-api-cli-sdk"></a>

Para añadir, actualizar o eliminar un plan de formación, actualiza el grupo de instancias de un clúster existente mediante el `update-cluster` AWS CLI comando. En el siguiente ejemplo, se muestra cómo actualizar un SageMaker HyperPod clúster y proporcionar un nuevo plan de formación a un grupo de instancias.

```
# Update a cluster
aws sagemaker update-cluster \
  --cluster-name cluster-name \
  --instance-groups '[ \
        { \
            "InstanceCount": 1,\
            "InstanceGroupName": "controller-nodes",\
            "InstanceType": "ml.t3.xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
        },\
        { \
            "InstanceCount": 2, \
            "InstanceGroupName": "worker-nodes",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id}:role/execution_role}",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        },\
        {\
            "InstanceCount": 1,\
            "InstanceGroupName": "worker-nodes-2",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        }\
    ]'
```

# Consulta las cuotas SageMaker de los planes de formación mediante la consola AWS de administración
<a name="training-plan-quotas"></a>

**importante**  
Para obtener información sobre los precios de los planes de SageMaker formación, consulta la página de [ SageMaker precios de Amazon](https://aws.amazon.com/sagemaker/pricing/). Dirígete a la sección de **planes de formación SageMaker HyperPod flexibles de Amazon** en **Precios bajo demanda**. Elija la región que desee para ver los tipos de instancia disponibles y los precios correspondientes.
Asegúrese de que sus tareas de formación o sus cuotas de HyperPod servicio permitan un número máximo de instancias por tipo de instancia que supere el número de instancias especificado en su plan.

Puede ver las cuotas y los límites actuales de los planes de SageMaker formación mediante la Consola AWS de administración. 

Para buscar un valor de cuota específico:

1. Abra la [consola de Service Quotas de ](https://console.aws.amazon.com/servicequotas/home/services/sagemaker/quotas).

1. En el panel de navegación de la izquierda, elija **Servicios de AWS **.

1. En la lista de AWS servicios, busca y selecciona **Amazon SageMaker AI**.

1. En la lista de **cuotas de servicio**, puede ver el nombre de la cuota de servicio, el valor aplicado (si está disponible), la cuota AWS predeterminada y si el valor de la cuota es ajustable.

Para buscar cuotas específicas, puede usar la barra de búsqueda situada en la parte superior de la lista **Cuotas de servicio**. Escriba el `Limit Name` de la cuota que está buscando. Por ejemplo, para buscar la cuota del número de planes de entrenamiento por región, escribiría **training-plan-total\$1count** en la barra de búsqueda.

En la siguiente tabla se describen los nombres de los límites de cuota para los planes de SageMaker formación.


**SageMaker planes de formación, límites de cuota**  

| Nombre del límite  | Nombre de visualización | 
| --- | --- | 
| training-plan-total\$1count | Número de planes de entrenamiento por región | 
| reserved-capacity-ml-p4d-24 x grande | Número de instancias ml.p4d.24xlarge en capacidad reservada en todos los planes de formación por región | 
| reserved-capacity-ml-p5-48 x grande | Número de instancias ml.p5.48xlarge con capacidad reservada en todos los planes de formación por región | 
| reserved-capacity-ml-p5e-48 x grande | Número de instancias ml.p5e.48xlarge con capacidad reservada en todos los planes de formación por región | 
| reserved-capacity-ml-p5en, 48 x grande | Número de instancias ml.p5en.48xlarge con capacidad reservada en todos los planes de formación por región | 
| reserved-capacity-ml-trnDe 1 a 32 x grande | Número de instancias ml-trn1-32xlarge con capacidad reservada en todos los planes de entrenamiento por región | 
| reserved-capacity-ml-trn2-48 x grande | Número de instancias de ml.trn2,48 x de tamaño con capacidad reservada en todos los planes de formación por región | 

Si necesitas límites más altos para tus planes de SageMaker entrenamiento, es posible que puedas solicitar un aumento de la cuota. La posibilidad de aumentar una cuota depende de si es ajustable, como puede ver en la consola de **Service Quotas**.

Para solicitar un aumento de cuota:

1. Navegue hasta la cuota específica en la consola de **Service Quotas**.

1. Si la cuota es ajustable, puede solicitar un aumento de la cuota por cuenta o recurso en función del valor que aparezca en la columna de **Capacidad de ajuste**.

1. En **Aumentar el valor de la cuota**, introduzca el nuevo valor. El nuevo valor debe ser mayor que el valor actual.

1. Seleccione **Solicitar**.

1. Las solicitudes de aumento de cuota están sujetas a revisión y aprobación por parte de AWS. Para ver las solicitudes pendientes o resueltas recientemente en la consola, acceda a la pestaña **Historial de solicitudes** de la página de detalles del servicio o elija **Panel** en el panel de navegación. Para las solicitudes pendientes, seleccione el estado de la solicitud para abrir la recepción de solicitud. El estado inicial de una solicitud es `Pending`. Cuando el estado cambie a`Quota requested`, verá el número de caso en AWS Support. Elija el número de caso para abrir el ticket para su solicitud.

Para obtener más información sobre cómo solicitar un aumento de cuota en general, consulte [Solicitud de aumento de cuota](https://docs.aws.amazon.com/servicequotas/latest/userguide/request-quota-increase.html) en la *Guía de usuario de Service Quotas de AWS *.

# Notas de la versión
<a name="training-plan-release-notes"></a>

Consulte las siguientes notas de la versión para realizar un seguimiento de las últimas actualizaciones de los planes de SageMaker formación.

## Notas de publicación de los planes de SageMaker formación de Amazon: 4 de diciembre de 2024
<a name="training-plan-release-notes-20241204"></a>

**Nuevas características**
+ Lanzó los planes SageMaker de formación de Amazon en AWS re:Invent 2024.