

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Utilización de planes de formación para SageMaker HyperPod clústeres de Amazon
<a name="training-plan-utilization-for-hyperpod"></a>

Para usar planes de SageMaker formación para tu SageMaker HyperPod clúster de Amazon, debes especificar el plan de formación que quieres usar a nivel de instancia de clúster al crear o actualizar tu clúster. 

**nota**  
El plan de formación debe tener el `Active` estado `Scheduled` o para que lo utilice un HyperPod clúster.
Asegúrese de que la configuración del clúster se ajuste a la zona de disponibilidad (AZ) especificada en su plan de entrenamiento.  
Para obtener información sobre la configuración de la VPC, la ubicación de los recursos y la configuración del grupo de seguridad, consulte [Configuración SageMaker HyperPod con una Amazon VPC personalizada](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-vpc) la SageMaker HyperPod documentación.  
Si está configurando HyperPod con Amazon FSx for Lustre, obtenga información sobre la selección de regiones y zonas de disponibilidad, consulte los requisitos de configuración de la VPC y comprenda las prácticas recomendadas de alineación de zonas de disponibilidad en. [(Opcional) Configuración SageMaker HyperPod con Amazon FSx for Lustre](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-fsx)
Puede seleccionar un plan para cada uno de sus grupos de instancias. Sin embargo, no recomendamos usar un plan de entrenamiento para el grupo de instancias principal de un clúster, ya que los nodos principales requieren recursos continuos y estables que no se ajustan a la duración fijada y a la naturaleza potencialmente discontinua de las capacidades del plan de entrenamiento.

**Topics**
+ [Cree un SageMaker HyperPod clúster de planes de formación mediante la consola de IA SageMaker](use-training-plan-for-hyperpod-creation-using-console.md)
+ [Actualice los planes de entrenamiento de un SageMaker HyperPod clúster mediante la consola de SageMaker IA](use-training-plan-for-hyperpod-update-using-console.md)
+ [Crea un SageMaker HyperPod clúster sobre los planes de formación mediante la SageMaker API, o AWS CLI](use-training-plan-for-hyperpod-creation-using-api-cli-sdk.md)
+ [Actualice un SageMaker HyperPod clúster según los planes de formación mediante la SageMaker API, o AWS CLI](use-training-plan-for-hyperpod-update-using-api-cli-sdk.md)

# Cree un SageMaker HyperPod clúster de planes de formación mediante la consola de IA SageMaker
<a name="use-training-plan-for-hyperpod-creation-using-console"></a>

Para crear un SageMaker HyperPod clúster con los planes de entrenamiento de la interfaz de usuario de la consola de SageMaker IA, sigue estos pasos:

1. Ve a la consola de SageMaker IA en [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Seleccione **HyperPod** en el panel de navegación izquierdo y, a continuación, **Crear clúster**.

1. Al configurar un grupo de instancias, puede seleccionar un plan que se ajuste a sus necesidades de capacidad de computación.

![\[SageMaker La interfaz de la consola de IA muestra una ventana modal para crear un grupo de instancias dentro de un SageMaker HyperPod clúster. El formulario incluye campos como el nombre del grupo de instancias, el tipo de instancia, la cantidad, la capacidad de la instancia (con opciones para planes de entrenamiento y bajo demanda) y una ruta de directorio para el script del ciclo de vida en el momento de la creación.\]](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/images/training-plans/tp-create-hyperpod-cluster.png)


Revise y cree su clúster. Los grupos de instancias que utilizan un plan de entrenamiento se escalan verticalmente hasta el número de instancias objetivo especificado cuando el plan de entrenamiento está `Active`, en función de la capacidad disponible. Treinta minutos antes de que finalice cada período de capacidad reservada, el grupo de instancias comienza a reducirse verticalmente a cero instancias. Este estado de reducción vertical se mantiene hasta que comience el siguiente período de capacidad reservada o hasta que finalice el plan. A lo largo de este proceso, un grupo de instancias en buen estado mantiene su estado `InService` tras su creación inicial, independientemente del recuento de instancias actual.

# Actualice los planes de entrenamiento de un SageMaker HyperPod clúster mediante la consola de SageMaker IA
<a name="use-training-plan-for-hyperpod-update-using-console"></a>

Puedes actualizar, eliminar o añadir un plan de entrenamiento a un SageMaker HyperPod clúster existente mediante la interfaz de usuario de la consola de SageMaker IA. Para actualizar el grupo de instancias de un SageMaker HyperPod clúster, sigue estos pasos:

1. Ve a la consola de SageMaker IA en [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. En el panel de navegación izquierdo, elija **HyperPod**.

1. Vaya a la página de detalles del clúster desde el hipervínculo asociado al nombre del clúster.

1. Al configurar un grupo de instancias, puede actualizar su plan para que se ajuste a sus necesidades de capacidad de computación.

![\[SageMaker La interfaz de la consola de IA muestra una ventana modal para actualizar un grupo de instancias dentro de un SageMaker HyperPod clúster. El formulario incluye campos como el nombre del grupo de instancias, el tipo de instancia, la cantidad, la capacidad de la instancia (con opciones para planes de entrenamiento y bajo demanda) y una ruta de directorio para el script del ciclo de vida en el momento de la creación.\]](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/images/training-plans/tp-update-hyperpod-clusters.png)


Revise y actualice su clúster.

# Crea un SageMaker HyperPod clúster sobre los planes de formación mediante la SageMaker API, o AWS CLI
<a name="use-training-plan-for-hyperpod-creation-using-api-cli-sdk"></a>

Para usar planes de SageMaker entrenamiento para tu SageMaker HyperPod clúster de Amazon, especifica el ARN del plan de entrenamiento que deseas usar en el [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-TrainingPlanArn](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-TrainingPlanArn)parámetro de la operación [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html)al llamar a la [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html)API. 

Asegúrese de que la subred asociada a la zona de disponibilidad designada de su plan esté incluida en la `VPCConfig` de la configuración de su clúster. Puedes recuperar el plan `AvailabilityZone` de formación en respuesta a una llamada a la [``DescribeTrainingPlan](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlan.html)API.

En el siguiente ejemplo, se muestra cómo crear un SageMaker HyperPod clúster nuevo y proporcionar a un grupo de instancias un plan de entrenamiento en el `--instance-groups` atributo del `create-cluster` AWS CLI comando. 

```
# Create a cluster         
aws sagemaker create-cluster \
  --cluster-name cluster-name \
  --instance-groups '[ \
        { \
            "InstanceCount": 1,\
            "InstanceGroupName": "controller-nodes",\
            "InstanceType": "ml.t3.xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
        },\
        { \
            "InstanceCount": 2, \
            "InstanceGroupName": "worker-nodes",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id}:role/execution_role}",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        }]'
```

Para obtener información sobre cómo crear un HyperPod clúster con el AWS CLI, consulte [https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-cluster.html](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-cluster.html).

Tras crear el clúster, puede comprobar que se haya asignado capacidad del plan de entrenamiento a su grupo de instancias llamando a la API `DescribeCluster`.

```
aws sagemaker describe-cluster --cluster-name cluster-name
```

# Actualice un SageMaker HyperPod clúster según los planes de formación mediante la SageMaker API, o AWS CLI
<a name="use-training-plan-for-hyperpod-update-using-api-cli-sdk"></a>

Para añadir, actualizar o eliminar un plan de formación, actualiza el grupo de instancias de un clúster existente mediante el `update-cluster` AWS CLI comando. En el siguiente ejemplo, se muestra cómo actualizar un SageMaker HyperPod clúster y proporcionar un nuevo plan de formación a un grupo de instancias.

```
# Update a cluster
aws sagemaker update-cluster \
  --cluster-name cluster-name \
  --instance-groups '[ \
        { \
            "InstanceCount": 1,\
            "InstanceGroupName": "controller-nodes",\
            "InstanceType": "ml.t3.xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
        },\
        { \
            "InstanceCount": 2, \
            "InstanceGroupName": "worker-nodes",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id}:role/execution_role}",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        },\
        {\
            "InstanceCount": 1,\
            "InstanceGroupName": "worker-nodes-2",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        }\
    ]'
```