

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Nutzung von Schulungsplänen für SageMaker HyperPod Amazon-Cluster
<a name="training-plan-utilization-for-hyperpod"></a>

Um SageMaker Trainingspläne für Ihren SageMaker HyperPod Amazon-Cluster zu verwenden, geben Sie bei der Erstellung oder Aktualisierung Ihres Clusters den Trainingsplan an, den Sie auf Cluster-Instance-Ebene verwenden möchten. 

**Anmerkung**  
Der Trainingsplan muss den `Active` Status `Scheduled` oder haben, um von einem HyperPod Cluster verwendet zu werden.
Stellen Sie sicher, dass die Cluster-Konfiguration der Availability Zone (AZ) entspricht, die in Ihrem Trainingsplan angegeben ist.  
Informationen zur VPC-Setup, zum Ressourcenstandort und zur Konfiguration der Sicherheitsgruppe finden Sie [Einrichtung SageMaker HyperPod mit einer benutzerdefinierten Amazon VPC](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-vpc) in der SageMaker HyperPod Dokumentation.  
Wenn Sie Amazon FSx for Lustre einrichten HyperPod , erfahren Sie mehr über die Auswahl von Regionen und AZ, lesen Sie die VPC-Konfigurationsanforderungen und erfahren Sie mehr über die Best Practices für die AZ-Ausrichtung unter. [(Optional) Einrichtung SageMaker HyperPod mit Amazon FSx for Lustre](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-fsx)
Sie können für jede Ihrer Instance-Gruppen einen Plan auswählen. Wir raten jedoch davon ab, einen Trainingsplan für die primäre Instance-Gruppe eines Clusters zu verwenden, da primäre Knoten kontinuierliche, stabile Ressourcen benötigen, die nicht der festen Dauer und dem potenziell diskontinuierlichen Charakter der Trainingsplankapazitäten entsprechen.

**Topics**
+ [Erstellen Sie mithilfe der KI-Konsole einen SageMaker HyperPod Cluster für Trainingspläne SageMaker](use-training-plan-for-hyperpod-creation-using-console.md)
+ [Aktualisieren Sie die Trainingspläne eines SageMaker HyperPod Clusters mithilfe der SageMaker AI-Konsole](use-training-plan-for-hyperpod-update-using-console.md)
+ [Erstellen Sie mithilfe der SageMaker API einen SageMaker HyperPod Cluster auf Trainingsplänen, oder AWS CLI](use-training-plan-for-hyperpod-creation-using-api-cli-sdk.md)
+ [Aktualisieren Sie einen SageMaker HyperPod Cluster anhand von Trainingsplänen mithilfe der SageMaker API, oder AWS CLI](use-training-plan-for-hyperpod-update-using-api-cli-sdk.md)

# Erstellen Sie mithilfe der KI-Konsole einen SageMaker HyperPod Cluster für Trainingspläne SageMaker
<a name="use-training-plan-for-hyperpod-creation-using-console"></a>

Gehen Sie folgendermaßen vor, um mithilfe von Trainingsplänen über die Benutzeroberfläche der SageMaker AI-Konsole einen SageMaker HyperPod Cluster zu erstellen:

1. Navigieren Sie zur SageMaker AI-Konsole unter [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Wählen Sie im linken Navigationsbereich **Hyperpod** und anschließend **Cluster erstellen** aus.

1. Bei der Konfiguration einer Instance-Gruppe können Sie einen Plan auswählen, der Ihren Rechenkapazitätsanforderungen entspricht.

![\[SageMaker Die AI-Konsolenoberfläche zeigt ein modales Fenster zum Erstellen einer Instanzgruppe innerhalb eines SageMaker HyperPod Clusters. Das Formular enthält Felder für den Instance-Gruppennamen, den Instance-Typ, die Menge, die Instance-Kapazität (mit Optionen für On-Demand- und Trainingspläne) sowie einen Verzeichnispfad für das Lebenszyklusskript bei der Erstellung.\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/images/training-plans/tp-create-hyperpod-cluster.png)


Überprüfen und erstellen Sie Ihren Cluster. Instance-Gruppen, die einen Trainingsplan verwenden, werden je nach verfügbarer Kapazität auf die angegebene Anzahl von ZielInstances skaliert`Active`, sobald der Trainingsplan festgelegt ist. Dreißig Minuten vor Ablauf jedes Zeitraums für reservierte Kapazität beginnt die Instance-Gruppe mit der Herunterskalierung auf null Instances. Dieser Status wird herunterskaliert, bis der nächste Zeitraum für reservierte Kapazität beginnt oder der Plan endet. Während dieses Prozesses behält eine intakte Instance-Gruppe ihren `InService` Status nach ihrer ersten Erstellung bei, unabhängig von der aktuellen Anzahl von Instances.

# Aktualisieren Sie die Trainingspläne eines SageMaker HyperPod Clusters mithilfe der SageMaker AI-Konsole
<a name="use-training-plan-for-hyperpod-update-using-console"></a>

Mithilfe der Benutzeroberfläche der SageMaker AI-Konsole können Sie einen Trainingsplan aktualisieren, entfernen oder zu einem vorhandenen SageMaker HyperPod Cluster hinzufügen. Gehen Sie folgendermaßen vor, um die Instanzgruppe eines SageMaker HyperPod Clusters zu aktualisieren:

1. Navigieren Sie zur SageMaker AI-Konsole unter [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Wählen Sie im linken Navigationsbereich **Hyperpod** aus.

1. Navigieren Sie zur Detailseite des Clusters, indem Sie dem Hyperlink folgen, der mit dem Clusternamen verknüpft ist.

1. Bei der Konfiguration einer Instance-Gruppe können Sie Ihren Plan aktualisieren, um ihn an Ihre neuen Rechenkapazitätsanforderungen anzupassen.

![\[SageMaker Die AI-Konsolenoberfläche zeigt ein modales Fenster zum Aktualisieren einer Instanzgruppe innerhalb eines SageMaker HyperPod Clusters. Das Formular enthält Felder für den Instance-Gruppennamen, den Instance-Typ, die Menge, die Instance-Kapazität (mit Optionen für On-Demand- und Trainingspläne) sowie einen Verzeichnispfad für das Lebenszyklusskript bei der Erstellung.\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/images/training-plans/tp-update-hyperpod-clusters.png)


Überprüfen und aktualisieren Sie Ihren Cluster.

# Erstellen Sie mithilfe der SageMaker API einen SageMaker HyperPod Cluster auf Trainingsplänen, oder AWS CLI
<a name="use-training-plan-for-hyperpod-creation-using-api-cli-sdk"></a>

Um SageMaker Trainingspläne für Ihren SageMaker HyperPod Amazon-Cluster zu verwenden, geben Sie den ARN des Trainingsplans, den Sie verwenden möchten, im [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-TrainingPlanArn](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-TrainingPlanArn)Parameter von an, [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html)wenn Sie die [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html)API-Operation aufrufen. 

Stellen Sie sicher, dass das mit der ausgewählten AZ Ihres Plans verbundene Subnetz in der`VPCConfig` Ihrer Clusterkonfiguration enthalten ist. Sie können die Daten `AvailabilityZone` eines Trainingsplans als Antwort auf einen [``DescribeTrainingPlan](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlan.html)API-Aufruf abrufen.

Das folgende Beispiel zeigt, wie Sie einen neuen SageMaker HyperPod Cluster erstellen und einer Instanzgruppe einen Trainingsplan im `--instance-groups` Attribut des `create-cluster` AWS CLI Befehls zur Verfügung stellen. 

```
# Create a cluster         
aws sagemaker create-cluster \
  --cluster-name cluster-name \
  --instance-groups '[ \
        { \
            "InstanceCount": 1,\
            "InstanceGroupName": "controller-nodes",\
            "InstanceType": "ml.t3.xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
        },\
        { \
            "InstanceCount": 2, \
            "InstanceGroupName": "worker-nodes",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id}:role/execution_role}",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        }]'
```

Hinweise zum Erstellen eines HyperPod Clusters mithilfe von finden Sie unter [https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-cluster.html](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-cluster.html). AWS CLI

Nachdem Sie den Cluster erstellt haben, können Sie überprüfen, ob Ihrer Instance-Gruppe die Kapazität aus dem Trainingsplan ordnungsgemäß zugewiesen wurde, indem Sie die `DescribeCluster`-API aufrufen.

```
aws sagemaker describe-cluster --cluster-name cluster-name
```

# Aktualisieren Sie einen SageMaker HyperPod Cluster anhand von Trainingsplänen mithilfe der SageMaker API, oder AWS CLI
<a name="use-training-plan-for-hyperpod-update-using-api-cli-sdk"></a>

Sie können einen Trainingsplan hinzufügen, aktualisieren oder entfernen, indem Sie die Instanzgruppe eines vorhandenen Clusters mithilfe des `update-cluster` AWS CLI Befehls aktualisieren. Das folgende Beispiel zeigt, wie Sie einen SageMaker HyperPod Cluster aktualisieren und einer Instanzgruppe einen neuen Trainingsplan zur Verfügung stellen.

```
# Update a cluster
aws sagemaker update-cluster \
  --cluster-name cluster-name \
  --instance-groups '[ \
        { \
            "InstanceCount": 1,\
            "InstanceGroupName": "controller-nodes",\
            "InstanceType": "ml.t3.xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
        },\
        { \
            "InstanceCount": 2, \
            "InstanceGroupName": "worker-nodes",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id}:role/execution_role}",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        },\
        {\
            "InstanceCount": 1,\
            "InstanceGroupName": "worker-nodes-2",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        }\
    ]'
```