

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Reservieren Sie Schulungspläne für Ihre Trainingsjobs oder HyperPod -cluster
<a name="reserve-capacity-with-training-plans"></a>

 SageMaker Amazon-Schulungspläne sind eine Funktion, mit der Sie GPU-Kapazität für umfangreiche KI-Modell-Trainingsworkloads reservieren und dabei helfen können, deren Nutzung zu maximieren. Diese Funktion bietet Zugriff auf stark nachgefragte Instance-Typen, die eine Reihe von GPU-beschleunigten Rechenoptionen abdecken, darunter die neuesten NVIDIA-GPU-Technologien und Trainium-Chips. AWS Mit SageMaker Schulungsplänen können Sie sich einen vorhersehbaren Zugriff auf diese stark nachgefragten, leistungsstarken Rechenressourcen innerhalb Ihrer festgelegten Zeitpläne und Budgets sichern, ohne die zugrunde liegende Infrastruktur verwalten zu müssen. Diese Flexibilität ist besonders wertvoll für Unternehmen, die sich mit den Herausforderungen auseinandersetzen müssen, die mit der Beschaffung und Planung dieser überfüllten RechenInstances für ihre geschäftskritischen KI-Workloads verbunden sind.

## Was sind Schulungspläne SageMaker
<a name="training-plans-what-is"></a>

SageMaker Mit Schulungsplänen können Sie Rechenkapazität reservieren, die auf Ihre Zielressourcenanforderungen zugeschnitten ist, z. B. für SageMaker Schulungsjobs oder SageMaker HyperPod Cluster. Der Service kümmert sich automatisch um die Reservierung, Bereitstellung beschleunigter Rechenressourcen, die Einrichtung der Infrastruktur, die Ausführung von Workloads und die Wiederherstellung nach Infrastrukturausfällen.

SageMaker Trainingspläne bestehen aus einem oder mehreren Blöcken mit reservierter Kapazität, die jeweils durch die folgenden Parameter definiert sind:
+ Spezifischer Instance-Typ
+ Anzahl der Instances
+ Availability Zone
+ Dauer
+ Start- und Endzeiten

**Anmerkung**  
Schulungspläne sind spezifisch für ihre Zielressource (entweder SageMaker Ausbildungsjob oder SageMaker HyperPod) und können nicht ausgetauscht werden.
Mehrere Blöcke mit reservierter Kapazität in einem einzigen Trainingsplan können diskontinuierlich sein. Das bedeutet, dass es zu Lücken zwischen den Blöcken mit reservierter Kapazität kommen kann.

## Vorteile von SageMaker Ausbildungsplänen
<a name="training-plans-benefits"></a>

SageMaker Schulungspläne bieten die folgenden Vorteile:
+ **Vorhersehbarer Zugriff**: Reservieren Sie GPU-Kapazität für Ihre Machine-Learning-Workloads innerhalb bestimmter Zeitrahmen.
+ **Kostenmanagement**: Planen und budgetieren Sie umfangreiche Schulungsanforderungen im Voraus.
+ **Automatisiertes Ressourcenmanagement**: SageMaker Schulungspläne regeln die Bereitstellung und Verwaltung der Infrastruktur.
+ **Flexibilität**: Erstellen Sie Schulungspläne für verschiedene Ressourcen, einschließlich SageMaker Schulungsjobs und SageMaker HyperPod Cluster.
+ **Fehlertoleranz**: Profitieren Sie von der automatischen Wiederherstellung nach Infrastrukturausfällen und der Migration von Workloads zwischen Availability Zones für SageMaker KI-Schulungsaufgaben.

## SageMaker Schulungspläne, Voranmeldung und flexible Startzeiten
<a name="training-plan-reservation-timing"></a>

SageMaker Schulungspläne ermöglichen es Ihnen, Rechenkapazität im Voraus zu reservieren, mit flexiblen Startzeiten und Dauern. 
+ **Vorreservierung**: Sie können einen Schulungsplan bis zu 8 Wochen (56 Tage) vor dem Startdatum reservieren.
+ **Mindestvorlaufzeit**: Angebote für SageMaker Schulungspläne können je nach Verfügbarkeit innerhalb von 30 Minuten nach der Reservierung beginnen.
**Anmerkung**  
Sie können nach einem Tarif suchen und diesen erwerben, der innerhalb von 30 Minuten verfügbar sein wird. Um eine rechtzeitige Aktivierung zu gewährleisten, muss die Zahlungstransaktion mindestens 5 Minuten vor der gewünschten Startzeit erfolgreich abgeschlossen werden. Wenn Sie beispielsweise möchten, dass ein Tarif um 14:00 Uhr beginnt, können Sie bis 13:30 Uhr eine Last-Minute-Suche durchführen und Ihren Kauf bis 13:55 Uhr abschließen, um sicherzustellen, dass der Plan bis 14:00 Uhr fertig ist.
+ **Reservierungsdauer und Anzahl der Instanzen**: Mit SageMaker Schulungsplänen können Sie Instances mit bestimmten Optionen für Dauer und Anzahl reservieren. Informationen zu verfügbaren Instance-Typen mit bestimmten AWS-Region Optionen für Dauer und Anzahl finden Sie unter[Unterstützte Instanztypen und Preise AWS-Regionen](#training-plans-supported-instances-and-regions).
+ **Endzeit**: Die Trainingspläne enden immer um 11:30 Uhr UTC am letzten Tag der Reservierung.
+ **Kündigung des Schulungsplans**: Wenn Sie Trainingsjobs als Zielressource verwenden und noch 30 Minuten in einer reservierten Kapazität verbleiben, initiieren SageMaker Schulungspläne den Prozess, alle laufenden Instances innerhalb dieses Blocks zu beenden, bis die nächste reservierte Kapazität aktiv wird. Sie haben bis 30 Minuten vor dem Ende des letzten Blocks mit reservierter Kapazität vollen Zugriff auf Ihren Trainingsplan.

  Wenn es sich bei Ihrer Zielressource um einen SageMaker HyperPod Cluster handelt, beträgt dieses Zeitlimit eine Stunde.

## SageMaker Schulungspläne, Arbeitsablauf für Benutzer
<a name="training-plans-workflow"></a>

SageMaker Schulungspläne bestehen aus den folgenden Schritten:

Admin-Schritte:

1. **Suchen und überprüfen**: Finden Sie verfügbare Planangebote, die Ihren Rechenanforderungen entsprechen, wie z. B. Instance-Typ, Anzahl, Startzeit und Dauer.

1. **Plan erstellen**: Reservieren Sie einen Trainingsplan, der Ihren Anforderungen entspricht, und verwenden Sie dabei die ID des von Ihnen ausgewählten Planangebots.

1. **Zahlung und Terminplanung**: Nach erfolgreicher Vorauszahlung wird `Scheduled` der Status des Plans geändert.

Schritte für Nutzer des Plans /ML-Techniker:

1. **Ressourcenzuweisung**: Verwenden Sie Ihren Plan, um SageMaker KI-Schulungsaufträge in die Warteschlange zu stellen oder sie einer SageMaker HyperPod Cluster-Instanzgruppe zuzuweisen.

1. **Aktivierung**: Wenn das Startdatum des Plans erreicht ist, wird er `Active`. Basierend auf der verfügbaren reservierten Kapazität starten SageMaker Schulungspläne automatisch Schulungsjobs oder stellen Instanzgruppen bereit.

**Anmerkung**  
Der Status des Schulungsplans wechselt vom Beginn eines Zeitraums mit reservierter Kapazität `Scheduled` zu dem `Active` Zeitpunkt, zu `Scheduled` dem auf den Beginn des nächsten Zeitraums mit reservierter Kapazität gewartet wird. 

Die folgenden Diagramme bieten einen umfassenden Überblick darüber[target resources](#training-plans-target-resources), wie SageMaker Schulungspläne mit verschiedenen Gruppen interagieren. Sie veranschaulichen den Lebenszyklus eines Plans und seine Rolle bei der Ressourcenzuweisung sowohl für SageMaker Schulungsjobs als auch für SageMaker HyperPod Cluster.
+ **Trainingspläne für einen SageMaker Ausbildungsjob**: Das erste Diagramm veranschaulicht den end-to-end Ablauf der Interaktion zwischen einem Trainingsplan und einem SageMaker Trainingsjob.   
![\[Abrechnung, Kapazitätsreservierung mit Schulungsplänen und SageMaker Trainingsjob. Abbildung des Lebenszyklus des Schulungsplans und der Status der von Administratoren und ML-Technikern verwalteten Trainingsjobs.\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/images/training-plans/tp-training-plan-for-training-jobs.png)
+ **Trainingspläne für SageMaker HyperPod Cluster**: Das zweite Diagramm veranschaulicht den end-to-end Ablauf der Interaktion zwischen einem Trainingsplan und einer SageMaker HyperPod Instanzgruppe.  
![\[Abrechnung, Kapazitätsreservierung mit Trainingsplänen und Workflow zur Verwaltung von Instance-Gruppen. Abbildung des Lebenszyklus des Schulungsplans und der Status der Instance-Gruppen, die von Administratoren und ML-Technikern verwaltet werden.\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/images/training-plans/tp-training-plan-for-hyperpod.png)

## Unterstützte Instanztypen und Preise AWS-Regionen
<a name="training-plans-supported-instances-and-regions"></a>

Schulungspläne unterstützen Reservierungen für die folgenden spezifischen Hochleistungs-Instance-Typen, die jeweils in ausgewählten Varianten verfügbar sind AWS-Regionen:
+ **ml.p4d.24xlarge**
+ **ml.p5.48xlarge**
+ **ml.p5e.48x groß**
+ **ml.p5en.48x groß**
+ **ml.trn1.32xlarge**
+ **ml.trn 2.48x groß**
+ **ml.p6-b200.48x groß**
+ **ml.c6i-32xlargesc**

**UltraServers**
+ **ml.p6e-gb200.36x groß**
+ **ml.p6e-gb200.72x groß**

**Anmerkung**  
Die Verfügbarkeit von Instance-Typen kann sich im Laufe der Zeit ändern. [Die meisten up-to-date Informationen zu den verfügbaren Instance-Typen je nach Region sowie zu den jeweiligen Preisen finden Sie unter Preise. SageMaker ](https://aws.amazon.com/sagemaker-ai/pricing/) Scrollen Sie unter **On-Demand-Preise** nach unten zum Abschnitt ** SageMaker HyperPod Flexible Trainingspläne von Amazon**. Wählen Sie eine Region aus, um die Liste der verfügbaren Instance-Typen anzuzeigen.

Die Verfügbarkeit in mehreren Regionen ermöglicht es, den für Workloads am besten geeigneten Standort auszuwählen, wobei Faktoren wie die Anforderungen an die Datenresidenz und die Nähe zu anderen AWS Diensten berücksichtigt werden.

**Wichtig**  
Sie können SageMaker Schulungspläne verwenden, um Instances mit den folgenden Optionen für die Reservierungsdauer und die Anzahl der Instanzen zu reservieren.  
Die Reservierungsdauer ist in Schritten von 1 Tag bis 182 Tagen verfügbar.
Optionen für die Anzahl der Reservierungs-Instances: 1, 2, 4, 8, 16, 32 oder 64 Instances
Stellen Sie sicher, dass Ihre Training Jobs oder HyperPod Service-Kontingente eine maximale Anzahl von Instanzen pro Instance-Typ zulassen, die die in Ihrem Plan angegebene Anzahl von Instanzen übersteigt. Informationen zu Ihren aktuellen Kontingenten oder zum Anfordern einer Kontingenterhöhung finden Sie unter [Zeigen Sie die Kontingente für SageMaker Trainingspläne mithilfe der AWS Managementkonsole an.](training-plan-quotas.md).

## UltraServers in SageMaker KI
<a name="training-plans-ultraservers"></a>

UltraServers bieten in SageMaker KI eine Reihe von Instanzen an, die über eine Netzwerkdomäne mit hoher Bandbreite miteinander verbunden sind. Zum Beispiel GB200 UltraServer verbindet der P6e- bis zu 18 `p6e-gb200.36xlarge` Instanzen unter einer NVLink NVIDIA-Domain. Mit 4 NVIDIA Blackwell GPUs pro Instanz GB200 UltraServer unterstützt jeder P6e- 72 GPUs, sodass Sie Ihre größten KI-Workloads mit hoher Leistung auf KI ausführen können. SageMaker 

Wenn Sie SageMaker KI verwenden UltraServers , erhalten Sie Leistung in Kombination mit der verwalteten Infrastruktur von SageMaker KI, integrierten Funktionen zur Ausfallsicherheit, integrierten Überwachungsfunktionen und nativer Integration mit anderer KI und Diensten. SageMaker AWS Diese Integration ermöglicht es Ihnen, sich auf die Modellentwicklung und -bereitstellung zu konzentrieren, während SageMaker KI die undifferenzierte Schwerarbeit bei der Verwaltung der KI-Infrastruktur übernimmt.

**Anmerkung**  
UltraServers sind nur in der Dallas Local Zone (us-east-1-dfw-2a) verfügbar, einer Erweiterung der Region USA Ost (Nord-Virginia). [Weitere Informationen finden Sie unter Erste Schritte mit s AWS Local Zone](https://docs.aws.amazon.com/local-zones/latest/ug/getting-started.html)

### Überlegungen
<a name="training-plans-ultraservers-considerations"></a>

Beachten Sie bei der Verwendung UltraServers mit SageMaker KI Folgendes:
+ Sie können es sowohl UltraServers für [ SageMaker Trainingsaufgaben als [ SageMaker HyperPod](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod.html)auch für Trainingszwecke](https://docs.aws.amazon.com/sagemaker/latest/dg/train-model.html) verwenden.
+ Sie können nur vollständige Einheiten kaufen UltraServers . Weitere Informationen zu Instance- und Preisinformationen finden Sie unter SageMaker HyperPod Flexible Amazon-Schulungspläne unter [Amazon SageMaker AI-Preise](https://aws.amazon.com/sagemaker-ai/pricing/).
+ Wenn Sie UltraServers mit verwenden HyperPod, fügt Ihren Ressourcen HyperPod automatisch Topologie-Labels hinzu, um Sie bei der Ressourcenzuweisung zu unterstützen. Weitere Informationen finden Sie unter [Topologieorientierte Terminplanung in Amazon verwenden](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod-topology.html). SageMaker HyperPod
+ SageMaker KI und UltraServers bieten verschiedene Funktionen, die die Resilienz Ihrer Workloads verbessern, darunter präventive Prüfungen und automatische Fehlererkennung und -behebung. Je nachdem, um welches Problem es sich handelt, kann SageMaker KI Aktionen zur Wiederherstellung Ihrer Workloads ausführen, z. B. Instances neu starten, ausgefallene Instances durch Ersatzteile ersetzen und ausgefallene Instances ersetzen. UltraServers
+  UltraServer Um die Ausfallsicherheit zu erhöhen, können Sie Instances innerhalb eines so konfigurieren, dass sie als Ersatzteile verwendet werden. UltraServer Durch die Beibehaltung einer Ersatzinstanz wird sichergestellt, dass SageMaker KI schnell auf einen Instance-Ausfall reagieren kann und gleichzeitig die Auswirkungen auf Ihre Jobs minimiert werden. Wir empfehlen, dass Sie eine Ersatzinstanz pro UltraServer Instanz behalten. Es ist nicht erforderlich, Ersatz-Instances zu reservieren, jedoch kann dies die Support-Optionen einschränken und die Wiederherstellung nach einem Ausfall verlangsamen. Sie kaufen im UltraServers Ganzen, sodass die Anzahl der Ersatzteile, die Sie reservieren, keinen Einfluss auf die Preisgestaltung hat.
+ Um den Status und die Instanzen innerhalb einer zu sehen UltraServer, verwenden Sie den [ ListTrainingPlans](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ListTrainingPlans.html)API-Vorgang oder die AWS Konsole, um Trainingspläne aufzurufen. Mithilfe dieser Tools können Sie die Gesamtzahl der verfügbaren Instances, der aktuell verwendeten Instances, der fehlerhaften Instances, der Anzahl der konfigurierten Ersatzteile und andere Informationen einsehen. Mögliche Zustandsstatus sind `ok`, `impaired` und `insufficient-data`.

## SageMaker Suchverhalten von Trainingsplänen
<a name="training-plans-search-behavior"></a>

Bei der Suche nach einem Schulungsplanangebot verwenden SageMaker Schulungspläne den folgenden Ansatz, um die Ressourcenverfügbarkeit und Flexibilität für Benutzer zu maximieren, selbst wenn die Nachfrage hoch ist und reservierte Kapazitätsblöcke knapp sind:
+ **Anfängliche kontinuierliche Suche**: In SageMaker Trainingsplänen wird zunächst versucht, einen einzelnen, kontinuierlichen Block reservierter Kapazität zu finden, der der angegebenen Dauer innerhalb des Start- und Enddatums entspricht und gleichzeitig alle anderen angegebenen Kriterien erfüllt, einschließlich Zielressource, angeforderter Instanztyp und Anzahl der Instanzen.
+ **Suche mit zwei Blöcken**: SageMaker Trainingspläne geben kein Ergebnis „Keine Kapazität“ zurück, wenn ein einziger durchgehender Block mit reservierter Kapazität, der alle Kriterien erfüllt, nicht verfügbar ist. Stattdessen wird automatisch versucht, die Anfrage mithilfe von zwei separaten Blöcken mit reservierter Kapazität zu erfüllen, wobei die Gesamtdauer auf zwei Zeitsegmente aufgeteilt wird.

  Dieser Ansatz mit zwei Blöcken bietet mehr Flexibilität bei der Ressourcenzuweisung und schützt potenziell stark beanspruchte Instances, die andernfalls nicht verfügbar wären.

**Anmerkung**  
SageMaker Bei Schulungsplänen werden bis zu drei Angebote aus einem oder zwei Segmenten angezeigt. Bei einem Plan mit einer Dauer von 48 Stunden könnten SageMaker Trainingspläne beispielsweise einen Plan mit zwei 24-Stunden-Blöcken, einem zusammenhängenden 48-Stunden-Block und zwei Blöcken mit ungleichmäßiger Dauer anbieten.

## Überlegungen
<a name="training-plans-considerations"></a>

**Wichtig**  
Trainingspläne können nach dem Kauf nicht mehr geändert werden.
Schulungspläne können nicht von mehreren AWS Konten oder innerhalb Ihrer AWS Organisation gemeinsam genutzt werden.
+ Bei der Suche nach Schulungsplänen passt SageMaker Training Plans seine Suchstrategie an folgende Kriterien an[target resources](#training-plans-target-resources):

  **Für SageMaker HyperPod Cluster**:
  + Die Angebote sind auf eine einzige Availability Zone (AZ) beschränkt.
  + Dies gewährleistet eine konsistente Netzwerkleistung und Datenlokalität innerhalb des Clusters.

  **Für SageMaker Ausbildungsberufe**:
  + Angebote können sich über mehrere Availability Zones erstrecken. 
  + Dies ist besonders relevant, wenn das Planangebot mehrere diskontinuierliche reservierte Kapazitäten enthält.
  + Ein Plan könnte beispielsweise Kapazität in AZ-A für einen Block mit reservierter Kapazität und in AZ-B für einen anderen enthalten. SageMaker Mit Schulungsplänen können Workloads je nach Verfügbarkeit der Ressourcen automatisch zwischen Availability Zones (AZs) verschoben werden.

    Dieser Multi-AZ-Ansatz für Trainingsjobs bietet mehr Flexibilität bei der Ressourcenzuweisung und erhöht so die Chancen, geeignete Kapazitäten für Ihre Arbeitslast zu finden. Sie sollten sich jedoch darüber im Klaren sein, dass Ihre Jobs zu verschiedenen AZs Zeiten Ihres Reservierungszeitraums unterschiedlich ausgeführt werden können.
+ Bei einem Angebot mit zwei Blöcken sollten Benutzer sorgfältig abwägen, ob diese geteilte Zuweisung ihren Workload-Anforderungen entspricht. Dies kann eine Anpassung der Arbeitsplanung oder der Verteilung der Arbeitslast erfordern, um dem nicht kontinuierlichen Charakter der Reservierung Rechnung zu tragen.

# IAM für SageMaker Schulungspläne
<a name="training-plan-iam-permissions"></a>

SageMaker Für Schulungspläne sind spezielle Berechtigungen für zwei unterschiedliche Rollen erforderlich:

1. **Rolle „Planersteller**“: Benutzer, denen die Rolle „*Planersteller*“ zugewiesen wurde, benötigen Berechtigungen, um nach Schulungsplänen zu suchen, neue Schulungspläne zu erstellen und Trainingspläne aufzulisten und zu beschreiben.

1. **Rolle „Plan-Benutzer**“: Benutzer mit der Rolle „*Plan-Benutzer*“ benötigen Berechtigungen zur Verwendung von Trainingsplänen in SageMaker Schulungsaufträgen oder beim Erstellen und Aktualisieren von SageMaker HyperPod Clustern.

Bevor Sie SageMaker Trainingspläne verwenden, aktualisieren Sie die Berechtigungen je nach Ihrer Zugriffsmethode:
+ Für AWS-Managementkonsole unsere SageMaker SDKs Benutzer: Aktualisieren Sie die Berechtigungen der IAM-Rolle, die für den Konsolenbenutzer oder API-Benutzer konfiguriert ist.
+ Für AWS CLI Benutzer: Stellen Sie sicher, dass Ihr AWS CLI Profil mit den entsprechenden Anmeldeinformationen und Berechtigungen korrekt konfiguriert ist.
+ Legen Sie für Benutzer der Studio-Anwendung JupyterLab beispielsweise Berechtigungen für die Ausführungsrolle fest, die dem von der Anwendung belegten Speicherplatz zugeordnet ist.

Sie können diese Berechtigungen entweder mithilfe einer verwalteten Richtlinie oder einzelner detaillierterer Berechtigungen festlegen.

Informationen zum Aktualisieren der Berechtigungsrichtlinie für eine Rolle finden Sie unter [Aktualisieren von Berechtigungen für eine Rolle](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles_update-role-permissions.html). Informationen zum Suchen und Aktualisieren einer Ausführungsrolle finden Sie unter [Abrufen Ihrer Ausführungsrolle](sagemaker-roles.md#sagemaker-roles-get-execution-role).

**Anmerkung**  
Administratoren sollten sorgfältig abwägen, welche Benutzer in der Lage sein müssen, Schulungspläne zu erstellen und entsprechende Berechtigungen zuzuweisen.

## Verwaltete Richtlinien
<a name="training-plan-managed-policies"></a>
+ Für Planersteller: [https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerTrainingPlanCreateAccess.html](https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerTrainingPlanCreateAccess.html)Bietet Zugriff auf die Erstellung und Verwaltung von Trainingsplänen.
+ Für Nutzer von Tarifen: [https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerFullAccess.html](https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerFullAccess.html)Beinhaltet die Berechtigungen zur Nutzung von Trainingsplänen.

**Anmerkung**  
Die `AmazonSageMakerFullAccess` verwaltete Richtlinie ist als ease-of-use Richtlinie in erster Linie für Versuchszwecke konzipiert. Sie bietet zwar einen breiten Zugang zu SageMaker KI-Funktionen, einschließlich der Verwendung von Trainingsplänen, es ist jedoch wichtig, Folgendes zu beachten:  
Diese Richtlinie wird aufgrund ihrer umfassenden Zugriffsrechte nicht für Produktionsumgebungen empfohlen.
Sie beinhaltet keine Genehmigungen für die Erstellung von Schulungsplänen, da es sich um eine administrative Maßnahme `CreateTrainingPlan` handelt, für die eine Vorauszahlung erforderlich ist.
Für produktive Anwendungsfälle empfehlen wir dringend, benutzerdefinierte Richtlinien zu erstellen, die dem Prinzip der geringsten Rechte folgen und nur die spezifischen Berechtigungen gewähren, die für jede Rolle erforderlich sind.

## Individuelle Berechtigungen
<a name="training-plan-individual-permissions"></a>

In der folgenden Liste sind die detaillierten Berechtigungen aufgeführt, die in den IAM-Richtlinienerklärungen einer Rolle festgelegt werden sollten, basierend auf den spezifischen Aktionen, die ein Benutzer im Rahmen von SageMaker Trainingsplänen ausführen muss:

### Schulungspläne, Liste der Berechtigungen
<a name="training-plan-individual-permissions-list"></a>
+ `SearchTrainingPlanOfferings`: Mit dieser Berechtigung können Benutzer nach verfügbaren Schulungsplänen suchen.

  ```
  {
    "Sid": "SearchTrainingPlanOfferingsPermissions",
    "Effect": "Allow",
    "Action": [
      "sagemaker:SearchTrainingPlanOfferings"
    ],
    "Resource": "*"
  }
  ```
+ `CreateTrainingPlan`: Mit dieser Berechtigung können Benutzer neue Trainingspläne erstellen.
**Anmerkung**  
Sie müssen auch Berechtigungen für `CreateReservedCapacity` und angeben `training-plan` und `AddTags` beide sowie `reserved-capacity` Ressourcentypen angeben.

  ```
  {
    "Sid": "CreateTrainingPlanPermissions",
    "Effect": "Allow",
    "Action": [
      "sagemaker:CreateTrainingPlan",
      "sagemaker:CreateReservedCapacity",
      "sagemaker:AddTags"
    ],
    "Resource": [
      "arn:aws:sagemaker:*:*:training-plan/*",
      "arn:aws:sagemaker:*:*:reserved-capacity/*"
    ]
  }
  ```
+ `DescribeTrainingPlan`: Mit dieser Berechtigung können Benutzer Details zu bestehenden Trainingsplänen einsehen.

  ```
  {
    "Sid": "DescribeTrainingPlanPermissions",
    "Effect": "Allow",
    "Action": [
      "sagemaker:DescribeTrainingPlan"
    ],
    "Resource": [
      "arn:aws:sagemaker:::training-plan/*"
    ]
  }
  ```
+ `ListTrainingPlans`: Mit dieser Berechtigung können Benutzer alle Schulungspläne in ihrem AWS Konto auflisten.

  ```
  {
    "Sid": "ListTrainingPlansPermissions",
    "Effect": "Allow",
    "Action": [
      "sagemaker:ListTrainingPlans"
    ],
    "Resource": "*"
  }
  ```

### Individuelle Berechtigungen pro Benutzertyp
<a name="training-plan-permissions-per-user-type"></a>

Dieser Abschnitt enthält eine detaillierte Aufschlüsselung der einzelnen Berechtigungen, die für jede Rolle erforderlich sind, wie im [IAM für SageMaker Schulungspläne](#training-plan-iam-permissions) Abschnitt erwähnt. 

Für Planersteller sind die folgenden Berechtigungen erforderlich:
+ `sagemaker:SearchTrainingPlanOfferings`
+ `sagemaker:CreateTrainingPlan`
+ `sagemaker:CreateReservedCapacity`
+ `sagemaker:AddTags`
+ `sagemaker:DescribeTrainingPlan`
+ `sagemaker:ListTrainingPlans`

Planbenutzer benötigen die folgenden Berechtigungen:
+ `sagemaker:CreateTrainingJob`(für einen SageMaker Ausbildungsjob)
+ `sagemaker:CreateCluster`und `sagemaker:UpdateCluster` (für SageMaker HyperPod)
+ Zugriff auf die `reserved-capacity` Ressourcen `training-plan` und. Geben Sie bei der Konfiguration von IAM-Richtlinien für SageMaker Schulungspläne auch Berechtigungen für beide `training-plan` `reserved-capacity` Ressourcen an. Diese Ressourcen werden sowohl für SageMaker Schulungsjobs als auch für SageMaker HyperPod Cluster benötigt. Auf diese Weise können Ihre IAM-Rollen mit den Ressourcen der SageMaker Trainingspläne interagieren und reservierte Kapazitäten verwalten.
  + Stellen Sie bei SageMaker Schulungsaufträgen sicher, dass Ihre Richtlinie die `"arn:aws:sagemaker:::reserved-capacity/"` Ressourcen `"arn:aws:sagemaker:::training-plan/"` ARNs und enthält.

------
#### [ JSON ]

****  

```
{
  "Version":"2012-10-17",		 	 	 
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "sagemaker:CreateTrainingJob"
      ],
      "Resource": [
        "arn:aws:sagemaker:us-east-2:111122223333:training-job/",
        "arn:aws:sagemaker:us-east-2:111122223333:training-plan/",
        "arn:aws:sagemaker:us-east-2:111122223333:reserved-capacity/*"
      ]
    }
  ]
}
```

------

Ebenso sollten Sie bei SageMaker HyperPod Konfigurationen diese ARNs zusätzlich zu den clusterspezifischen Ressourcen einbeziehen.

------
#### [ JSON ]

****  

```
{
  "Version":"2012-10-17",		 	 	 
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "sagemaker:CreateCluster",
        "sagemaker:UpdateCluster"
      ],
      "Resource": [
        "arn:aws:sagemaker:us-east-2:111122223333:cluster/",
        "arn:aws:sagemaker:us-east-2:111122223333:training-plan/",
        "arn:aws:sagemaker:us-east-2:111122223333:reserved-capacity/*"
      ]
    }
  ]
}
```

------

# Erstellung von Trainingsplänen
<a name="training-plan-creation"></a>

Gehen Sie wie folgt vor, um Rechenkapazität mithilfe der Funktion „ SageMaker Trainingspläne“ zu reservieren:

1. **Identifizieren Sie Ihre Zielressource:** Stellen Sie zunächst fest, ob Sie Kapazität für SageMaker Schulungsjobs oder SageMaker HyperPod Cluster benötigen.

1. **Geben Sie Ihre Kapazitätsanforderungen an:** Definieren Sie Ihren Kapazitätsbedarf detailliert. Dazu gehören die Auswahl des geeigneten Instance-Typs für Ihren Workload, die Bestimmung der Anzahl der benötigten Instances und die Angabe der Nutzungsdauer. Informationen zu den unterstützten Instance-Typen in bestimmten Optionen AWS-Region, Dauer und Anzahl finden Sie unter[Unterstützte Instanztypen und Preise AWS-Regionen](reserve-capacity-with-training-plans.md#training-plans-supported-instances-and-regions).

1. **Suchen Sie nach verfügbaren Schulungsplänen:** Nachdem Sie Ihre Anforderungen angegeben haben, verwenden Sie die Suchfunktion für SageMaker Schulungspläne, um nach verfügbaren Schulungsplänen in einem oder mehreren Segmenten zu suchen. Jedes Angebot enthält Details wie Startzeit, spezifische Verfügbarkeitszone für reservierte Kapazität und Planpreis. Prüfen Sie diese Angebote und berücksichtigen Sie dabei Faktoren wie Kosteneffektivität, geografische Präferenzen und die Ausrichtung auf Ihre spezifischen Bedürfnisse.

   Wenn kein geeigneter Tarif verfügbar ist, passen Sie Ihre Suchkriterien an und suchen Sie nach neuen Angeboten.

1. **Erstellen Sie einen Schulungsplan auf der Grundlage eines geeigneten Angebots:** Nachdem Sie ein geeignetes Angebot identifiziert haben, fahren Sie mit der Erstellung Ihres Schulungsplans fort. Dieser Prozess beinhaltet die Auswahl des von Ihnen ausgewählten Angebots und die Initiierung der Reservierung.
   + Bei der Reservierung des Trainingsplans wird eine Rechnung erstellt.
   + Die Zahlung für den Gesamtbetrag wird im Rahmen des Erfüllungsprozesses eingezogen. Sobald die Zahlung abgeschlossen ist, ist der Plan bereit, um Ihre SageMaker Schulungsjobs zu planen oder HyperPod Cluster zu erstellen.

   Informationen darüber, wie Sie Schulungspläne für Ihre SageMaker Schulungsjobs verwenden können, finden Sie unter[Nutzung von Ausbildungsplänen für SageMaker Ausbildungsjobs](training-plan-utilization-for-training-jobs.md).

    Informationen zur Verwendung von Schulungsplänen für Ihre HyperPod Cluster finden Sie unter[Nutzung von Schulungsplänen für SageMaker HyperPod Amazon-Cluster](training-plan-utilization-for-hyperpod.md).

Sie können einen Trainingsplan entweder mit der SageMaker KI-Konsole oder mit programmatischen Methoden erstellen. Die SageMaker KI-Konsole bietet eine visuelle, grafische Oberfläche mit einem umfassenden Überblick über Ihre Optionen. Die programmatische Erstellung kann auch über die AWS CLI oder erfolgen, SageMaker SDKs um direkt mit der Trainingsplan-API zu interagieren.

Anweisungen für die step-by-step Konsole und detaillierte API-Referenzen finden Sie in den entsprechenden Abschnitten dieser Dokumentation.

**Topics**
+ [SageMaker Erstellung von Trainingsplänen mit der SageMaker KI-Konsole](training-plan-creation-using-console.md)
+ [SageMaker Erstellung von Trainingsplänen mithilfe der SageMaker API oder AWS CLI](training-plan-creation-using-api-cli-sdk.md)

# SageMaker Erstellung von Trainingsplänen mit der SageMaker KI-Konsole
<a name="training-plan-creation-using-console"></a>

SageMaker Trainingspläne bieten eine bequeme Möglichkeit, Trainingspläne über die Benutzeroberfläche der SageMaker KI-Konsole zu erstellen, sodass Benutzer ihre Schulungsressourcen für maschinelles Lernen einfach planen können. Dieser Leitfaden führt Sie durch den Prozess der Erstellung eines Schulungsplans für SageMaker Trainingsjobs und SageMaker HyperPod -cluster mithilfe der SageMaker KI-Konsole. Wenn Sie diese Schritte befolgen, suchen Sie nach Angeboten für Trainingspläne, überprüfen die verfügbaren Optionen und kaufen den Plan, der Ihren Bedürfnissen am besten entspricht.

So erstellen Sie mithilfe einer Benutzeroberfläche visuell einen Trainingsplan:

1. Navigieren Sie zunächst zur SageMaker KI-Konsole unter [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Wählen Sie im Menü im linken Fensterbereich die Option **Trainingspläne** aus.

1. Wähle dort im Hauptinhaltsbereich die Schaltfläche **Trainingsplan erstellen**, um mit der Erstellung deines individuellen Trainingsplans zu beginnen.

![\[SageMaker KI-Konsole, auf der die Seite mit den Trainingsplänen angezeigt wird. Auf der Benutzeroberfläche werden Informationen zur Funktionsweise von Trainingsplänen angezeigt, einschließlich der Schritte zum Anfordern, Überwachen und Verwenden eines Plans. Im linken Navigationsbereich wird die Option „Trainingspläne“ hervorgehoben, und im Hauptinhaltsbereich ist die Schaltfläche „Trainingsplan erstellen“ sichtbar.\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/images/training-plans/tp-console.png)


Suchen Sie als Nächstes nach Tarifen, die Ihren Rechenanforderungen entsprechen.

**Topics**
+ [Suchen Sie nach Angeboten für Schulungspläne](search-training-plan-offerings.md)
+ [Reservieren Sie sich den besten Trainingsplan](choose-best-training-plan.md)
+ [Auflisten von Trainingsplänen](list-training-plans.md)
+ [Details zum Trainingsplan anzeigen](training-plan-details.md)

# Suchen Sie nach Angeboten für Schulungspläne
<a name="search-training-plan-offerings"></a>

Nachdem Sie im linken Bereich der SageMaker KI-Konsole **Trainingspläne** und dann **Trainingsplan erstellen** ausgewählt haben, wird das Formular **Trainingsplan suchen** geöffnet. In diesem Formular können Sie Ihre Anforderungen angeben und nach geeigneten Schulungsplänen suchen.

Befolgen Sie diese Schritte, um das Formular auszufüllen.

1. Identifizieren Sie Ihr **Ziel**: Schulungspläne sind spezifisch für die jeweilige Zielressource. Geben Sie an, ob Sie einen Plan für die Ausführung von SageMaker Trainingsjobs oder SageMaker HyperPod Clustern verwenden möchten.

1. Als **Berechnungstyp** können Sie zwischen **Instanz** und wählen **UltraServer**. UltraServers verbinden mehrere Amazon EC2 EC2-Instances mithilfe einer Beschleuniger-Verbindung mit niedriger Latenz und hoher Bandbreite. Weitere Informationen finden Sie unter [Amazon EC2 UltraServers](https://aws.amazon.com/ec2/ultraservers/). Weitere Informationen zur Verwendung UltraServers mit SageMaker KI finden Sie unter. [UltraServers in SageMaker KI](reserve-capacity-with-training-plans.md#training-plans-ultraservers)

1. Wählen Sie Ihren bevorzugten **Instance-Typ** und die **Anzahl** der Instances: Informationen zu verfügbaren Instance-Typen mit bestimmten Optionen AWS-Region, Dauer und Anzahl finden Sie unter[Unterstützte Instanztypen und Preise AWS-Regionen](reserve-capacity-with-training-plans.md#training-plans-supported-instances-and-regions).

1. Definieren Sie Ihre Zeitparameter: Wählen Sie das gewünschte Start- und Enddatum und geben Sie in diesem Fenster die Dauer des Plans an.

1. Wähle „**Trainingspläne suchen**“.

![\[SageMaker AI-Konsole mit der Seite „Angebote für Schulungspläne suchen“. Auf der Benutzeroberfläche werden Optionen zur Auswahl der Zielressource für den Plan (Schulungsjob oder HyperPod Cluster), zur Angabe von Instanztyp und -anzahl, zur Festlegung von Start- und Enddaten sowie zur Eingabedauer angezeigt. Am unteren Rand des Formulars ist die Schaltfläche „Trainingspläne suchen“ sichtbar.\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/images/training-plans/tp-search-training-plan-offerings.png)


SageMaker In Schulungsplänen wird nach Angeboten gesucht, die Ihren Kapazitätsanforderungen entsprechen. Wenn innerhalb des von Ihnen angegebenen Zeitraums Treffer gefunden werden, werden sie unten auf der Seite angezeigt. Jedes Trainingsplan-Angebot umfasst die folgenden Details:
+ Gesamtdauer des Plans
+ Start- und Enddaten
+ Gesamtpreis im Voraus: 

  Bewegen Sie den Mauszeiger über den Preis, um eine detaillierte Aufschlüsselung des Instance-Stundensatzes, der Anzahl der Instances und der Gesamtstunden anzuzeigen
+ Gesamtzahl der Plansegmente

Wenn Sie auf den Link mit den Segmentdetails klicken, wird eine modale Ansicht mit segmentspezifischen Details geöffnet:
+ Dauer
+ Start- und Enddaten
+ Availability Zone

![\[SageMaker Die AI-Konsole zeigt die Seite „Angebote für Schulungspläne suchen“ mit Eingabefeldern für die Plananforderungen und den Abschnitt Verfügbare Pläne mit Details zu drei gefundenen Plänen mit unterschiedlichen Laufzeiten, Preisen und Verfügbarkeitsstatus an.\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/images/training-plans/tp-available-offerings.png)


Wenn keine geeigneten Pläne gefunden werden oder die verfügbaren Pläne nicht Ihren Anforderungen entsprechen, passen Sie Ihre Suchkriterien an, indem Sie die Parameter im Formular mit den Anforderungen für **Schulungspläne** ändern. Sobald Sie ein passendes Angebot gefunden haben, wählen Sie es aus und klicken Sie auf **Weiter**, um zur Seite mit der Tarifreservierung fortzufahren. Auf dieser Seite können Sie Ihrem Tarif einen Namen geben und dann Ihre Auswahl überprüfen und bestätigen, bevor Sie Ihre Reservierung abschließen.

**Anmerkung**  
Die markierten Tarife `Immediately available` beginnen innerhalb von 30 Minuten, sofern die Zahlung mindestens 5 Minuten vor der geplanten Startzeit erfolgt.

# Reservieren Sie sich den besten Trainingsplan
<a name="choose-best-training-plan"></a>

Bei der Suche nach einem Schulungsplan wurden Angebote gefunden, die Ihren Kapazitätsanforderungen und Ihrem Budget entsprechen. 

1. Geben Sie einen Namen für Ihren Plan ein und wählen Sie dann **Weiter** aus.

1. Überprüfen Sie Ihre Bestellung und **senden** Sie sie ab.
**Wichtig**  
Trainingspläne können nach dem Kauf nicht mehr geändert werden.
Schulungspläne können nicht zwischen AWS Konten oder innerhalb Ihrer AWS Organisation gemeinsam genutzt werden.

   Nach dem Absenden Ihrer Bestellung
   + Der Trainingsplan erscheint zunächst wie `Pending` in Ihrer Trainingsplanliste.
   + Nach Eingang der Bestellung wird automatisch eine Rechnung erstellt.
   + Die Gesamtzahlung wird während des Erfüllungsprozesses eingezogen.
   + Sobald die Zahlung erfolgreich verarbeitet wurde, ändert sich der Status des Plans in `Scheduled` und der Plan steht zur Nutzung zur Verfügung.

![\[SageMaker KI-Konsole, auf der die Seite „Prüfung und Kauf“ für einen Trainingsplan angezeigt wird. Auf der Seite werden Details zum Trainingsplan, Segmentinformationen, Preis, Name des Plans und Tags angezeigt. Es stehen Optionen zum Bearbeiten, Stornieren, Zurückgehen oder Erstellen des Plans zur Verfügung.\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/images/training-plans/tp-review-and-purchase-training-plan.png)


# Auflisten von Trainingsplänen
<a name="list-training-plans"></a>

Um deine Trainingspläne einzusehen:

1. Navigieren Sie zur SageMaker AI-Konsole unter [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Wählen Sie im Menü im linken Fensterbereich die Option **Trainingspläne** aus. Daraufhin wird eine Liste all Ihrer Trainingspläne mit Namen, Status, Zielressourcentyp und anderen wichtigen Details angezeigt.

   Nach dem Kauf eines Plans wirst du zu dieser Liste weitergeleitet. Neu erstellte Pläne werden mit einem `Pending` Status angezeigt, bis die Zahlung abgeschlossen ist. Der Status wird in der Regel innerhalb weniger Minuten nach der Zahlungsabwicklung aktualisiert.

![\[SageMaker Die KI-Konsole zeigt die Seite mit der Liste der Trainingspläne an. Die Seite enthält eine Tabelle mit den Trainingsplänen mit Details wie Name, Status, Gesamtzahl der Instances, Instances, Zone, Start- und Enddatum. Eine Schaltfläche zum Erstellen eines neuen Trainingsplans ist sichtbar.\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/images/training-plans/tp-list-training-plans.png)


# Details zum Trainingsplan anzeigen
<a name="training-plan-details"></a>

Folgen Sie in der Liste der Trainingspläne dem Namen eines Plans, um dessen Details anzuzeigen. Insbesondere kannst du deine aktuelle Kapazitätsnutzung überprüfen und deine Workloads auf der Detailseite deines Plans auflisten. 

Die Detailseite zeigt:
+ Die Übersicht über den Trainingsplan: Status, Ziel, Instance-Typ und Dauer.
+ Erweiterbare Abschnitte für Segmentdetails, Preise, Namen des Plans und Tags.
+ Kapazitätsnutzung:
  + Insgesamt: Die Gesamtzahl der reservierten Instances in diesem Trainingsplan.
  + In Verwendung: Die Anzahl der derzeit im Rahmen dieses Schulungsplans verwendeten Instances.
  + Verfügbare Instances: Die Anzahl der Instances, die derzeit für die Verwendung in diesem Trainingsplan verfügbar sind.

Unten auf der Seite finden Sie einen Link, über den Sie je nach Zielressource entweder die Trainingsjobs oder die Liste der SageMaker HyperPod Cluster-Instanzgruppen, die diesem Plan zugeordnet sind, einsehen können. 

![\[SageMaker KI-Konsolenseite mit Details zu einem Trainingsplan. Auf der Seite werden grundlegende Planinformationen, Status und Instance-Details angezeigt. Weitere Informationen finden Sie weiter unten. Im unteren Bereich werden in einem Abschnitt zur Kapazitätsauslastung die Gesamtzahl, die verwendeten und die verfügbaren Instances für den Plan angezeigt.\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/images/training-plans/tp-view-training-plan.png)


# SageMaker Erstellung von Trainingsplänen mithilfe der SageMaker API oder AWS CLI
<a name="training-plan-creation-using-api-cli-sdk"></a>

SageMaker Schulungspläne unterstützen die programmatische Erstellung von Trainingsplänen über ihre API. Sie können mit der Trainingsplan-API interagieren, indem Sie das AWS CLI oder SageMaker SDKs verwenden.

SageMaker Die API-Aktionen von Trainingsplänen bieten einen umfassenden Workflow für die programmgesteuerte Verwaltung von Trainingsplänen:
+ **`SearchTrainingPlanOfferings`:** Ermöglicht Benutzern, verfügbare Rechenressourcen abzufragen und zu ermitteln, indem Parameter wie Instance-Typ, Anzahl und gewünschtes Zeitfenster angegeben werden. Die API gibt eine Rangliste von Schulungsplänen zurück, die den Anforderungen des Benutzers am besten entsprechen.
+ **`CreateTrainingPlan`:** Ermöglicht die Reservierung eines bestimmten Schulungsplans und wandelt eine potenzielle Rechenkapazität in geplante reservierte Kapazitäten mit einem eindeutigen Schulungsplan-ARN um.
+ **`ListTrainingPlans`:** Bietet eine Methode zum Abrufen und Überprüfen aller vorhandenen Schulungspläne in einem AWS Benutzerkonto mit optionalen Filter- und Sortierfunktionen.
+ **`DescribeTrainingPlan`:** Bietet detaillierte Einblicke in einen bestimmten Schulungsplan, einschließlich seiner Lebensphasen von `Pending` bis `Active` bis`Expired`.
+ **`ExtendTrainingPlan`:** Erweitert einen bestehenden Schulungsplan durch den Kauf eines Erweiterungsangebots. Weitere Informationen finden Sie unter [Erweiterung der Trainingspläne](training-plan-extension.md).
+ **`DescribeTrainingPlanExtensionHistory`:** Ruft den Verlängerungsverlauf für einen Schulungsplan ab. Weitere Informationen finden Sie unter [Erweiterung der Trainingspläne](training-plan-extension.md).

**Topics**
+ [Suchen Sie nach Angeboten für Schulungspläne](search-training-plan-offerings-api-cli-sdk.md)
+ [Reservieren Sie sich den besten Trainingsplan](choose-best-training-plan-using-api-cli-sdk.md)
+ [Auflisten von Trainingsplänen](list-training-plans-using-api-cli-sdk.md)
+ [Details zum Trainingsplan anzeigen](training-plan-details-using-api-cli-sdk.md)

# Suchen Sie nach Angeboten für Schulungspläne
<a name="search-training-plan-offerings-api-cli-sdk"></a>

Um einen Schulungsplan zu erstellen, rufen Sie zunächst den [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html)API-Vorgang auf und übergeben Sie Ihre Plananforderungen (wie Instance-Typ, Anzahl und gewünschtes Zeitfenster) als Eingabeparameter. Trainingspläne sind spezifisch für die jeweilige Zielressource. Stellen Sie sicher, dass Sie angeben, für welche Zielressource der Plan verwendet werden soll (`training-job`oder`hyperpod-cluster`). Die API gibt eine Liste der verfügbaren Angebote zurück, die Ihren Anforderungen entsprechen. Wenn keine geeigneten Angebote gefunden werden, müssen Sie möglicherweise Ihre Anforderungen anpassen und erneut suchen.

Dieser API-Aufruf ruft die Schulungsplan-Angebote ab, die Ihren Kapazitätsanforderungen am besten entsprechen. Jedes in der Antwort [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TrainingPlanOffering.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TrainingPlanOffering.html)zurückgegebene Objekt wird durch eine eindeutige Angebots-ID identifiziert. Das erste Angebot in der Liste entspricht Ihren Anforderungen am besten. Wenn innerhalb der von Ihnen angegebenen Daten kein geeigneter Trainingsplan verfügbar ist, ist die Liste leer. Passen Sie Ihre Suchkriterien an und suchen Sie nach neuen Angeboten.
+ Die Reservierungsdauer ist in Schritten von 1 Tag bis 182 Tagen verfügbar.
+ Optionen für die Anzahl der Reservierungs-Instances: 1, 2, 4, 8, 16, 32 oder 64 Instances

Informationen zur Liste der verfügbaren Instanzen, die von SageMaker Trainingsplänen unterstützt werden, finden Sie unter[Unterstützte Instanztypen und Preise AWS-Regionen](reserve-capacity-with-training-plans.md#training-plans-supported-instances-and-regions).

Im folgenden Beispiel wird ein AWS CLI Befehl verwendet, um Trainingsplanangebote mit einem bestimmten Instanztyp, einer bestimmten Anzahl und Zeitinformationen anzufordern.

```
# List training plan offerings with instance type, instance count, duration in hours, start time after, and end time before.
aws sagemaker search-training-plan-offerings \
--target-resources "training-job" \
--instance-type "ml.p4d.24xlarge" \
--instance-count 1 \
--duration-hours 15 \
--start-time-after "1737484800"
--end-time-before "1737657600"
```

Dieses JSON-Dokument ist eine Beispielantwort aus der SageMaker Trainingsplan-API. Die Antwort enthält Informationen zu mehreren verfügbaren Schulungsplänen, die den angegebenen Kapazitätsanforderungen entsprechen. Es umfasst drei unterschiedliche Angebote mit unterschiedlichen Laufzeiten, Vorabgebühren und start/end Zeiten, die alle denselben Instanztyp verwenden und auf Schulungsjobs abzielen.

```
{
    "TrainingPlanOfferings": [
        {
            "TrainingPlanOfferingId": "tpo-SHA-256-hash-value",
            "TargetResources": [
                "training-job"
            ],
            "RequestedStartTimeAfter": "2025-01-21T11:08:27.704000-08:00",
            "DurationHours": 15,
            "DurationMinutes": 51,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD",
            "ReservedCapacityOfferings": [
                {
                    "InstanceType": "ml.p4d.24xlarge",
                    "InstanceCount": 1,
                    "AvailabilityZone": "us-west-2a",
                    "DurationHours": 15,
                    "DurationMinutes": 51,
                    "StartTime": "2025-01-21T11:39:00-08:00",
                    "EndTime": "2025-01-22T03:30:00-08:00"
                }
            ]
        },
        {
            "TrainingPlanOfferingId": "tpo-SHA-256-hash-value",
            "TargetResources": [
                "training-job"
            ],
            "RequestedStartTimeAfter": "2025-01-21T11:08:27.704000-08:00",
            "DurationHours": 39,
            "DurationMinutes": 51,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD",
            "ReservedCapacityOfferings": [
                {
                    "InstanceType": "ml.p4d.24xlarge",
                    "InstanceCount": 1,
                    "AvailabilityZone": "us-west-2a",
                    "DurationHours": 39,
                    "DurationMinutes": 51,
                    "StartTime": "2025-01-21T11:39:00-08:00",
                    "EndTime": "2025-01-23T03:30:00-08:00"
                }
            ]
        },
        {
            "TrainingPlanOfferingId": "tpo-SHA-256-hash-value",
            "TargetResources": [
                "training-job"
            ],
            "RequestedStartTimeAfter": "2025-01-21T11:08:27.704000-08:00",
            "DurationHours": 24,
            "DurationMinutes": 0,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD",
            "ReservedCapacityOfferings": [
                {
                    "InstanceType": "ml.p4d.24xlarge",
                    "InstanceCount": 1,
                    "AvailabilityZone": "us-west-2a",
                    "DurationHours": 24,
                    "DurationMinutes": 0,
                    "StartTime": "2025-01-22T03:30:00-08:00",
                    "EndTime": "2025-01-23T03:30:00-08:00"
                }
            ]
        }
    ]
}
```

Im Folgenden finden Sie einen Beispielbefehl, mit dem Sie nach AWS CLI Schulungsplänen suchen können, die Folgendes beinhalten: UltraServers

```
aws sagemaker search-training-plan-offerings \
--ultra-server-type ml.c6i-32xlargesc \
--ultra-server-count 1 \
--duration-hours 24 \
--target-resources hyperpod-cluster
--start-time-after "1737484800" \
--end-time-before "1737657600"
```

```
{
    "TrainingPlanOfferings": [
        {
            "TrainingPlanOfferingId": "tpo-SHA-256-hash-value",
            "TargetResources": [
                "training-job"
            ],
            "RequestedStartTimeAfter": "2025-07-21T16:59:25.760000+00:00",
            "DurationHours": 24,
            "DurationMinutes": 0,
            "UpfrontFee": "0.24",
            "CurrencyCode": "USD",
            "ReservedCapacityOfferings": [
                {
                    "ReservedCapacityType": "UltraServer",
                    "UltraServerType": "ml.u-p6e-gb200x72",
                    "UltraServerCount": 1,
                    "InstanceType": "ml.p6e-gb200.36xlarge",
                    "InstanceCount": 18,
                    "AvailabilityZone": "us-east-2a",
                    "DurationHours": 24,
                    "DurationMinutes": 0,
                    "StartTime": "2025-07-22T11:30:00+00:00",
                    "EndTime": "2025-07-23T11:30:00+00:00"
                }
            ]
        }
    ]
}
```

In den folgenden Abschnitten werden die obligatorischen und optionalen Eingabeanforderungsparameter für den `SearchTrainingPlanOfferings`-API-Vorgang definiert.

## Erforderliche Parameter
<a name="search-training-plan-options-required-params"></a>

Wenn Sie die [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html)API aufrufen, um Trainingsplanangebote aufzulisten, die Ihren Anforderungen entsprechen, müssen Sie die folgenden Werte angeben:
+ `TargetResources`: Die Zielressourcen (`training-job`oder`hyperpod-cluster`), für die der Plan verwendet werden soll. Der Standardwert ist `training-job`. Trainingspläne sind spezifisch für die jeweilige Zielressource.
  + Ein für SageMaker Schulungsjobs entwickelter Schulungsplan kann nur zur Planung und Durchführung von Schulungsjobs verwendet werden.
  + Ein Trainingsplan für HyperPod Cluster kann ausschließlich zur Bereitstellung von Rechenressourcen für die Instanzgruppe eines Clusters verwendet werden.
+ `InstanceType`: Der Typ der Instance, die bereitgestellt werden soll. Der `InstanceType` muss von einem unterstützten Typ sein. 

  Informationen zur Liste der verfügbaren Instanzen, die von SageMaker Trainingsplänen unterstützt werden, finden Sie unter[Unterstützte Instanztypen und Preise AWS-Regionen](reserve-capacity-with-training-plans.md#training-plans-supported-instances-and-regions).
+ `InstanceCount`: Die Anzahl der bereitzustellenden Instances. Wenn die Anzahl der Instances größer als 1 ist, sollte es sich um eine Potenz von 2 handeln.
+ `DurationHour`: Die Gesamtdauer Ihres angeforderten Plans in Stunden. Der `DurationHour` wird auf das nächste Vielfache von 24 aufgerundet.

## Optionale Parameter
<a name="search-training-plan-options-optional-params"></a>

Die folgenden Abschnitte enthalten Einzelheiten zu einigen optionalen Parametern, die Sie an Ihre `SearchTrainingPlanOfferings`-API-Anfrage übergeben können.
+ `StartTimeAfter`: Geben Sie die angeforderte Startzeit des Plans an. Das `StartTimeAfter` sollte in future ein `timestamp` oder ein `ISO 8601 date/time` Wert sein.
+ `EndTimeBefore`: Geben Sie die angeforderte Endzeit des Plans in einem `timestamp` oder einem `ISO 8601 date/time` Format an. Das `EndTimeBefore` sollte mindestens 24 Stunden nach der Startzeit sein.
+ `UltraServerType`: Geben Sie den Typ an UltraServer , nach dem gesucht werden soll. Weitere Informationen zu finden UltraServers Sie unter[UltraServers in SageMaker KI](reserve-capacity-with-training-plans.md#training-plans-ultraservers).
+ `UltraServerCount`: Geben Sie die Nummer an UltraServers , nach der gesucht werden soll.

# Reservieren Sie sich den besten Trainingsplan
<a name="choose-best-training-plan-using-api-cli-sdk"></a>

Nachdem Sie die verfügbaren Schulungspläne geprüft haben, die Ihren Anforderungen am besten entsprechen, können Sie einen bestimmten Plan reservieren, indem Sie den [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html)API-Betrieb anrufen. Bei der Erstellung wechselt der Plan zunächst in einen `Pending` Status und bleibt dort, bis der Reservierungsvorgang abgeschlossen ist. Die Antwort auf den API-Aufruf gibt einen Amazon-Ressourcennamen (ARN) zurück. Notieren Sie sich diesen ARN zu späteren Nachverfolgungs- und Überwachungszwecken. Die Reservierung des Trainingsplans erfolgt asynchron im Backend. Die Zahlung für den Gesamtbetrag wird im Rahmen des Fulfillment-Prozesses automatisch eingezogen. Sobald der Zahlungsvorgang abgeschlossen und die angeforderten reservierten Kapazitäten gesichert sind, ist der Schulungsplan auf den `Scheduled` neuesten Stand gebracht und kann geplant werden.

**Wichtig**  
Trainingspläne können nach dem Kauf nicht mehr geändert werden.
Schulungspläne können nicht zwischen AWS Konten oder innerhalb Ihrer AWS Organisation geteilt werden.

Im folgenden Beispiel wird der AWS CLI Befehl an verwendet, um einen bestimmten Trainingsplan anzufordern, wobei die Plan-ID als Parameter übergeben wird.

```
aws sagemaker create-training-plan \
--training-plan-offering-id "tpo-SHA-256-hash-value" \
--training-plan-name "name" \
```

Dieses JSON-Dokument ist eine Beispielantwort aus der SageMaker Trainingsplan-API. Die Antwort enthält den Amazon-Ressourcennamen (ARN) des erfolgreich erstellten Trainingsplans.

**Anmerkung**  
Der Schulungsplan behält seinen `Pending` Status so lange bei, bis der Erfüllungsprozess abgeschlossen ist.

```
{
   "TrainingPlanArn":"arn:aws:sagemaker:us-east-1:123456789123:training-plan/large-models-fine-tuning"
}
```

In den folgenden Abschnitten werden die obligatorischen und optionalen Eingabeanforderungsparameter für den [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html)-API-Vorgang definiert.

## Erforderliche Parameter
<a name="choose-best-training-plan-using-api-cli-sdk-required-params"></a>

Wenn Sie die [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html)API aufrufen, um einen bestimmten Trainingsplan zu reservieren, müssen Sie die folgenden Werte angeben:
+ `TrainingPlanOfferingId`: Die ID des Plans, den Sie wählen. Sie können die ID eines Planangebots als Antwort auf Ihren `SearchTrainingPlanOfferings` API-Aufruf abrufen. Das Format sollte mit beginnen`pto-*`.
+ `TrainingPlanName`: Der Name des Plans, den Sie erstellen. 

# Auflisten von Trainingsplänen
<a name="list-training-plans-using-api-cli-sdk"></a>

Du kannst alle Trainingspläne auflisten, die in deinem AWS Konto und deiner Region erstellt wurden, indem du die [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ListTrainingPlans.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ListTrainingPlans.html)API aufrufst.

Im folgenden Beispiel wird ein AWS CLI Befehl verwendet, um die Liste Ihrer Trainingspläne abzurufen.

```
aws sagemaker list-training-plans \
--start-time-after "2024-09-26T00:00:01.000Z"
```

Dieses JSON-Dokument ist eine Beispielantwort aus der SageMaker Trainingsplan-API. Die Antwort enthält Einzelheiten zu einem Trainingsplan, der erfolgreich erstellt und reserviert wurde.

```
{
   "[TrainingPlanSummaries](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TrainingPlanSummary.html)": [ 
      { 
         "AvailableInstanceCount": 2,
         "CurrencyCode": "USD",
         "DurationHours": 48,
         "DurationMinutes": 0,
         "EndTime": "2024-09-28T04:30:00-07:00",
         "InUseInstanceCount": 2,
         "[ReservedCapacitySummaries](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ReservedCapacitySummary.html)": [ 
            { 
               "AvailabilityZone": "string",
               "DurationHours": 48,
               "DurationMinutes": 0,
               "EndTime": "2024-09-28T04:30:00-07:00",
               "InstanceType": "ml.p5.48xlarge",
               "ReservedCapacityArn": "arn:aws:sagemaker:us-east-1:123456789123:reserved-capacity/large-models-fine-tuning-rc1",
               "StartTime": "2024-09-26T04:30:00-07:00",
               "Status": "Scheduled",
               "TotalInstanceCount": 4,
               "UltraServerCount": 4,
               "UltraServerType": "ml.p6e-gb200.36xlarge"
            }
         ],
         "StartTime": "2024-09-26T04:30:00-07:00",
         "Status": "Scheduled",
         "StatusMessage": "Payment confirmed, training plan scheduled."
         "TargetResources": [ "training-job" ],
         "TotalInstanceCount": 4,
         "TotalUltraServerCount": 4,
         "TrainingPlanArn": "arn:aws:sagemaker:us-east-1:123456789123:training-plan/large-models-fine-tuning",
         "TrainingPlanName": "large-models-fine-tuning",
         "UpfrontFee": "xxxx.xx"
      }
   ]
}
```

Die folgenden Abschnitte enthalten Einzelheiten zu einigen optionalen Parametern, die Sie an Ihre `ListTrainingPlans`-API-Anfrage übergeben können.

## Optionale Parameter
<a name="list-training-plans-optional-params"></a>

Die folgenden Abschnitte enthalten Einzelheiten zu einigen optionalen Parametern, die Sie an Ihre `ListTrainingPlans`-API-Anfrage übergeben können.
+ `StartTimeAfter`: Die Startzeit des aktuellen Zeitraums der aufgelisteten Pläne, angegeben als ein `timestamp` oder eine `ISO 8601 date/time`. 
+ `StartTimeBefore`: Die Endzeit des aktuellen Zeitbereichs der aufgelisteten Pläne, angegeben als a `timestamp` oder `ISO 8601 date/time` a. 
+ `Filters`: Kriterien, die zum Filtern der Ergebnisse verwendet werden, mit bis zu 5 Name-Wert-Paaren, wobei „Name“ der Name eines Felds von a [TrainingPlanSummary](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TrainingPlanSummary.html)und „Wert“ der Wert ist, der für den Filter berücksichtigt werden soll. Zum Beispiel `Name=Status,Value=Active`.

Im folgenden Beispiel wird ein AWS CLI Befehl verwendet, um Ihre Liste mit Trainingsplänen abzurufen. Dabei werden einige der oben beschriebenen optionalen Parameter verwendet.

```
aws sagemaker list-training-plans --max-results 10 --sort-by StartTime --sort-order Descending --start-time-after 13000000 --filters Name=Status,Value=Active
```

# Details zum Trainingsplan anzeigen
<a name="training-plan-details-using-api-cli-sdk"></a>

Um den Status eines Trainingsplans zu überwachen oder Details abzurufen, können Sie die [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlan.html)API verwenden. Die API-Antwort enthält ein `Status` Feld, das den aktuellen Status des Trainingsplans widerspiegelt:
+ Wenn der Kauf des Plans fehlschlägt, wird der Status auf gesetzt`Failed`.
+ Bei erfolgreicher Zahlung wechselt der Status je `Pending` nach `Scheduled` Startdatum des Plans von zu. 
+ Wenn der Plan sein Startdatum erreicht, ändert sich der Status in`Active`.
+ Bei Plänen mit mehreren diskontinuierlichen reservierten Kapazitäten wird der Status bis zum Startdatum der nächsten reservierten Kapazität auf „`Scheduled`Zwischen aktiven Perioden“ zurückgesetzt. 
+ Nach dem Enddatum des Plans wechselt der Status zu `Expired`.

Sobald der Status lautet`Scheduled`, können Sie die im Plan reservierte Kapazität für Ihre SageMaker Trainingsjobs oder HyperPod Cluster-Workloads nutzen.

**Anmerkung**  
Die mit dem Plan verbundenen Trainingsjobs behalten ihren Status `Pending`, bis der Plan den Status `Active` erreicht. 
Bei HyperPod Clustern, die einen Trainingsplan für Rechenkapazität verwenden, wird der Status der Instanzgruppe als `InService` einmal erstellt angezeigt. 

Im folgenden Beispiel wird ein AWS CLI Befehl verwendet, um die Details eines Trainingsplans anhand seines Namens abzurufen.

```
aws sagemaker describe-training-plan \
--training-plan-name "name"
```

Dieses JSON-Dokument ist eine Beispielantwort aus der SageMaker Trainingsplan-API. Diese Antwort enthält Details zu einem Trainingsplan, der erfolgreich erstellt wurde.

```
      { 
         "AvailableInstanceCount": 2,
         "CurrencyCode": "USD",
         "DurationHours": 48,
         "DurationMinutes": 0,
         "EndTime": "2024-09-28T04:30:00-07:00",
         "InUseInstanceCount": 2,
         "[ReservedCapacitySummaries](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ReservedCapacitySummary.html)": [ 
            { 
               "AvailabilityZone": "string",
               "DurationHours": 48,
               "DurationMinutes": 0,
               "EndTime": "2024-09-28T04:30:00-07:00",
               "InstanceType": "ml.p5.48xlarge",
               "ReservedCapacityArn": "arn:aws:sagemaker:us-east-1:123456789123:reserved-capacity/large-models-fine-tuning-rc1",
               "StartTime": "2024-09-26T04:30:00-07:00",
               "Status": "Scheduled",
               "TotalInstanceCount": 4,
               "UltraServerCount": 4,
               "UltraServerType": "ml.p6e-gb200.36xlarge"
            }
         ],
         "StartTime": "2024-09-26T04:30:00-07:00",
         "Status": "Scheduled",
         "StatusMessage": "Payment confirmed, training plan scheduled."
         "TargetResources": [ "training-job" ],
         "TotalInstanceCount": 4,
         "TotalUltraServerCount": 4,
         "TrainingPlanArn": "arn:aws:sagemaker:us-east-1:123456789123:training-plan/large-models-fine-tuning",
         "TrainingPlanName": "large-models-fine-tuning",
         "UpfrontFee": "xxxx.xx"
      }
```

In den folgenden Abschnitten wird der obligatorische Eingabeanforderungsparameter für den `DescribeTrainingPlan` API-Vorgang definiert.

## Erforderliche Parameter
<a name="training-plan-details-required-params"></a>
+ `TrainingPlanName`: Der Name des Trainingsplans, den Sie beschreiben möchten.

# Erweiterung der Trainingspläne
<a name="training-plan-extension"></a>

SageMaker Mit Schulungsplänen können Sie Ihre bestehenden Schulungspläne erweitern, um Unterbrechungen der Arbeitsbelastung zu vermeiden. Wenn sich ein Trainingsplan dem Ablauf nähert, können Sie ihn direkt über die SageMaker KI-Konsole oder programmgesteuert mithilfe der API oder verlängern. AWS CLI Dadurch entfällt die Notwendigkeit, einen neuen Plan zu erstellen und Ihre Arbeitslast mit einem neuen Trainingsplan ARN neu zu konfigurieren.

Mit den Erweiterungen des Trainingsplans funktionieren Ihre laufenden SageMaker Trainingsjobs oder SageMaker HyperPod Cluster weiterhin reibungslos und ohne Unterbrechung, sobald der Plan verlängert wurde. Der erweiterte Plan spiegelt das neue Enddatum wider, und Sie können den Verlauf aller Verlängerungen für Ihren Trainingsplan abrufen.

**Wichtig**  
Bitte beachte, dass Verlängerungen nicht storniert oder geändert werden können, um Instanzen hinzuzufügen oder zu entfernen.

## Schlüssel-Features
<a name="training-plan-extension-features"></a>
+ Erweitern Sie Ihre Trainingspläne über die Konsole oder die API
+ Verlängern Sie die Tarife in Schritten von einem Tag auf bis zu 14 Tage oder in Schritten von 7 Tagen auf bis zu 182 Tage
+ Verlängern Sie einen Plan beliebig oft
+ Den Verlauf der Erweiterungen für deine Trainingspläne in der Konsole oder über die API anzeigen/auflisten
+ Nahtlose Fortsetzung der Ausführung von Workloads in SageMaker KI ohne Neukonfiguration

## Voraussetzungen
<a name="training-plan-extension-prerequisites"></a>

Bevor Sie einen Schulungsplan verlängern, stellen Sie Folgendes sicher:
+ Der Schulungsplan muss den Status `Active` oder haben`Scheduled`.
+ Der `Payment Pending` Status des Plans darf keine Verlängerungen aufweisen.
+ Verlängerungen können bis zu mindestens 1 Stunde oder maximal 56 Tage vor Ablauf des Plans beantragt werden.

**Topics**
+ [Schlüssel-Features](#training-plan-extension-features)
+ [Voraussetzungen](#training-plan-extension-prerequisites)
+ [Verlängern Sie einen Trainingsplan mithilfe der SageMaker KI-Konsole](training-plan-extension-using-console.md)
+ [Verlängern Sie einen Schulungsplan mithilfe der SageMaker API oder AWS CLI](training-plan-extension-using-api-cli-sdk.md)

# Verlängern Sie einen Trainingsplan mithilfe der SageMaker KI-Konsole
<a name="training-plan-extension-using-console"></a>

SageMaker Trainingspläne bieten eine bequeme Möglichkeit, Ihre bestehenden Trainingspläne über die Benutzeroberfläche der SageMaker KI-Konsole zu erweitern. Dieser Leitfaden führt dich durch den Prozess der Erweiterung eines Trainingsplans für SageMaker Trainingsjobs und SageMaker HyperPod -cluster mithilfe der SageMaker KI-Konsole.

So verlängern Sie einen Trainingsplan mithilfe der Konsole:

1. Navigieren Sie zur SageMaker AI-Konsole unter [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Wählen Sie im linken Navigationsbereich **Trainingspläne** aus.

1. Wählen Sie den Trainingsplan, den Sie erweitern möchten, aus der Liste aus.

1. Wählen Sie die Schaltfläche „**Verlängern**“.

1. Geben Sie das gewünschte Enddatum für Ihre Verlängerung ein und wählen Sie **Suchen, um nach** verfügbaren Erweiterungsangeboten zu suchen.

1. Sehen Sie sich die Liste der Verlängerungsangebote an, die Details wie Dauer, Verfügbarkeitszone, Vorauszahlung sowie Start- und Endzeiten enthält.

1. Wählen Sie das Verlängerungsangebot aus, das Ihren Anforderungen am besten entspricht.

1. Überprüfen Sie die Erweiterungsdetails im Bestätigungsdialogfeld und klicken Sie dann auf **Absenden**, um Ihren Kauf zu bestätigen.

Nach dem Kauf der Verlängerung wird das Enddatum des Schulungsplans aktualisiert, um der neuen Verlängerungsdauer Rechnung zu tragen.

## Verlauf der Verlängerung anzeigen
<a name="training-plan-extension-history-console"></a>

Um den Verlauf der Verlängerungen für einen Schulungsplan einzusehen:

1. Navigiere in der SageMaker AI-Konsole zur Seite „**Trainingspläne**“.

1. Wählen Sie den Trainingsplan aus, den Sie sich ansehen möchten.

1. Auf der Seite mit den Details zum Trainingsplan findest du im Abschnitt **Erweiterungen** alle vergangenen Verlängerungen, einschließlich der ID des Erweiterungsangebots, Start- und Enddatum, Status und Zeitpunkt der Erstellung der Verlängerung.

## Werte für den Erweiterungsstatus
<a name="training-plan-extension-status-values-console"></a>

Erweiterungen können die folgenden Statuswerte haben:
+ `Pending`: Die Verlängerung wurde angefordert und wartet auf die Zahlungsabwicklung.
+ `Active`: Die Erweiterung wurde erfolgreich gekauft und ist aktiv.
+ `Scheduled`: Die Verlängerung soll zu einem future Zeitpunkt beginnen.
+ `Failed`: Der Kauf der Erweiterung ist fehlgeschlagen (z. B. aufgrund von Zahlungsproblemen).
+ `Expired`: Der Verlängerungszeitraum ist abgelaufen.

# Verlängern Sie einen Schulungsplan mithilfe der SageMaker API oder AWS CLI
<a name="training-plan-extension-using-api-cli-sdk"></a>

SageMaker Trainingspläne unterstützen die programmatische Erweiterung von Trainingsplänen über ihre API. Du kannst mit der Trainingsplan-API interagieren, indem du das AWS CLI oder verwendest. SageMaker SDKs

Die Erweiterung des Trainingsplans umfasst die folgenden API-Aktionen:
+ **`SearchTrainingPlanOfferings`:** Suchen Sie nach verfügbaren Verlängerungsangeboten, indem Sie den ARN Ihres Schulungsplans und die gewünschte Verlängerungsdauer angeben. Die API gibt Erweiterungsangebote im `TrainingPlanExtensionOfferings` Feld zurück.
+ **`ExtendTrainingPlan`:** Erwerben Sie ein spezielles Erweiterungsangebot, um Ihren Schulungsplan zu erweitern, indem Sie die bereitstellen`TrainingPlanExtensionOfferingId`. Dadurch wird die zusätzliche Rechenkapazität reserviert und das Enddatum Ihres Trainingsplans aktualisiert.
+ **`DescribeTrainingPlanExtensionHistory`:** Sieh dir den kompletten Verlängerungshistorie für einen Trainingsplan an, einschließlich aller vergangenen Verlängerungen mit deren Status, Datum und Zahlungsinformationen.

**Topics**
+ [Suchen Sie nach Erweiterungsangeboten](search-extension-offerings-api-cli-sdk.md)
+ [Erwerben Sie eine Verlängerung](extend-training-plan-api-cli-sdk.md)
+ [Verlauf der Erweiterungen anzeigen](describe-extension-history-api-cli-sdk.md)

# Suchen Sie nach Erweiterungsangeboten
<a name="search-extension-offerings-api-cli-sdk"></a>

Verwenden Sie die [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html)API mit dem `TrainingPlanArn` Parameter, um verfügbare Erweiterungsangebote für Ihren Schulungsplan zu finden.

Im folgenden Beispiel wird ein AWS CLI Befehl verwendet, um nach Erweiterungsangeboten für einen vorhandenen Schulungsplan zu suchen.

```
aws sagemaker search-training-plan-offerings \
--training-plan-arn "arn:aws:sagemaker:us-east-2:123456789012:training-plan/my-training-plan" \
--duration-hours 48
```

Dieses JSON-Dokument ist eine Beispielantwort aus der SageMaker Trainingsplan-API. Die Antwort `TrainingPlanExtensionOfferings` enthält auch verfügbare Erweiterungsangebote für den angegebenen Trainingsplan.

```
{
    "TrainingPlanOfferings": [],
    "TrainingPlanExtensionOfferings": [
        {
            "TrainingPlanExtensionOfferingId": "tpeo-SHA-256-hash-value",
            "AvailabilityZone": "us-east-2a",
            "StartDate": "2025-09-23T12:00:00Z",
            "EndDate": "2025-09-25T12:00:00Z",
            "DurationHours": 48,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD"
        }
    ]
}
```

In den folgenden Abschnitten werden die obligatorischen und optionalen Eingabeanforderungsparameter für den `SearchTrainingPlanOfferings` API-Vorgang bei der Suche nach Erweiterungsangeboten definiert.

## Erforderliche Parameter
<a name="search-extension-offerings-required-params"></a>

Wenn Sie die [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html)API aufrufen, um nach Erweiterungsangeboten zu suchen, müssen Sie den folgenden Wert angeben:
+ `TrainingPlanArn`: Der des Schulungsplans, den Sie verlängern möchten. Der `TrainingPlanArn` muss auf einen vorhandenen Schulungsplan mit dem Status `Active` oder verweisen`Scheduled`.

## Optionale Parameter
<a name="search-extension-offerings-optional-params"></a>

In den folgenden Abschnitten finden Sie Einzelheiten zu einigen optionalen Parametern, die Sie bei der Suche nach Erweiterungsangeboten an Ihre `SearchTrainingPlanOfferings` API-Anfrage übergeben können.
+ `DurationHours`: Die gewünschte Dauer in Stunden für die Verlängerung. Der `DurationHours` wird auf das nächste Vielfache von 24 aufgerundet.

# Erwerben Sie eine Verlängerung
<a name="extend-training-plan-api-cli-sdk"></a>

Nachdem Sie ein Erweiterungsangebot ausgewählt haben, verwenden Sie die [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html)API, um die Erweiterung zu erwerben.

Im folgenden Beispiel wird ein AWS CLI Befehl verwendet, um einen Trainingsplan zu erweitern.

```
aws sagemaker extend-training-plan \
--training-plan-extension-offering-id "tpeo-SHA-256-hash-value"
```

Dieses JSON-Dokument ist eine Beispielantwort aus der SageMaker Trainingsplan-API. Die Antwort enthält die Liste der Erweiterungen für den Trainingsplan.

```
{
    "TrainingPlanExtensions": [
        {
            "TrainingPlanExtensionOfferingId": "tpeo-SHA-256-hash-value",
            "ExtendedAt": "2025-09-17T10:00:00Z",
            "StartDate": "2025-09-23T12:00:00Z",
            "EndDate": "2025-09-25T12:00:00Z",
            "Status": "Pending",
            "PaymentStatus": "Pending",
            "AvailabilityZone": "us-east-2a",
            "DurationHours": 48,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD"
        }
    ]
}
```

Im folgenden Abschnitt wird der obligatorische Eingabeanforderungsparameter für den `ExtendTrainingPlan` API-Vorgang definiert.

## Erforderliche Parameter
<a name="extend-training-plan-required-params"></a>

Wenn Sie die [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html)API aufrufen, um einen Trainingsplan zu erweitern, müssen Sie den folgenden Wert angeben:
+ `TrainingPlanExtensionOfferingId`: Die ID des Erweiterungsangebots, das Sie kaufen. Sie können diese ID `TrainingPlanExtensionOfferings` in der Antwort auf Ihren `SearchTrainingPlanOfferings` API-Aufruf abrufen. Das Format sollte mit beginnen`tpeo-*`.

# Verlauf der Erweiterungen anzeigen
<a name="describe-extension-history-api-cli-sdk"></a>

Verwenden Sie die [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html)API, um den vollständigen Verlauf der Erweiterungen für einen Schulungsplan einzusehen.

Im folgenden Beispiel wird ein AWS CLI Befehl verwendet, um die Erweiterungshistorie abzurufen.

```
aws sagemaker describe-training-plan-extension-history \
--training-plan-arn "arn:aws:sagemaker:us-east-2:123456789012:training-plan/my-training-plan"
```

Dieses JSON-Dokument ist eine Beispielantwort aus der SageMaker Trainingsplan-API. Die Antwort enthält eine paginierte Liste aller Erweiterungen für den Trainingsplan.

```
{
    "TrainingPlanExtensions": [
        {
            "TrainingPlanExtensionOfferingId": "tpeo-SHA-256-hash-value",
            "ExtendedAt": "2025-09-17T10:00:00Z",
            "StartDate": "2025-09-23T12:00:00Z",
            "EndDate": "2025-09-25T12:00:00Z",
            "Status": "Active",
            "PaymentStatus": "Completed",
            "AvailabilityZone": "us-east-2a",
            "DurationHours": 48,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD"
        }
    ],
    "NextToken": null
}
```

In den folgenden Abschnitten werden die obligatorischen und optionalen Eingabeanforderungsparameter für den `DescribeTrainingPlanExtensionHistory`-API-Vorgang definiert.

## Erforderliche Parameter
<a name="describe-extension-history-required-params"></a>

Wenn Sie die [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html)API aufrufen, müssen Sie den folgenden Wert angeben:
+ `TrainingPlanArn`: Der Trainingsplan, für den der Erweiterungshistorie abgerufen werden soll.

## Optionale Parameter
<a name="describe-extension-history-optional-params"></a>

Die folgenden Abschnitte enthalten Einzelheiten zu einigen optionalen Parametern, die Sie an Ihre `DescribeTrainingPlanExtensionHistory`-API-Anfrage übergeben können.
+ `NextToken`: Wenn die vorherige Antwort gekürzt wurde, erhalten Sie dieses Token. Verwenden Sie es in Ihrer nächsten Anfrage, um die nächsten Ergebnisse zu erhalten.
+ `MaxResults`: Die maximale Anzahl von Erweiterungen, die in der Antwort zurückgegeben werden sollen.

## Werte für den Erweiterungsstatus
<a name="extension-status-values-api"></a>

Erweiterungen können die folgenden Statuswerte haben:
+ `Pending`: Die Verlängerung wurde angefordert und wartet auf die Zahlungsabwicklung.
+ `Active`: Die Erweiterung wurde erfolgreich gekauft und ist aktiv.
+ `Scheduled`: Die Verlängerung soll zu einem future Zeitpunkt beginnen.
+ `Failed`: Der Kauf der Erweiterung ist fehlgeschlagen (z. B. aufgrund von Zahlungsproblemen).
+ `Expired`: Der Verlängerungszeitraum ist abgelaufen.

# Nutzung von Ausbildungsplänen für SageMaker Ausbildungsjobs
<a name="training-plan-utilization-for-training-jobs"></a>

Sie können einen SageMaker Trainingsplan für Ihre Schulungsjobs verwenden, indem Sie bei der Erstellung eines Schulungsjobs den Plan Ihrer Wahl angeben.

**Anmerkung**  
Der Schulungsplan muss den `Active` Status `Scheduled` oder haben, damit er für einen Trainingsjob verwendet werden kann.

Wenn die erforderliche Kapazität für eine Ausbildungsstelle nicht sofort verfügbar ist, wartet die Stelle, bis sie verfügbar ist, oder bis die Kapazität erreicht `StoppingCondition` ist oder die Stelle `Pending` seit 2 Tagen ausgelastet ist, je nachdem, was zuerst eintritt. Wenn die Abbruchbedingung erfüllt ist, wird der Job gestoppt. Wenn ein Job seit 2 Tagen aussteht, wird er mit einem beendet`InsufficientCapacityError`.

**Wichtig**  
**Kündigungsprozess für reservierte Kapazität:** Sie haben bis 30 Minuten vor Ablauf der Endzeit der reservierten Kapazität vollen Zugriff auf alle Reserved Instances. Wenn Ihre reservierte Kapazität noch 30 Minuten beträgt, beginnen die SageMaker Schulungspläne damit, alle laufenden Instances innerhalb dieser reservierten Kapazität zu beenden.  
Um sicherzustellen, dass Sie aufgrund dieser Kündigungen keine Fortschritte verlieren, empfehlen wir Ihnen, Ihre Trainingsjobs zu überprüfen.

## Überprüfe deinen Ausbildungsjob
<a name="training-jobs-checkpointing"></a>

Wenn Sie SageMaker Trainingspläne für Ihre SageMaker Trainingsaufgaben verwenden, achten Sie darauf, Checkpointing in Ihrem Schulungsskript zu implementieren. Auf diese Weise können Sie Ihren Trainingsfortschritt speichern, bevor eine reservierte Kapazität abläuft. Checkpointing ist besonders wichtig, wenn Sie mit reservierten Kapazitäten arbeiten, da Sie so das Training am zuletzt gespeicherten Punkt fortsetzen können, falls Ihre Arbeit zwischen zwei reservierten Kapazitäten unterbrochen wird oder wenn Ihr Trainingsplan sein Enddatum erreicht.

Um dies zu erreichen, können Sie die `SAGEMAKER_CURRENT_CAPACITY_BLOCK_EXPIRATION_TIMESTAMP`-Umgebungsvariable verwenden. Diese Variable hilft zu bestimmen, wann der Checkpoint-Prozess eingeleitet werden soll. Indem Sie diese Logik in Ihr Trainingsskript integrieren, stellen Sie sicher, dass der Fortschritt Ihres Modells in angemessenen Intervallen gespeichert wird.

Hier ist ein Beispiel dafür, wie Sie diese Checkpoint-Logik in Ihrem Python-Trainingsskript implementieren können:

```
import os
import time
from datetime import datetime, timedelta

def is_close_to_expiration(threshold_minutes=30):
    # Retrieve the expiration timestamp from the environment variable
    expiration_time_str = os.environ.get('SAGEMAKER_CURRENT_CAPACITY_BLOCK_EXPIRATION_TIMESTAMP', '0')
    
    # If the timestamp is not set (default '0'), return False
    if expiration_time_str == '0':
        return False
    
    # Convert the timestamp string (in milliseconds) to a datetime object
    expiration_time = datetime(1970, 1, 1) + timedelta(milliseconds=int(expiration_time_str))
    
    # Calculate the time difference between now and the expiration time
    time_difference = expiration_time - datetime.now()
    
    # Return True if we're within the threshold time of expiration
    return time_difference < timedelta(minutes=threshold_minutes)

def start_checkpointing():
    # Placeholder function for checkpointing logic
    print("Starting checkpointing process...")
    # TODO: Implement actual checkpointing logic here
    # For example:
    # - Save model state
    # - Save optimizer state
    # - Save current epoch and iteration numbers
    # - Save any other relevant training state

# Main training loop
num_epochs = 100
final_checkpointing_done = False
for epoch in range(num_epochs):
    # TODO: Replace this with your actual training code
    # For example:
    # - Load a batch of data
    # - Forward pass
    # - Calculate loss
    # - Backward pass
    # - Update model parameters
    
    # Check if we're close to capacity expiration and haven't done final checkpointing
    if not final_checkpointing_done and is_close_to_expiration():
        start_checkpointing()
        final_checkpointing_done = True
    
    # Simulate some training time (remove this in actual implementation)
    time.sleep(1)
print("Training completed.")
```

**Anmerkung**  
Die Bereitstellung von Trainingsjobs folgt einer First-In-First-Out (FIFO-) Reihenfolge, aber einem kleineren Cluster-Job, der später erstellt wurde, kann Kapazität zugewiesen werden, bevor ein größerer Cluster-Job erstellt wurde, wenn der größere Job nicht ausgeführt werden kann.
SageMaker Das trainingsverwaltete Warmbecken ist mit Trainingsplänen kompatibel. SageMaker Für die Wiederverwendung von Clustern müssen Sie in nachfolgenden `CreateTrainingJob` Anfragen identische `TrainingPlanArn` Werte angeben, um denselben Cluster wiederzuverwenden.

**Topics**
+ [Überprüfe deinen Ausbildungsjob](#training-jobs-checkpointing)
+ [Erstellen Sie mit der KI-Konsole einen Trainingsjob SageMaker](use-training-plan-for-training-jobs-using-console.md)
+ [Erstellen Sie einen Trainingsjob mithilfe der API AWS CLI, SageMaker SDK](use-training-plan-for-training-jobs-using-api-cli-sdk.md)

# Erstellen Sie mit der KI-Konsole einen Trainingsjob SageMaker
<a name="use-training-plan-for-training-jobs-using-console"></a>

Mithilfe der SageMaker KI-Benutzeroberfläche können Sie SageMaker Trainingspläne für Ihre Trainingsjobs verwenden. Beim Erstellen eines Trainingsjobs werden Ihnen die verfügbaren Pläne vorgeschlagen, sofern Ihre Instance-Auswahl und Region mit den verfügbaren Plänen übereinstimmen.

Um einen Trainingsjob mithilfe der reservierten Kapazität eines Trainingsplans in der SageMaker Konsole zu erstellen:

1. Navigieren Sie zur SageMaker AI-Konsole unter [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Wählen Sie im linken Navigationsbereich **Training** und dann **Trainingsjobs** aus.

1. Wählen Sie **Trainingsjob erstellen** aus.

1. Achten Sie bei der Konfiguration der Ressourcen für Ihren Trainingsjob auf den Abschnitt **Instance-Kapazität**. Wenn Pläne verfügbar sind, die dem ausgewählten Instance-Typ und der Region entsprechen, werden diese hier angezeigt. Wählen Sie einen Trainingsplan aus, der Ihren Rechenkapazitätsanforderungen entspricht.

   Wenn keine geeigneten Pläne verfügbar sind, können Sie entweder Ihren Instance-Typ oder Ihre Region anpassen oder ohne einen Trainingsplan fortfahren.

1. Nachdem Sie einen Trainingsplan ausgewählt haben (oder sich entschieden haben, ohne einen Plan fortzufahren), schließen Sie die restliche Konfiguration Ihrer Trainingsjobs ab und wählen Sie **Trainingsjob erstellen**, um den Vorgang zu starten.

![\[SageMaker KI-Konsolenseite zum Erstellen eines neuen Schulungsjobs. Auf der Seite werden verschiedene Konfigurationsoptionen angezeigt, darunter Jobeinstellungen, Algorithmusoptionen, Ressourcenkonfiguration, Auswahl des Trainingsplans und Abbruchbedingungen.\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/images/training-plans/tp-create-training-job.png)


Überprüfen und starten Sie Ihren Job. Ihr Job beginnt zu laufen, sobald der Schulungsplan die `Active` Kapazität aussteht.

# Erstellen Sie einen Trainingsjob mithilfe der API AWS CLI, SageMaker SDK
<a name="use-training-plan-for-training-jobs-using-api-cli-sdk"></a>

Um SageMaker Trainingspläne für Ihren SageMaker Trainingsjob zu verwenden, geben Sie `ResourceConfig` beim Aufrufen der [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html)API-Operation den `TrainingPlanArn` Parameter des gewünschten Plans an. Es kann genau ein Plan pro Job verwenden.

**Wichtig**  
Das im `ResourceConfig` Abschnitt der `CreateTrainingJob` Anfrage angegebene `InstanceType` Feld muss mit dem `InstanceType` Ihres Trainingsplans übereinstimmen.

## Führen Sie mithilfe der CLI einen Trainingsjob für einen Plan aus
<a name="training-job-cli"></a>

Das folgende Beispiel zeigt, wie Sie mithilfe des `TrainingPlanArn` Attributs im `create-training-job` AWS CLI Befehl einen SageMaker Schulungsjob erstellen und ihn mit einem bereitgestellten Schulungsplan verknüpfen. 

Weitere Informationen zum Erstellen einer Ausbildungsstelle mithilfe des AWS CLI [CreateTrainingJob](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html)Befehls finden Sie unter [https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-training-job.html](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-training-job.html).

```
# Create a training job
aws sagemaker create-training-job \
  --training-job-name training-job-name \
  ...
    
  --resource-config '{
        "InstanceType": "ml.p5.48xlarge",
        "InstanceCount": 8,
        "VolumeSizeInGB": 10,
        "TrainingPlanArn": "training-plan-arn"
        }
    }' \
    ...
```

Mit diesem AWS CLI Beispielbefehl wird ein neuer Trainingsjob in SageMaker KI erstellt, der einen Trainingsplan im `--resource-config` Argument erfüllt.

```
aws sagemaker create-training-job \
  --training-job-name job-name \
  --role-arn arn:aws:iam::111122223333:role/DataAndAPIAccessRole \
  --algorithm-specification '{"TrainingInputMode": "File","TrainingImage": "111122223333.dkr.ecr.us-east-1.amazonaws.com/algo-image:tag", "ContainerArguments": [" "]}' \
  --input-data-config '[{"ChannelName":"training","DataSource":{"S3DataSource":{"S3DataType":"S3Prefix","S3Uri":"s3://bucketname/input","S3DataDistributionType":"ShardedByS3Key"}}}]' \
  --output-data-config '{"S3OutputPath": "s3://bucketname/output"}' \
  --resource-config '{"VolumeSizeInGB":10,"InstanceCount":4,"InstanceType":"ml.p5.48xlarge", "TrainingPlanArn" : "arn:aws:sagemaker:us-east-1:111122223333:training-plan/plan-name"}' \
  --stopping-condition '{"MaxRuntimeInSeconds": 1800}' \
  --region us-east-1
```

Nachdem Sie den Trainingsjob erstellt haben, können Sie überprüfen, ob er dem Trainingsplan ordnungsgemäß zugewiesen wurde, indem Sie die `DescribeTrainingJob` API aufrufen.

```
aws sagemaker describe-training-job --training-job-name training-job-name
```

## Führen Sie mithilfe des SageMaker AI Python SDK einen Trainingsjob auf einem Plan aus
<a name="training-job-sdk"></a>

Alternativ können Sie mit dem [SageMaker Python-SDK](https://sagemaker.readthedocs.io/en/stable/v2.html) einen Trainingsjob erstellen, der mit einem Trainingsplan verknüpft ist.

Wenn Sie das SageMaker Python-SDK JupyterLab in Studio verwenden, um einen Trainingsjob zu erstellen, stellen Sie sicher, dass die Ausführungsrolle, die von dem Bereich verwendet wird, in dem Ihre JupyterLab Anwendung ausgeführt wird, über die erforderlichen Berechtigungen zur Verwendung von SageMaker Trainingsplänen verfügt. Informationen zu den erforderlichen Berechtigungen für die Verwendung von SageMaker Trainingsplänen finden Sie unter[IAM für SageMaker Schulungspläne](training-plan-iam-permissions.md).

Das folgende Beispiel zeigt, wie Sie einen SageMaker Trainingsjob erstellen und ihn mit einem bereitgestellten Trainingsplan verknüpfen, indem Sie das `training_plan` Attribut im `Estimator` Objekt verwenden, wenn Sie das SageMaker Python-SDK verwenden.

Weitere Informationen zum SageMaker Estimator finden Sie unter [Verwenden eines SageMaker Schätzers zur Ausführung eines Trainingsjobs](https://docs.aws.amazon.com/sagemaker/latest/dg/docker-containers-adapt-your-own-private-registry-estimator.html).

```
import sagemaker
import boto3
from sagemaker import get_execution_role
from sagemaker.estimator import Estimator
from sagemaker.inputs import TrainingInput

# Set up the session and SageMaker client
session = boto3.Session()
region = session.region_name
sagemaker_session = session.client('sagemaker')

# Get the execution role for the training job
role = get_execution_role()

# Define the input data configuration
trainingInput = TrainingInput(
    s3_data='s3://input-path',
    distribution='ShardedByS3Key',
    s3_data_type='S3Prefix'
)

estimator = Estimator(
    entry_point='train.py',
    image_uri="123456789123.dkr.ecr.{}.amazonaws.com/image:tag",
    role=role,
    instance_count=4,
    instance_type='ml.p5.48xlarge',
    training_plan="training-plan-arn",
    volume_size=20,
    max_run=3600,
    sagemaker_session=sagemaker_session,
    output_path="s3://output-path"
)

# Create the training job
estimator.fit(inputs=trainingInput, job_name=job_name)
```

Nachdem Sie den Trainingsjob erstellt haben, können Sie überprüfen, ob er dem Trainingsplan ordnungsgemäß zugewiesen wurde, indem Sie die `DescribeTrainingJob` API aufrufen.

```
# Check job details
sagemaker_session.describe_training_job(TrainingJobName=job_name)
```

# Nutzung von Schulungsplänen für SageMaker HyperPod Amazon-Cluster
<a name="training-plan-utilization-for-hyperpod"></a>

Um SageMaker Trainingspläne für Ihren SageMaker HyperPod Amazon-Cluster zu verwenden, geben Sie bei der Erstellung oder Aktualisierung Ihres Clusters den Trainingsplan an, den Sie auf Cluster-Instance-Ebene verwenden möchten. 

**Anmerkung**  
Der Trainingsplan muss den `Active` Status `Scheduled` oder haben, um von einem HyperPod Cluster verwendet zu werden.
Stellen Sie sicher, dass die Cluster-Konfiguration der Availability Zone (AZ) entspricht, die in Ihrem Trainingsplan angegeben ist.  
Informationen zur VPC-Setup, zum Ressourcenstandort und zur Konfiguration der Sicherheitsgruppe finden Sie [Einrichtung SageMaker HyperPod mit einer benutzerdefinierten Amazon VPC](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-vpc) in der SageMaker HyperPod Dokumentation.  
Wenn Sie Amazon FSx for Lustre einrichten HyperPod , erfahren Sie mehr über die Auswahl von Regionen und AZ, lesen Sie die VPC-Konfigurationsanforderungen und erfahren Sie mehr über die Best Practices für die AZ-Ausrichtung unter. [(Optional) Einrichtung SageMaker HyperPod mit Amazon FSx for Lustre](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-fsx)
Sie können für jede Ihrer Instance-Gruppen einen Plan auswählen. Wir raten jedoch davon ab, einen Trainingsplan für die primäre Instance-Gruppe eines Clusters zu verwenden, da primäre Knoten kontinuierliche, stabile Ressourcen benötigen, die nicht der festen Dauer und dem potenziell diskontinuierlichen Charakter der Trainingsplankapazitäten entsprechen.

**Topics**
+ [Erstellen Sie mithilfe der KI-Konsole einen SageMaker HyperPod Cluster für Trainingspläne SageMaker](use-training-plan-for-hyperpod-creation-using-console.md)
+ [Aktualisieren Sie die Trainingspläne eines SageMaker HyperPod Clusters mithilfe der SageMaker AI-Konsole](use-training-plan-for-hyperpod-update-using-console.md)
+ [Erstellen Sie mithilfe der SageMaker API einen SageMaker HyperPod Cluster auf Trainingsplänen, oder AWS CLI](use-training-plan-for-hyperpod-creation-using-api-cli-sdk.md)
+ [Aktualisieren Sie einen SageMaker HyperPod Cluster anhand von Trainingsplänen mithilfe der SageMaker API, oder AWS CLI](use-training-plan-for-hyperpod-update-using-api-cli-sdk.md)

# Erstellen Sie mithilfe der KI-Konsole einen SageMaker HyperPod Cluster für Trainingspläne SageMaker
<a name="use-training-plan-for-hyperpod-creation-using-console"></a>

Gehen Sie folgendermaßen vor, um mithilfe von Trainingsplänen über die Benutzeroberfläche der SageMaker AI-Konsole einen SageMaker HyperPod Cluster zu erstellen:

1. Navigieren Sie zur SageMaker AI-Konsole unter [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Wählen Sie im linken Navigationsbereich **Hyperpod** und anschließend **Cluster erstellen** aus.

1. Bei der Konfiguration einer Instance-Gruppe können Sie einen Plan auswählen, der Ihren Rechenkapazitätsanforderungen entspricht.

![\[SageMaker Die AI-Konsolenoberfläche zeigt ein modales Fenster zum Erstellen einer Instanzgruppe innerhalb eines SageMaker HyperPod Clusters. Das Formular enthält Felder für den Instance-Gruppennamen, den Instance-Typ, die Menge, die Instance-Kapazität (mit Optionen für On-Demand- und Trainingspläne) sowie einen Verzeichnispfad für das Lebenszyklusskript bei der Erstellung.\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/images/training-plans/tp-create-hyperpod-cluster.png)


Überprüfen und erstellen Sie Ihren Cluster. Instance-Gruppen, die einen Trainingsplan verwenden, werden je nach verfügbarer Kapazität auf die angegebene Anzahl von ZielInstances skaliert`Active`, sobald der Trainingsplan festgelegt ist. Dreißig Minuten vor Ablauf jedes Zeitraums für reservierte Kapazität beginnt die Instance-Gruppe mit der Herunterskalierung auf null Instances. Dieser Status wird herunterskaliert, bis der nächste Zeitraum für reservierte Kapazität beginnt oder der Plan endet. Während dieses Prozesses behält eine intakte Instance-Gruppe ihren `InService` Status nach ihrer ersten Erstellung bei, unabhängig von der aktuellen Anzahl von Instances.

# Aktualisieren Sie die Trainingspläne eines SageMaker HyperPod Clusters mithilfe der SageMaker AI-Konsole
<a name="use-training-plan-for-hyperpod-update-using-console"></a>

Mithilfe der Benutzeroberfläche der SageMaker AI-Konsole können Sie einen Trainingsplan aktualisieren, entfernen oder zu einem vorhandenen SageMaker HyperPod Cluster hinzufügen. Gehen Sie folgendermaßen vor, um die Instanzgruppe eines SageMaker HyperPod Clusters zu aktualisieren:

1. Navigieren Sie zur SageMaker AI-Konsole unter [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Wählen Sie im linken Navigationsbereich **Hyperpod** aus.

1. Navigieren Sie zur Detailseite des Clusters, indem Sie dem Hyperlink folgen, der mit dem Clusternamen verknüpft ist.

1. Bei der Konfiguration einer Instance-Gruppe können Sie Ihren Plan aktualisieren, um ihn an Ihre neuen Rechenkapazitätsanforderungen anzupassen.

![\[SageMaker Die AI-Konsolenoberfläche zeigt ein modales Fenster zum Aktualisieren einer Instanzgruppe innerhalb eines SageMaker HyperPod Clusters. Das Formular enthält Felder für den Instance-Gruppennamen, den Instance-Typ, die Menge, die Instance-Kapazität (mit Optionen für On-Demand- und Trainingspläne) sowie einen Verzeichnispfad für das Lebenszyklusskript bei der Erstellung.\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/images/training-plans/tp-update-hyperpod-clusters.png)


Überprüfen und aktualisieren Sie Ihren Cluster.

# Erstellen Sie mithilfe der SageMaker API einen SageMaker HyperPod Cluster auf Trainingsplänen, oder AWS CLI
<a name="use-training-plan-for-hyperpod-creation-using-api-cli-sdk"></a>

Um SageMaker Trainingspläne für Ihren SageMaker HyperPod Amazon-Cluster zu verwenden, geben Sie den ARN des Trainingsplans, den Sie verwenden möchten, im [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-TrainingPlanArn](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-TrainingPlanArn)Parameter von an, [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html)wenn Sie die [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html)API-Operation aufrufen. 

Stellen Sie sicher, dass das mit der ausgewählten AZ Ihres Plans verbundene Subnetz in der`VPCConfig` Ihrer Clusterkonfiguration enthalten ist. Sie können die Daten `AvailabilityZone` eines Trainingsplans als Antwort auf einen [``DescribeTrainingPlan](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlan.html)API-Aufruf abrufen.

Das folgende Beispiel zeigt, wie Sie einen neuen SageMaker HyperPod Cluster erstellen und einer Instanzgruppe einen Trainingsplan im `--instance-groups` Attribut des `create-cluster` AWS CLI Befehls zur Verfügung stellen. 

```
# Create a cluster         
aws sagemaker create-cluster \
  --cluster-name cluster-name \
  --instance-groups '[ \
        { \
            "InstanceCount": 1,\
            "InstanceGroupName": "controller-nodes",\
            "InstanceType": "ml.t3.xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
        },\
        { \
            "InstanceCount": 2, \
            "InstanceGroupName": "worker-nodes",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id}:role/execution_role}",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        }]'
```

Hinweise zum Erstellen eines HyperPod Clusters mithilfe von finden Sie unter [https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-cluster.html](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-cluster.html). AWS CLI

Nachdem Sie den Cluster erstellt haben, können Sie überprüfen, ob Ihrer Instance-Gruppe die Kapazität aus dem Trainingsplan ordnungsgemäß zugewiesen wurde, indem Sie die `DescribeCluster`-API aufrufen.

```
aws sagemaker describe-cluster --cluster-name cluster-name
```

# Aktualisieren Sie einen SageMaker HyperPod Cluster anhand von Trainingsplänen mithilfe der SageMaker API, oder AWS CLI
<a name="use-training-plan-for-hyperpod-update-using-api-cli-sdk"></a>

Sie können einen Trainingsplan hinzufügen, aktualisieren oder entfernen, indem Sie die Instanzgruppe eines vorhandenen Clusters mithilfe des `update-cluster` AWS CLI Befehls aktualisieren. Das folgende Beispiel zeigt, wie Sie einen SageMaker HyperPod Cluster aktualisieren und einer Instanzgruppe einen neuen Trainingsplan zur Verfügung stellen.

```
# Update a cluster
aws sagemaker update-cluster \
  --cluster-name cluster-name \
  --instance-groups '[ \
        { \
            "InstanceCount": 1,\
            "InstanceGroupName": "controller-nodes",\
            "InstanceType": "ml.t3.xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
        },\
        { \
            "InstanceCount": 2, \
            "InstanceGroupName": "worker-nodes",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id}:role/execution_role}",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        },\
        {\
            "InstanceCount": 1,\
            "InstanceGroupName": "worker-nodes-2",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        }\
    ]'
```

# Zeigen Sie die Kontingente für SageMaker Trainingspläne mithilfe der AWS Managementkonsole an.
<a name="training-plan-quotas"></a>

**Wichtig**  
Preisinformationen zu SageMaker Schulungsplänen finden Sie auf der Seite mit den [ SageMaker Amazon-Preisen](https://aws.amazon.com/sagemaker/pricing/). Navigieren Sie unter **On-Demand-Preise** zum Abschnitt ** SageMaker HyperPod Flexible Trainingspläne von Amazon**. Wählen Sie Ihre gewünschte Region aus, um die verfügbaren Instance-Typen und die entsprechenden Preise anzuzeigen.
Stellen Sie sicher, dass Ihre Trainingsjobs oder HyperPod Servicekontingente eine maximale Anzahl von Instances pro Instance-Typ zulassen, die die in Ihrem Plan angegebene Anzahl von Instances übersteigt.

Sie können die aktuellen Kontingente und Limits für SageMaker Schulungspläne in der AWS Management Console einsehen. 

So suchen Sie nach einem bestimmten Kontingentwert:

1. Öffnen Sie die [Service Quotas-Konsole](https://console.aws.amazon.com/servicequotas/home/services/sagemaker/quotas).

1. Wählen Sie im linken Navigationsbereich **AWS services** aus.

1. Suchen Sie in der AWS Serviceliste nach **Amazon SageMaker AI** und wählen Sie es aus.

1. In der Liste der **Servicekontingente** finden Sie den Namen des Servicekontingents, den angewendeten Wert (falls verfügbar), das AWS Standardkontingent und ob der Kontingentwert anpassbar ist.

Um nach bestimmten Kontingenten zu suchen, können Sie die Suchleiste oben in der Liste der **Servicekontingente** verwenden. Geben Sie das `Limit Name` Kontingent ein, nach dem Sie suchen. Um beispielsweise das Kontingent für die Anzahl der Trainingspläne pro Region zu ermitteln, geben Sie es **training-plan-total\$1count** in die Suchleiste ein.

In der folgenden Tabelle sind die Namen der Kontingentlimits für SageMaker Trainingspläne aufgeführt.


**SageMaker Kontingentgrenzen für Trainingspläne**  

| Bezeichnung des Limits | Anzeigename | 
| --- | --- | 
| training-plan-total\$1zählen | Anzahl der Trainingspläne pro Region | 
| reserved-capacity-ml-p4d-24x groß | Anzahl der reservierten Instances von ml.p4d.24xlarge in den Trainingsplänen pro Region | 
| reserved-capacity-ml-p5-48x groß | Anzahl der ml.p5.48xlarge-Instances mit reservierter Kapazität in allen Schulungsplänen pro Region | 
| reserved-capacity-ml-p5e-48x groß | Anzahl der ml.p5e.48xlarge-Instances mit reservierter Kapazität in allen Schulungsplänen pro Region | 
| reserved-capacity-ml-p5en-48x groß | Anzahl der ml.p5en.48xlarge-Instances mit reservierter Kapazität in allen Schulungsplänen pro Region | 
| reserved-capacity-ml-trn1-32 x groß | Anzahl der ml-trn1-32xlarge-Instances mit reservierter Kapazität in allen Schulungsplänen pro Region | 
| reserved-capacity-ml-trn2-48 x groß | Anzahl der ml.trn2.48xlarge-Instances mit reservierter Kapazität in allen Schulungsplänen pro Region | 

Wenn Sie höhere Limits für Ihre SageMaker Trainingspläne benötigen, können Sie möglicherweise eine Erhöhung der Quote beantragen. Die Möglichkeit, ein Kontingent zu erhöhen, hängt davon ab, ob es anpassbar ist. Dies können Sie in der Konsole **Service Quotas** nachlesen.

So fordern Sie eine Kontingenterhöhung an:

1. Navigieren Sie in der **Service-Kontingents-Konsole zu dem jeweiligen Kontingent**.

1. Wenn das Kontingent anpassbar ist, können Sie eine Erhöhung des Kontingents entweder auf Konto- oder Ressourcenebene beantragen, basierend auf dem Wert, der in der Spalte **Anpassbarkeit** aufgeführt ist.

1. Geben Sie unter **Kontingentwert erhöhen** den neuen Wert ein. Der neue Wert muss größer als der aktuelle Wert sein.

1. Wählen Sie **Anfrage** aus.

1. Anträge auf eine Erhöhung der Quote müssen von geprüft und genehmigt werden AWS. Um ausstehende oder kürzlich gelöste Anfragen in der Konsole anzuzeigen, navigieren Sie auf der Detailseite des Services zur Registerkarte **Anfrageverlauf** oder wählen Sie im Navigationsbereich **Dashboard** aus. Wählen Sie für ausstehende Anfragen den Status der Anfrage, um die Anfrage zu öffnen. Der Anfangsstatus einer Anfrage ist `Pending`. Nachdem sich der Status auf geändert hat`Quota requested`, sehen Sie die Fallnummer mit AWS Support. Wählen Sie die Fallnummer, um das Ticket für Ihre Anfrage zu öffnen.

Weitere Informationen zur Anforderung einer Erhöhung eines Kontingents finden Sie unter [Beantragen einer Kontingenterhöhung](https://docs.aws.amazon.com/servicequotas/latest/userguide/request-quota-increase.html) im *Benutzerhandbuch für AWS Service Quotas*.

# Versionshinweise
<a name="training-plan-release-notes"></a>

In den folgenden Versionshinweisen finden Sie die neuesten Aktualisierungen für SageMaker Trainingspläne.

## Versionshinweise zu SageMaker Amazon-Schulungsplänen: 04. Dezember 2024
<a name="training-plan-release-notes-20241204"></a>

**Neue Features**
+ Auf der AWS re:Invent 2024 wurden SageMaker Amazon-Schulungspläne vorgestellt.