

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# トレーニングジョブまたは HyperPod クラスターのトレーニングプランを予約する
<a name="reserve-capacity-with-training-plans"></a>

Amazon SageMaker トレーニングプランは、大規模な AI モデルトレーニングワークロードで GPU キャパシティを予約して最大限に活用できる機能です。この機能により、最新の NVIDIA GPU テクノロジーや AWS Trainium チップなど、GPU アクセラレーションコンピューティングのさまざまなオプションをカバーする、人気の高いインスタンスタイプにアクセスできます。SageMaker トレーニングプランを使用すると、基盤となるインフラストラクチャを管理する必要なく、指定したタイムラインと予算内でこれらの需要が高く高パフォーマンスなコンピューティングリソースへの予測可能なアクセスを確保できます。このような柔軟性は、ミッションクリティカルな AI ワークロード向けにオーバーサブスクライブしたコンピューティングインスタンスを取得してスケジュールするという課題を抱える組織にとって、特に価値があります。

## SageMaker トレーニングプランとは
<a name="training-plans-what-is"></a>

SageMaker トレーニング プランを使用すると、SageMaker トレーニングジョブや SageMaker HyperPod クラスターなど、ターゲットリソースのニーズに合わせてコンピューティングキャパシティを予約できます。このサービスは、予約、高速コンピューティングリソースのプロビジョニング、インフラストラクチャのセットアップ、ワークロードの実行、インフラストラクチャの障害からの復旧を自動的に処理します。

SageMaker トレーニングプランは、単一または複数のリザーブドキャパシティブロックで構成され、それぞれ次のパラメータで定義されます。
+ 特定のインスタンスタイプ
+ インスタンスの数
+ アベイラビリティーゾーン (AZ)
+ 時間
+ 開始時刻と終了時刻

**注記**  
トレーニングプランはターゲットリソース (SageMaker トレーニングジョブまたは SageMaker HyperPod) に固有であり、置き換えることはできません。
単一のトレーニングプラン内の複数のリザーブドキャパシティブロックは不連続になる場合があります。つまり、リザーブドキャパシティブロック間でギャップが生じる可能性があります。

## SageMaker トレーニングプランの利点
<a name="training-plans-benefits"></a>

SageMaker トレーニングプランには、次の利点があります。
+ **予測可能なアクセス**: 指定された期間で機械学習ワークロードの GPU キャパシティを予約できます。
+ **コスト管理**: 大規模なトレーニング要件の計画と予算を事前に策定できます。
+ **自動リソース管理**: SageMaker トレーニングプランは、インフラストラクチャのプロビジョニングと管理を処理します。
+ **柔軟性**: SageMaker トレーニングジョブや SageMaker HyperPod クラスターなど、さまざまなリソースのトレーニングプランを策定できます。
+ **耐障害性**: SageMaker AI トレーニングジョブのインフラストラクチャ障害からの自動復旧とアベイラビリティーゾーン間のワークロード移行の利点が得られます。

## SageMaker トレーニングプランの事前予約と柔軟な開始時刻
<a name="training-plan-reservation-timing"></a>

SageMaker トレーニングプランでは、柔軟な開始時刻と期間で、コンピューティングキャパシティを事前に予約できます。
+ **事前予約**: トレーニングプランは、開始日の 8 週間 (56 日) 前に予約できます。
+ **最小リードタイム**: SageMaker トレーニングプランの提供内容は、予約後 30 分以内に開始できます。ただし、空き状況によっては開始できない場合もあります。
**注記**  
30 分以内にアクセス可能なプランを検索して購入できます。タイムリーなアクティベーションを確実に行うには、希望する開始時刻の少なくとも 5 分前に支払いトランザクションが正常に完了している必要があります。例えば、プランを午後 2 時に開始する場合は、直前検索を午後 1 時 30 分までに行い、午後 1 時 55 分までに購入を完了して、プランの準備が午後 2 時までに完了するようにします。
+ **予約期間とインスタンス数**: SageMaker トレーニングプランでは、特定の期間と数のオプションを使用してインスタンスを予約できます。特定の、期間 AWS リージョン、数量オプションで使用可能なインスタンスタイプについては、「」を参照してください[サポートされているインスタンスタイプ AWS リージョン、および料金](#training-plans-supported-instances-and-regions)。
+ **終了時刻**: トレーニングプランは常に予約の最終日の午前 11:30 UTC に終了します。
+ **トレーニングプランの終了**: トレーニングジョブをターゲットリソースとして使用していて、リザーブドキャパシティが 30 分残っている場合、SageMaker トレーニングプランは、次のリザーブドキャパシティがアクティブになるまで、そのブロック内で実行中のインスタンスを終了するプロセスを開始します。トレーニングプランへのフルアクセスは、最後のリザーブドキャパシティブロックの終了時刻の 30 分前まで保持されます。

  ターゲットリソースが SageMaker HyperPod クラスターの場合、この制限時間は 1 時間です。

## SageMaker トレーニングプランのユーザーワークフロー
<a name="training-plans-workflow"></a>

SageMaker トレーニングプランは、次の手順で進みます。

管理者の手順:

1. **検索とレビュー**: インスタンスタイプ、カウント、開始時刻、期間など、コンピューティング要件に合った利用可能なプランの提供内容を検索します。

1. **プランを作成する**: 選択したプラン提供内容の ID を使用して、ニーズに合ったトレーニングプランを予約します。

1. **支払いとスケジューリング**: 前払いが正常に完了すると、プランのステータスは `Scheduled` になります。

プランのユーザー/ML エンジニアの手順:

1. **リソース割り当て**: プランを使用して、SageMaker AI トレーニングジョブをキューに入れるか、SageMaker HyperPod クラスターインスタンスグループに割り当てます。

1. **アクティベーション**: プラン開始日になると、`Active` になります。利用可能なリザーブドキャパシティに基づいて、SageMaker トレーニングプランはトレーニングジョブを自動的に起動するか、インスタンスグループをプロビジョンします。

**注記**  
トレーニングプランのステータスは、リザーブドキャパシティ期間の開始時に `Scheduled` から `Active` に移行し、次のリザーブドキャパシティ期間の開始時に `Scheduled` に戻ります。

次の図は、SageMaker トレーニングプランがさまざまな [target resources](#training-plans-target-resources) とやり取りする方法についての包括的な概要を示しており、プランのライフサイクルと、SageMaker トレーニングジョブと SageMaker HyperPod クラスターの両方に対するリソース割り当てにおける役割を説明しています。
+ **SageMaker トレーニングジョブのトレーニングプラン**: 最初の図は、トレーニングプランと SageMaker トレーニングジョブ間のやり取りのエンドツーエンドのワークフローを示しています。  
![\[請求、トレーニングプランでのキャパシティ予約、SageMaker トレーニングジョブ トレーニングプランのライフサイクルと、管理者および ML エンジニアが管理するトレーニングジョブの状態の説明図\]](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/images/training-plans/tp-training-plan-for-training-jobs.png)
+ **SageMaker HyperPod クラスターのトレーニングプラン**: 2 番目の図は、トレーニングプランと SageMaker HyperPod インスタンスグループ間のインタラクションのエンドツーエンドのワークフローを説明しています。  
![\[課金、トレーニングプランでのキャパシティ予約、インスタンスグループ管理のワークフロー 管理者と ML エンジニアが管理するトレーニングプランのライフサイクルとインスタンスグループの状態の説明図\]](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/images/training-plans/tp-training-plan-for-hyperpod.png)

## サポートされているインスタンスタイプ AWS リージョン、および料金
<a name="training-plans-supported-instances-and-regions"></a>

トレーニングプランでは、以下の特定の高パフォーマンスインスタンスタイプの予約がサポートされています。各インスタンスタイプは、以下の一部の AWS リージョンで利用できます。
+ **ml.p4d.24xlarge**
+ **ml.p5.48xlarge**
+ **ml.p5e.48xlarge**
+ **ml.p5en.48xlarge**
+ **ml.trn1.32xlarge**
+ **ml.trn2.48xlarge**
+ **ml.p6-b200.48xlarge**
+ **ml.c6i-32xlargesc**

**UltraServer**
+ **ml.p6e-gb200.36xlarge**
+ **ml.p6e-gb200.72xlarge**

**注記**  
インスタンスタイプの可用性は、時間の経過とともに変化する可能性があります。リージョンごとに利用可能なインスタンスタイプとそれぞれの料金の最新情報については、「[SageMaker の料金](https://aws.amazon.com/sagemaker-ai/pricing/)」を参照してください。**[オンデマンド料金]** の **[Amazon SageMaker HyperPod フレキシブルなトレーニングプラン]** セクションまで下にスクロールします。リージョンを選択すると、使用可能なインスタンスタイプのリストが表示されます。

複数のリージョンにわたる可用性により、データレジデンシー要件や他の AWS サービスへの近接性などの要素を考慮して、ワークロードに最適な場所を選択できます。

**重要**  
SageMaker トレーニングプランを使用すると、次の予約期間とインスタンス数量オプションでインスタンスを予約できます。  
予約期間は 1～182 日間で 1 日単位で利用できます。
予約インスタンスの数量オプションは、1、2、4、8、16、32、64 です。
トレーニングジョブまたは HyperPod サービスのクォータで、プランで指定されているインスタンスの数を超えるインスタンスタイプあたりの最大インスタンス数が許可されていることを確認します。現在のクォータを表示したり、クォータの引き上げをリクエストしたりするには、「[AWS マネジメントコンソールを使用して SageMaker トレーニングプランのクォータを表示する](training-plan-quotas.md)」を参照してください。

## SageMaker AI での UltraServer
<a name="training-plans-ultraservers"></a>

SageMaker AI での UltraServer は、高帯域幅のネットワークドメインを介して相互接続されたインスタンスのセットを提供します。例えば、P6e-GB200 UltraServer は、単一の NVIDIA NVLink ドメインに最大 18 個の `p6e-gb200.36xlarge` インスタンスを接続します。インスタンスあたり 4 つの NVIDIA Blackwell GPU を搭載し、各 P6e-GB200 UltraServer は 72 個の GPU をサポートするため、SageMaker AI で最大規模の AI ワークロードを高パフォーマンスで実行できます。

SageMaker AI で UltraServers を使用すると、SageMaker AI のマネージドインフラストラクチャ、組み込みの障害耐性機能、統合モニタリング機能、他の SageMaker AI および AWS サービスとのネイティブ統合とパフォーマンスが組み合わされます。この統合により、SageMaker AI が AI インフラストラクチャの管理という差別化につながらない作業を処理できるので、ユーザーはモデルの開発とデプロイに集中できます。

**注記**  
UltraServer は、米国東部 (バージニア北部) リージョンの拡張であるダラスローカルゾーン (us-east-1-dfw-2a) でのみ使用できます。詳細については、[「 の開始方法」を参照してください AWS ローカルゾーン。](https://docs.aws.amazon.com/local-zones/latest/ug/getting-started.html)

### 考慮事項
<a name="training-plans-ultraservers-considerations"></a>

SageMaker AI で UltraServer を使用する場合は、次の点を考慮する必要があります。
+ UltraServer は、[SageMaker HyperPod](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod.html) と [ジョブと SageMaker トレーニングジョブ](https://docs.aws.amazon.com/sagemaker/latest/dg/train-model.html)の両方で使用できます。
+ UltraServer はフルユニットでのみ購入できます。インスタンスと料金情報の詳細については、「[Amazon SageMaker AI の料金](https://aws.amazon.com/sagemaker-ai/pricing/)」の「Amazon SageMaker HyperPod のフレキシブルなトレーニングプラン」を参照してください。
+ HyperPod で UltraServer を使用している場合、HyperPod はリソースの割り当てに役立つトポロジーラベルを自動的にリソースに追加します。詳細については、「[Amazon SageMaker HyperPod でのトポロジー認識スケジューリングの使用](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod-topology.html)」を参照してください。
+ SageMaker AI と UltraServer は、プリエンプティブチェックや自動障害検出と軽減など、ワークロードの耐障害性を強化するさまざまな機能を提供しています。問題に応じて、SageMaker AI は、インスタンスの再起動、障害が発生したインスタンスのスペア交換、障害が発生した UltraServer の交換など、ワークロードを復旧するためのアクションを実行できます。
+ 耐障害性を高めるために、UltraServer 内のインスタンスをスペアとして使用するように設定できます。UltraServer 内にスペアインスタンスを保持すると、SageMaker AI はジョブへの影響を最小限に抑えながら、インスタンスの障害に迅速に対応できます。UltraServer ごとに 1 つのスペアインスタンスを保持することをお勧めします。スペアインスタンスの予約は必須ではありませんが、スペアインスタンスがないと、サポートオプションが限定され、障害からの復旧が遅くなる可能性があります。UltraServer はまとめて購入するため、予約するスペアの数は料金に影響しません。
+ UltraServer 内のステータスとインスタンスを確認するには、[ListTrainingPlans](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ListTrainingPlans.html) API オペレーションまたは AWS コンソールを使用してトレーニングプランを表示します。これらのツールを使用すると、使用可能なインスタンス、現在使用中のインスタンス、異常なインスタンス、設定されたスペアの数、その他の情報の合計数を確認できます。ヘルスステータスには、`ok`、`impaired`、`insufficient-data` があります。

## SageMaker トレーニングプランの検索動作
<a name="training-plans-search-behavior"></a>

トレーニングプランの提供内容を検索する場合、SageMaker トレーニングプランは、需要が高くリザーブドキャパシティブロックが不足している場合でも、ユーザーのリソースの可用性と柔軟性を最大限に高めるために、以下のアプローチを使用します。
+ **最初の継続的検索**: SageMaker トレーニングプランは最初に、ターゲットリソース、リクエストされたインスタンスタイプ、インスタンス数など、指定された他のすべての基準を満たしながら、開始日から終了日までの範囲内で指定された期間に一致する、リザーブドキャパシティの単一の連続ブロックを探します。
+ **2 ブロック検索**: すべての条件を満たす 1 つの連続リザーブドキャパシティブロックが使用できない場合、SageMaker トレーニングプランは「キャパシティなし」の結果を返すことはありません。代わりに、2 つの異なるリザーブドキャパシティブロックを使用してリクエストを自動的に処理し、合計期間を 2 つの時間セグメントに分割します。

  この 2 ブロック アプローチにより、リソース割り当ての柔軟性が向上し、この方法でななければ利用できない需要の高いインスタンスを確保できる可能性を生み出します。

**注記**  
SageMaker トレーニングプランは、1 つまたは 2 つのセグメントの提供内容を最大 3 つ返します。例えば、48 時間の期間プランの場合、SageMaker トレーニングプランは、2 つの 24 時間ブロック、1 つの連続 48 時間ブロック、2 つの不均等な期間を持つプランを提供する場合があります。

## 考慮事項
<a name="training-plans-considerations"></a>

**重要**  
購入後にトレーニングプランを変更することはできません。
トレーニングプランは、 AWS アカウント間または組織内で AWS 共有することはできません。
+ トレーニングプランの提供内容を検索する場合、SageMaker トレーニングプランは [target resources](#training-plans-target-resources) に基づいて検索戦略を調整します。

  **SageMaker HyperPod クラスター**:
  + 提供内容は単一のアベイラビリティーゾーン (AZ) に制限されます。
  + これにより、クラスター内での一貫したネットワークパフォーマンスとデータローカル性が確保されます。

  **SageMaker トレーニングジョブ**:
  + 提供内容は、複数のアベイラビリティーゾーンにまたがることができます。
  + これは特に、プランの提供内容に複数の不連続なリザーブドキャパシティが含まれている場合に当てはまります。
  + 例えば、あるリザーブドキャパシティブロックの AZ-A のキャパシティと、別のリザーブドキャパシティブロックの AZ-B のキャパシティをプランに含めることができます。SageMaker トレーニングプランは、リソースの可用性に基づいて、アベイラビリティーゾーン (AZ) 間でワークロードを自動的に移動できます。

    トレーニングジョブに対するこのマルチ AZ アプローチにより、リソース割り当ての柔軟性が向上し、ワークロードに適したキャパシティが見つかる可能性が高まります。ただし、ジョブは予約期間のさまざまな部分で異なる AZ で実行される可能性があることに注意が必要です。
+ 2 ブロックの提供内容が提示される場合、ユーザーはこの分割配分がワークロード要件を満たしているかどうかを慎重に検討する必要があります。この場合、予約の非連続的な特質に対応するために、ジョブのスケジュールまたはワークロードの分散の調整が必要になる場合があります。

# SageMaker トレーニングプラン向け IAM
<a name="training-plan-iam-permissions"></a>

SageMaker トレーニングプランには、次の 2 つの異なるロールに対する特定のアクセス許可が必要です。

1. **プラン作成者ロール**: *プラン作成者*ロールを割り当てられたユーザーには、トレーニングプランの提供内容を検索して、新しいトレーニングプランを作成し、トレーニングプランを一覧表示して記述するためのアクセス許可が必要です。

1. **プランユーザーのロール**: *プランユーザー*のロールを持つユーザーには、SageMaker トレーニングジョブまたは SageMaker HyperPod クラスターを作成および更新する際にトレーニングプランを使用するためのアクセス許可が必要です。

SageMaker トレーニングプランを使用する前に、アクセス方法に基づいてアクセス許可を更新します。
+  AWS マネジメントコンソール または SageMaker SDKs ユーザーの場合: コンソールユーザーまたは API ユーザー用に設定された IAM ロールのアクセス許可を更新します。
+  AWS CLI ユーザーの場合: AWS CLI プロファイルが適切な認証情報とアクセス許可で正しく設定されていることを確認します。
+ JupyterLab などの Studio アプリケーションユーザーの場合、アプリケーションが使用するスペースに関連付けられた実行ロールに対するアクセス許可を設定します。

これらのアクセス許可は、マネージドポリシーまたは個別のよりきめ細かいアクセス許可を使用して設定できます。

ロールを更新する方法については、「[ロールに対するアクセス許可を更新する](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles_update-role-permissions.html)」を参照してください。実行ロールの検索方法と更新方法については、「[実行ロールを取得する](sagemaker-roles.md#sagemaker-roles-get-execution-role)」を参照してください。

**注記**  
管理者は、トレーニングプランを作成し、それに応じてアクセス許可を割り当てる必要があるユーザーを慎重に検討する必要があります。

## マネージドポリシー
<a name="training-plan-managed-policies"></a>
+ プラン作成者の場合: [https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerTrainingPlanCreateAccess.html](https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerTrainingPlanCreateAccess.html) は、トレーニング計画を作成および管理するためのアクセスを提供します。
+ プランユーザーの場合: [https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerFullAccess.html](https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerFullAccess.html) には、トレーニングプランを使用するためのアクセス許可が含まれます。

**注記**  
`AmazonSageMakerFullAccess` マネージドポリシーは、主に実験目的で使いやすさを重視したポリシーとして設計されています。トレーニングプランの使用など、SageMaker AI 機能への広範なアクセスを提供しますが、次の点に注意が必要です。  
このポリシーのアクセス許可の範囲は広いため、本番環境にはお勧めしません。
`CreateTrainingPlan` は前払いを必要とする管理アクションと見なされるため、トレーニングプランを作成するためのアクセス許可は含まれません。
本番環境のユースケースでは、最小権限の原則に準拠したカスタムポリシーを作成し、各ロールに必要な特定のアクセス許可のみを付与することを強くお勧めします。

## 個々のアクセス許可
<a name="training-plan-individual-permissions"></a>

ユーザーが SageMaker トレーニングプランで実行する必要がある特定のアクションに基づいて、ロールの IAM ポリシーステートメントで設定する必要がある詳細なアクセス許可の詳細は、以下のとおりです。

### トレーニングプランのアクセス許可のリスト
<a name="training-plan-individual-permissions-list"></a>
+ `SearchTrainingPlanOfferings`: このアクセス許可は、トレーニングプランの提供内容の検索をユーザーに許可します。

  ```
  {
    "Sid": "SearchTrainingPlanOfferingsPermissions",
    "Effect": "Allow",
    "Action": [
      "sagemaker:SearchTrainingPlanOfferings"
    ],
    "Resource": "*"
  }
  ```
+ `CreateTrainingPlan`: このアクセス許可は、新しいトレーニングプラン作成をユーザーに許可します。
**注記**  
また、`CreateReservedCapacity` と `AddTags` のアクセス許可を含め、`training-plan` リソースタイプと `reserved-capacity` リソースタイプの両方を指定する必要があります。

  ```
  {
    "Sid": "CreateTrainingPlanPermissions",
    "Effect": "Allow",
    "Action": [
      "sagemaker:CreateTrainingPlan",
      "sagemaker:CreateReservedCapacity",
      "sagemaker:AddTags"
    ],
    "Resource": [
      "arn:aws:sagemaker:*:*:training-plan/*",
      "arn:aws:sagemaker:*:*:reserved-capacity/*"
    ]
  }
  ```
+ `DescribeTrainingPlan`: このアクセス許可は、既存のトレーニングプランの詳細の表示をユーザーに許可します。

  ```
  {
    "Sid": "DescribeTrainingPlanPermissions",
    "Effect": "Allow",
    "Action": [
      "sagemaker:DescribeTrainingPlan"
    ],
    "Resource": [
      "arn:aws:sagemaker:::training-plan/*"
    ]
  }
  ```
+ `ListTrainingPlans`: このアクセス許可により、ユーザーは AWS 自分のアカウント内のすべてのトレーニングプランを一覧表示できます。

  ```
  {
    "Sid": "ListTrainingPlansPermissions",
    "Effect": "Allow",
    "Action": [
      "sagemaker:ListTrainingPlans"
    ],
    "Resource": "*"
  }
  ```

### ユーザータイプごとのアクセス許可
<a name="training-plan-permissions-per-user-type"></a>

このセクションでは、「[SageMaker トレーニングプラン向け IAM](#training-plan-iam-permissions)」セクションで説明されているとおり、各ロールに必要な個々のアクセス許可の詳細なを説明します。

プラン作成者には、次のアクセス許可が必要です。
+ `sagemaker:SearchTrainingPlanOfferings`
+ `sagemaker:CreateTrainingPlan`
+ `sagemaker:CreateReservedCapacity`
+ `sagemaker:AddTags`
+ `sagemaker:DescribeTrainingPlan`
+ `sagemaker:ListTrainingPlans`

プランユーザーには、次のアクセス許可が必要です。
+ `sagemaker:CreateTrainingJob` (SageMaker トレーニングジョブ用)
+ `sagemaker:CreateCluster` と `sagemaker:UpdateCluster` (SageMaker HyperPod 用)
+ `training-plan` リソースと `reserved-capacity` リソースへのアクセス、SageMaker トレーニングプランの IAM ポリシーを設定する際は、`training-plan` リソースと `reserved-capacity` リソースへのアクセス許可を含めます。これらのリソースは、SageMaker トレーニングジョブと SageMaker HyperPod クラスターの両方で必要です。これにより、IAM ロールに対して SageMaker トレーニングプランリソースとのやり取りと、リザーブドキャパシティの管理が許可されます。
  + SageMaker トレーニングジョブの場合、ポリシーに `"arn:aws:sagemaker:::training-plan/"` のリソース ARN と `"arn:aws:sagemaker:::reserved-capacity/"` のリソース ARN が含まれていることを確認します。

------
#### [ JSON ]

****  

```
{
  "Version":"2012-10-17",		 	 	 
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "sagemaker:CreateTrainingJob"
      ],
      "Resource": [
        "arn:aws:sagemaker:us-east-2:111122223333:training-job/",
        "arn:aws:sagemaker:us-east-2:111122223333:training-plan/",
        "arn:aws:sagemaker:us-east-2:111122223333:reserved-capacity/*"
      ]
    }
  ]
}
```

------

同様に、SageMaker HyperPod 設定には、クラスター固有のリソースに加えて、これらの同じ ARN を含めます。

------
#### [ JSON ]

****  

```
{
  "Version":"2012-10-17",		 	 	 
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "sagemaker:CreateCluster",
        "sagemaker:UpdateCluster"
      ],
      "Resource": [
        "arn:aws:sagemaker:us-east-2:111122223333:cluster/",
        "arn:aws:sagemaker:us-east-2:111122223333:training-plan/",
        "arn:aws:sagemaker:us-east-2:111122223333:reserved-capacity/*"
      ]
    }
  ]
}
```

------

# トレーニングプランの作成
<a name="training-plan-creation"></a>

SageMaker トレーニングプラン機能を使用してコンピューティングキャパシティを予約するには、次の手順に従います。

1. **ターゲットリソースを特定する: ** まず、SageMaker トレーニングジョブまたは SageMaker HyperPod クラスターのキャパシティが必要かどうかを判断します。

1. **キャパシティ要件を指定する:** キャパシティのニーズを詳細に定義します。これには、ワークロードに適したインスタンスタイプの選択、必要なインスタンス数の決定、使用期間の指定などがあります。特定の、期間 AWS リージョン、数量オプションでサポートされているインスタンスタイプについては、「」を参照してください[サポートされているインスタンスタイプ AWS リージョン、および料金](reserve-capacity-with-training-plans.md#training-plans-supported-instances-and-regions)。

1. **利用可能なトレーニングプランの提供内容を検索する: ** 要件を指定したら、SageMaker トレーニングプランの検索機能を使用して、単一または複数のセグメントで利用可能なトレーニングプランの提供内容を探します。キャパシティブロックの提供内容には、開始時刻、リザーブドキャパシティの具体的なアベイラビリティーゾーン、プランの料金などの詳細が記されています。コスト効率、地理的優先度、特定のニーズとの整合性などの要素を考慮して、これらの提供内容を検討します。

   適切なプランがない場合は、検索条件を調整して新しい提供内容セットを探します。

1. **適切な提供内容に基づいてトレーニングプランを作成する: **適切な提供内容を特定したら、トレーニングプランの作成に進みます。このプロセスでは、提供内容を選択し、予約を開始します。
   + トレーニングプランを予約すると、請求書が作成されます。
   + 合計金額の支払いは、フルフィルメントプロセスの一環として収集されます。支払いが完了すると、SageMaker トレーニングジョブをスケジュールしたり、HyperPod クラスターを作成したりするプランの準備が整います。

   SageMaker トレーニングジョブのトレーニングプランを使用する方法については、「[SageMaker トレーニングジョブのトレーニングプラン使用率](training-plan-utilization-for-training-jobs.md)」を参照してください。

    HyperPod クラスターのトレーニングプランを使用する方法については、「[Amazon SageMaker HyperPod クラスターのトレーニングプラン使用率](training-plan-utilization-for-hyperpod.md)」を参照してください。

トレーニングプランは、SageMaker AI コンソールまたはプログラムによる方法を使用して作成できます。SageMaker AI コンソールは、視覚的でグラフィカルなインターフェイスとオプションの包括的なビューを提供します。プログラムによる作成は、 AWS CLI または SageMaker SDKs を使用してトレーニングプラン API と直接やり取りできます。

コンソールのステップバイステップの手順と API リファレンスについては、このドキュメントの各セクションを参照してください。

**Topics**
+ [SageMaker AI コンソールを使用した SageMaker トレーニングプランの作成](training-plan-creation-using-console.md)
+ [SageMaker API を使用した SageMaker トレーニングプランの作成、または AWS CLI](training-plan-creation-using-api-cli-sdk.md)

# SageMaker AI コンソールを使用した SageMaker トレーニングプランの作成
<a name="training-plan-creation-using-console"></a>

SageMaker トレーニングプランは、SageMaker AI コンソール UI を介してトレーニングプランを作成する便利な方法を提供し、ユーザーは機械学習トレーニングリソースを簡単にスケジュールできます。このガイドでは、SageMaker AI コンソールを使用して SageMaker トレーニングジョブと SageMaker HyperPod クラスターのトレーニングプランを作成するプロセスについて説明します。これらの手順に従って、トレーニングプランの提供を検索し、利用可能なオプションを確認して、ニーズに最適なプランを購入します。

UI を使用してトレーニングプランを視覚的に作成するには:

1. SageMaker AI コンソール ([https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/)) に移動することから始めます。

1. 左側のペインメニューで **[トレーニングプラン]** を選択します。

1. そこから、メインコンテンツエリアの **[トレーニングプランの作成]** ボタンをクリックして、カスタマイズされたトレーニングスケジュールを設定するプロセスを開始します。

![\[トレーニングプランページを表示する SageMaker AI コンソール インターフェイスには、プランをリクエスト、モニタリング、使用するステップなど、トレーニングプランの仕組みに関する情報が表示されます。左側のナビゲーションペインで「トレーニングプラン」オプションが強調表示され、「トレーニングプランの作成」ボタンがメインコンテンツエリアに表示されます。\]](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/images/training-plans/tp-console.png)


次に、コンピューティング要件に合ったプランの提供内容を検索します。

**Topics**
+ [トレーニングプランの提供内容を検索する](search-training-plan-offerings.md)
+ [最適なトレーニングプランを予約する](choose-best-training-plan.md)
+ [トレーニングジョブを一覧表示する](list-training-plans.md)
+ [トレーニングプランの詳細を表示する](training-plan-details.md)

# トレーニングプランの提供内容を検索する
<a name="search-training-plan-offerings"></a>

SageMaker AI コンソールの左ペインで、**[トレーニングプラン]** を選択すると、**[トレーニングプランの作成]** と、**[トレーニングプランを検索]** フォームが開きます。このフォームを使用すると、要件を指定し、適切なトレーニングプランの提供内容を検索できます。

以下のとおり、手順に従ってフォームに記入します。

1. **[ターゲット]** を特定する: トレーニングプランはターゲットリソースに固有です。プランを使用して SageMaker トレーニングジョブを実行するか、SageMaker HyperPod クラスターを実行するかを指定します。

1. **[コンピューティングタイプ]** では、**[インスタンス]** または **[UltraServer]** のどちらかを選択できます。UltraServer は、低レイテンシー、高帯域幅のアクセラレーター相互接続内で複数の Amazon EC2 インスタンスを接続します。詳細については、「[Amazon EC2 UltraServers](https://aws.amazon.com/ec2/ultraservers/)」を参照してください。SageMaker AI で UltraServer を使用する方法については、「[SageMaker AI での UltraServer](reserve-capacity-with-training-plans.md#training-plans-ultraservers)」を参照してください。

1. 任意の**インスタンスタイプ**と**インスタンス数**を選択する: 特定の、期間 AWS リージョン、数量オプションで使用可能なインスタンスタイプについては、「」を参照してください[サポートされているインスタンスタイプ AWS リージョン、および料金](reserve-capacity-with-training-plans.md#training-plans-supported-instances-and-regions)。

1. 時間パラメータを定義する: 必要な開始日と終了日を選択し、このウィンドウ内でプランの期間を指定します。

1. **[トレーニングプランを検索]** をクリックします。

![\[[トレーニングプランの提供内容を検索する] ページを表示する SageMaker AI コンソール インターフェイスには、プランのターゲットリソース (トレーニングジョブまたは HyperPod クラスター) の選択、インスタンスタイプとカウントの指定、開始日と終了日の設定、入力期間のオプションが表示されます。[トレーニングプランを検索] ボタンは、フォームの下部に表示されます。\]](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/images/training-plans/tp-search-training-plan-offerings.png)


SageMaker トレーニングプランは、キャパシティ要件に合ったサービスを検索します。指定した期間内に一致が見つかると、ページの下部に表示されます。各トレーニングプランには、以下の詳細が含まれています。
+ プラン期間合計
+ 開始日と終了日
+ 前払い料金合計: 

  料金にカーソルを合わせると、インスタンスの時間料金、インスタンス数、合計時間の詳細な内訳が表示されます。
+ プランのセグメント合計数

セグメントの詳細リンクをクリックすると、セグメント固有の詳細を表示するモーダルビューが開きます。
+ 時間
+ 開始日と終了日
+ アベイラビリティーゾーン

![\[SageMaker AI コンソールには、プラン要件の入力フィールドを含む [トレーニングプランの提供内容を検索する] ページが表示され、[ご利用可能なプラン] セクションには、期間、料金、可用性ステータスが異なる 3 つの検出されたプランの詳細が表示されます。\]](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/images/training-plans/tp-available-offerings.png)


適切なプランが見つからない場合、または利用可能なプランがニーズを満たさない場合は、**[トレーニングプランの要件]** フォームのパラメータを変更して検索条件を調整します。適切な提供内容が見つかったら、それを選択し、**[次へ]** をクリックしてプランの予約ページに進みます。このページでは、プランに名前を付け、予約を確定する前に選択内容を確認して確定できます。

**注記**  
`Immediately available` とマークされたプランは、支払いがスケジュールされた開始時刻の 5 分以上前に完了すれば、30 分以内に開始できます。

# 最適なトレーニングプランを予約する
<a name="choose-best-training-plan"></a>

トレーニングプランの検索により、キャパシティのニーズと予算に合ったサービスが返されました。

1. プランの名前を入力し、**[次へ]** をクリックします。

1. 注文内容を確認し、**[購入]** をクリックします。
**重要**  
購入後にトレーニングプランを変更することはできません。
トレーニングプランは、 AWS アカウント間または組織内で AWS 共有することはできません。

   注文の送信後
   + トレーニングプランは、トレーニングプランリストに最初は `Pending` として表示されます。
   + 請求書は、注文を受け取ると自動的に生成されます。
   + 支払い合計額は、フルフィルメントプロセス中に収集されます。
   + 支払いが正常に処理されると、プランのステータスは `Scheduled` に変わり、プランを使用できるようになります。

![\[トレーニングプランの「レビューと購入」ページを表示する SageMaker AI コンソール このページには、トレーニングプランの詳細、セグメント情報、料金、プラン名、タグが表示されます。プランを編集、キャンセル、戻る、または作成するオプションを使用できます。\]](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/images/training-plans/tp-review-and-purchase-training-plan.png)


# トレーニングジョブを一覧表示する
<a name="list-training-plans"></a>

トレーニングプランを表示するには:

1. SageMaker AI コンソール ([https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/)) に移動します。

1. 左側のペインメニューで **[トレーニングプラン]** を選択します。これにより、名前、ステータス、ターゲットリソースタイプ、その他の主要な詳細など、すべてのトレーニングプランのリストが表示されます。

   プランを購入すると、このリストが表示されます。新しく作成されたプランは、支払いが完了するまで `Pending` ステータスで表示されます。通常、ステータスは支払い処理から数分以内に更新されます。

![\[トレーニングプランのリストページを表示する SageMaker AI コンソール このページには、名前、ステータス、合計インスタンス、使用中インスタンス、ゾーン、開始日、終了日などの詳細を含むトレーニングプランを一覧表示した表が含まれています。新しいトレーニングプランを作成するボタンが表示されます。\]](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/images/training-plans/tp-list-training-plans.png)


# トレーニングプランの詳細を表示する
<a name="training-plan-details"></a>

トレーニングプラン一覧から、プランの名前に合った詳細を表示します。具体的には、現在のキャパシティの使用率を確認し、プランの詳細ページにワークロードを一覧表示できます。

詳細ページには以下が表示されます。
+ トレーニングプランの概要: ステータス、ターゲット、インスタンスタイプ、期間。
+ セグメントの詳細、料金、プラン名、タグの展開可能なセクション。
+ キャパシティ使用率:
  + 合計: このトレーニングプランで予約されたインスタンスの合計数。
  + 使用中: このトレーニングプランで現在使用されているインスタンスの数。
  + 使用可能なインスタンス: このトレーニングプランで現在利用可能なインスタンスの数。

ページの下部にあるリンクを使用すると、ターゲットリソースに応じて、このプランに関連付けられているトレーニングジョブまたは SageMaker HyperPod クラスターインスタンスグループのリストを表示できます。

![\[トレーニングプランの詳細を表示する SageMaker AI コンソールページ このページには、基本的な計画情報、ステータス、インスタンスの詳細が表示されます。詳細については、以下の展開可能なセクションを参照してください。下部のキャパシティ使用率セクションには、プランの合計数、使用中の数、使用可能なインスタンス数が表示されます。\]](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/images/training-plans/tp-view-training-plan.png)


# SageMaker API を使用した SageMaker トレーニングプランの作成、または AWS CLI
<a name="training-plan-creation-using-api-cli-sdk"></a>

SageMaker トレーニングプランは、API を介したトレーニングプランのプログラムによる作成をサポートしています。 AWS CLI または SageMaker SDKs を使用して、トレーニングプラン API を操作できます。

SageMaker トレーニングプランの API アクションは、トレーニングプランをプログラムで管理するための包括的なワークフローを提供します。
+ **`SearchTrainingPlanOfferings`：** インスタンスタイプ、カウント、希望する時間枠などのパラメータを指定することで、使用可能なコンピューティングリソースをクエリして検出できます。API は、ユーザーの要件に最も適したトレーニングプラン提供のランク付けされたリストを返します。
+ **`CreateTrainingPlan`:** 特定のトレーニングプランの提供内容を予約できるようにし、潜在的なコンピューティングキャパシティを、一意のトレーニングプラン ARN を使用してスケジュールされたリザーブドキャパシティに変換します。
+ **`ListTrainingPlans`:** オプションのフィルタリングとソート機能を使用して、ユーザーの AWS アカウント内のすべての既存のトレーニングプランを取得して確認する方法を提供します。
+ **`DescribeTrainingPlan`:** `Pending` から `Active`、`Expired` までのライフサイクルステージなど、特定のトレーニングプランに関する詳細なインサイトを提供します。
+ **`ExtendTrainingPlan`:** 拡張サービスを購入して既存のトレーニングプランを拡張します。詳細については、「[トレーニングプランの拡張](training-plan-extension.md)」を参照してください。
+ **`DescribeTrainingPlanExtensionHistory`:** トレーニングプランの拡張履歴を取得します。詳細については、「[トレーニングプランの拡張](training-plan-extension.md)」を参照してください。

**Topics**
+ [トレーニングプランの提供内容を検索する](search-training-plan-offerings-api-cli-sdk.md)
+ [最適なトレーニングプランを予約する](choose-best-training-plan-using-api-cli-sdk.md)
+ [トレーニングジョブを一覧表示する](list-training-plans-using-api-cli-sdk.md)
+ [トレーニングプランの詳細を表示する](training-plan-details-using-api-cli-sdk.md)

# トレーニングプランの提供内容を検索する
<a name="search-training-plan-offerings-api-cli-sdk"></a>

トレーニングプランを作成するには、まず [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html) API オペレーションを呼び出し、プランの要件 (インスタンスタイプ、カウント、希望する期間など) を入力パラメータとして渡します。トレーニングプランはターゲットリソースに固有です。プランを使用するターゲットリソース (`training-job` または `hyperpod-cluster`) は必ず指定します。API は、要件に一致する利用可能なサービスのリストを返します。適切な提供内容が見つからない場合は、要件を調整して再度検索する必要がある場合があります。

この API コールは、キャパシティのニーズに最適なトレーニングプランサービスを取得します。レスポンスで返される各 [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TrainingPlanOffering.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TrainingPlanOffering.html) は、一意の提供内容 ID によって識別されます。リストの最初の提供内容は、要件に最適な内容です。指定された日付内に適切なトレーニングプランが利用できない場合、空のリストが表示されます。検索条件を調整し、新しいサービスセットを探します。
+ 予約期間は 1～182 日間で 1 日単位で利用できます。
+ 予約インスタンスの数量オプションは、1、2、4、8、16、32、64 です。

SageMaker トレーニングプランでサポートされている使用可能なインスタンスのリストについては、「[サポートされているインスタンスタイプ AWS リージョン、および料金](reserve-capacity-with-training-plans.md#training-plans-supported-instances-and-regions)」を参照してください。

次の の例では、 AWS CLI コマンドを使用して、指定されたインスタンスタイプ、カウント、時間情報を含むトレーニングプランサービスをリクエストします。

```
# List training plan offerings with instance type, instance count, duration in hours, start time after, and end time before.
aws sagemaker search-training-plan-offerings \
--target-resources "training-job" \
--instance-type "ml.p4d.24xlarge" \
--instance-count 1 \
--duration-hours 15 \
--start-time-after "1737484800"
--end-time-before "1737657600"
```

この JSON ドキュメントは、SageMaker トレーニングプラン API からのサンプルレスポンスです。レスポンスは、指定されたキャパシティ要件に一致する複数の利用可能なトレーニングプランの提供に関する情報を提供します。これには、期間、前払い料金、開始/終了時間が異なる 3 つの異なるサービスが含まれており、すべて同じインスタンスタイプを使用し、トレーニングジョブを対象としています。

```
{
    "TrainingPlanOfferings": [
        {
            "TrainingPlanOfferingId": "tpo-SHA-256-hash-value",
            "TargetResources": [
                "training-job"
            ],
            "RequestedStartTimeAfter": "2025-01-21T11:08:27.704000-08:00",
            "DurationHours": 15,
            "DurationMinutes": 51,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD",
            "ReservedCapacityOfferings": [
                {
                    "InstanceType": "ml.p4d.24xlarge",
                    "InstanceCount": 1,
                    "AvailabilityZone": "us-west-2a",
                    "DurationHours": 15,
                    "DurationMinutes": 51,
                    "StartTime": "2025-01-21T11:39:00-08:00",
                    "EndTime": "2025-01-22T03:30:00-08:00"
                }
            ]
        },
        {
            "TrainingPlanOfferingId": "tpo-SHA-256-hash-value",
            "TargetResources": [
                "training-job"
            ],
            "RequestedStartTimeAfter": "2025-01-21T11:08:27.704000-08:00",
            "DurationHours": 39,
            "DurationMinutes": 51,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD",
            "ReservedCapacityOfferings": [
                {
                    "InstanceType": "ml.p4d.24xlarge",
                    "InstanceCount": 1,
                    "AvailabilityZone": "us-west-2a",
                    "DurationHours": 39,
                    "DurationMinutes": 51,
                    "StartTime": "2025-01-21T11:39:00-08:00",
                    "EndTime": "2025-01-23T03:30:00-08:00"
                }
            ]
        },
        {
            "TrainingPlanOfferingId": "tpo-SHA-256-hash-value",
            "TargetResources": [
                "training-job"
            ],
            "RequestedStartTimeAfter": "2025-01-21T11:08:27.704000-08:00",
            "DurationHours": 24,
            "DurationMinutes": 0,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD",
            "ReservedCapacityOfferings": [
                {
                    "InstanceType": "ml.p4d.24xlarge",
                    "InstanceCount": 1,
                    "AvailabilityZone": "us-west-2a",
                    "DurationHours": 24,
                    "DurationMinutes": 0,
                    "StartTime": "2025-01-22T03:30:00-08:00",
                    "EndTime": "2025-01-23T03:30:00-08:00"
                }
            ]
        }
    ]
}
```

以下は、 を使用して UltraServers を含むトレーニングプランサービス AWS CLI を検索する方法のサンプルコマンドです。

```
aws sagemaker search-training-plan-offerings \
--ultra-server-type ml.c6i-32xlargesc \
--ultra-server-count 1 \
--duration-hours 24 \
--target-resources hyperpod-cluster
--start-time-after "1737484800" \
--end-time-before "1737657600"
```

```
{
    "TrainingPlanOfferings": [
        {
            "TrainingPlanOfferingId": "tpo-SHA-256-hash-value",
            "TargetResources": [
                "training-job"
            ],
            "RequestedStartTimeAfter": "2025-07-21T16:59:25.760000+00:00",
            "DurationHours": 24,
            "DurationMinutes": 0,
            "UpfrontFee": "0.24",
            "CurrencyCode": "USD",
            "ReservedCapacityOfferings": [
                {
                    "ReservedCapacityType": "UltraServer",
                    "UltraServerType": "ml.u-p6e-gb200x72",
                    "UltraServerCount": 1,
                    "InstanceType": "ml.p6e-gb200.36xlarge",
                    "InstanceCount": 18,
                    "AvailabilityZone": "us-east-2a",
                    "DurationHours": 24,
                    "DurationMinutes": 0,
                    "StartTime": "2025-07-22T11:30:00+00:00",
                    "EndTime": "2025-07-23T11:30:00+00:00"
                }
            ]
        }
    ]
}
```

以下のセクションでは、時系列予測に使用される `SearchTrainingPlanOfferings` API の必須およびオプションの入力リクエストパラメータを定義します。

## 必須パラメータ
<a name="search-training-plan-options-required-params"></a>

[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html) API を呼び出して、要件を満たすトレーニングプランサービスを一覧表示する場合は、次の値を指定する必要があります。
+ `TargetResources`: プランが使用されるターゲットリソース (`training-job` または `hyperpod-cluster`)。デフォルト値は `training-job` です。トレーニングプランはターゲットリソースに固有です。
  + SageMaker トレーニングジョブ用に設計されたトレーニングプランは、トレーニングジョブのスケジュールと実行にのみ使用できます。
  + HyperPod クラスターのトレーニングプランは、クラスターのインスタンスグループにコンピューティングリソースを提供するためにのみ使用できます。
+ `InstanceType`: プロビジョンするインスタンスのタイプ。`InstanceType` はサポートされているタイプである必要があります。

  SageMaker トレーニングプランでサポートされている使用可能なインスタンスのリストについては、「[サポートされているインスタンスタイプ AWS リージョン、および料金](reserve-capacity-with-training-plans.md#training-plans-supported-instances-and-regions)」を参照してください。
+ `InstanceCount`: プロビジョンするインスタンス数。インスタンスの数が 1 より大きい場合は、2 の累乗である必要があります。
+ `DurationHour`: リクエストされたプランの合計時間数。`DurationHour` は、24 の最も近い倍数に切り上げられます。

## 任意指定のパラメータ
<a name="search-training-plan-options-optional-params"></a>

次のセクションでは、表形式データを使用する場合に `SearchTrainingPlanOfferings` API アクションに渡すことができるいくつかのオプションのパラメータの詳細を説明します。
+ `StartTimeAfter`: プランでリクエストする開始時刻を指定します。`StartTimeAfter` は、将来の `timestamp` または将来の `ISO 8601 date/time` の値にする必要があります。
+ `EndTimeBefore`: プランのリクエストされた終了時刻を `timestamp` または `ISO 8601 date/time` 形式で指定します。`EndTimeBefore` は、開始時刻 から 24 時間以上後とする必要があります。
+ `UltraServerType` : 検索する UltraServer のタイプを指定します。UltraServer の詳細については、「[SageMaker AI での UltraServer](reserve-capacity-with-training-plans.md#training-plans-ultraservers)」を参照してください。
+ `UltraServerCount`: 検索する UltraServer の数を指定します。

# 最適なトレーニングプランを予約する
<a name="choose-best-training-plan-using-api-cli-sdk"></a>

要件に最適な利用可能なトレーニングプランの内容を確認したら、[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html) API オペレーションを呼び出して特定のプランを予約できます。作成されると、プランは最初に `Pending` 状態になり、予約プロセスが完了するまでその状態のままになります。API コールへのレスポンスは、トレーニングプランの Amazon リソースネーム (ARN) を返します。この ARN は、後で追跡とモニタリングの目的で利用するために書き留めておきます。トレーニングプランの予約は、バックエンドで非同期的に実行されます。合計金額の支払いは、フルフィルメントプロセスの一環として自動的に収集されます。支払いトランザクションが完了し、リクエストされたリザーブドキャパシティが保護されると、トレーニングプランは `Scheduled` 状態に設定され、スケジューリングの準備が整います。

**重要**  
購入後にトレーニングプランを変更することはできません。
トレーニングプランは、 AWS アカウント間または組織内で AWS 共有することはできません。

次の例では、 AWS CLI コマンドを使用して特定のトレーニングプランをリクエストし、プラン ID をパラメータとして渡します。

```
aws sagemaker create-training-plan \
--training-plan-offering-id "tpo-SHA-256-hash-value" \
--training-plan-name "name" \
```

この JSON ドキュメントは、SageMaker トレーニングプラン API からのサンプルレスポンスです。レスポンスには、正常に作成されたトレーニングプランの Amazon リソースネーム (ARN) が含まれます。

**注記**  
トレーニングプランは、フルフィルメントプロセスが完了するまで `Pending` ステータスのままです。

```
{
   "TrainingPlanArn":"arn:aws:sagemaker:us-east-1:123456789123:training-plan/large-models-fine-tuning"
}
```

以下のセクションでは、時系列予測に使用される [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html) API の必須およびオプションの入力リクエストパラメータを定義します。

## 必須パラメータ
<a name="choose-best-training-plan-using-api-cli-sdk-required-params"></a>

[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html) API を呼び出して特定のトレーニングプランを予約する場合は、次の値を指定する必要があります。
+ `TrainingPlanOfferingId`: 選択したプランの ID。プランの提供内容の ID は、`SearchTrainingPlanOfferings` API コールのレスポンスで取得できます。形式は `pto-*` で始まる必要があります。
+ `TrainingPlanName`: 作成するプランの名前。

# トレーニングジョブを一覧表示する
<a name="list-training-plans-using-api-cli-sdk"></a>

[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ListTrainingPlans.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ListTrainingPlans.html) API を呼び出すことで、 AWS アカウントとリージョンで作成されたすべてのトレーニングプランを一覧表示できます。

次の例では、 AWS CLI コマンドを使用してトレーニングプランのリストを取得します。

```
aws sagemaker list-training-plans \
--start-time-after "2024-09-26T00:00:01.000Z"
```

この JSON ドキュメントは、SageMaker トレーニングプラン API からのサンプルレスポンスです。レスポンスは、正常に作成されて予約された単一のトレーニングプランに関する詳細を提供します。

```
{
   "[TrainingPlanSummaries](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TrainingPlanSummary.html)": [ 
      { 
         "AvailableInstanceCount": 2,
         "CurrencyCode": "USD",
         "DurationHours": 48,
         "DurationMinutes": 0,
         "EndTime": "2024-09-28T04:30:00-07:00",
         "InUseInstanceCount": 2,
         "[ReservedCapacitySummaries](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ReservedCapacitySummary.html)": [ 
            { 
               "AvailabilityZone": "string",
               "DurationHours": 48,
               "DurationMinutes": 0,
               "EndTime": "2024-09-28T04:30:00-07:00",
               "InstanceType": "ml.p5.48xlarge",
               "ReservedCapacityArn": "arn:aws:sagemaker:us-east-1:123456789123:reserved-capacity/large-models-fine-tuning-rc1",
               "StartTime": "2024-09-26T04:30:00-07:00",
               "Status": "Scheduled",
               "TotalInstanceCount": 4,
               "UltraServerCount": 4,
               "UltraServerType": "ml.p6e-gb200.36xlarge"
            }
         ],
         "StartTime": "2024-09-26T04:30:00-07:00",
         "Status": "Scheduled",
         "StatusMessage": "Payment confirmed, training plan scheduled."
         "TargetResources": [ "training-job" ],
         "TotalInstanceCount": 4,
         "TotalUltraServerCount": 4,
         "TrainingPlanArn": "arn:aws:sagemaker:us-east-1:123456789123:training-plan/large-models-fine-tuning",
         "TrainingPlanName": "large-models-fine-tuning",
         "UpfrontFee": "xxxx.xx"
      }
   ]
}
```

次のセクションでは、表形式データを使用する場合に `ListTrainingPlans` API アクションに渡すことができるいくつかのオプションのパラメータの詳細を説明します。

## 任意指定のパラメータ
<a name="list-training-plans-optional-params"></a>

次のセクションでは、表形式データを使用する場合に `ListTrainingPlans` API アクションに渡すことができるいくつかのオプションのパラメータの詳細を説明します。
+ `StartTimeAfter`: リストされたプランの実際の期間の開始時刻。`timestamp` または `ISO 8601 date/time` で指定します。
+ `StartTimeBefore`: リストされたプランの実際の期間の終了時刻。`timestamp` または `ISO 8601 date/time` で指定します。
+ `Filters`: 結果をフィルタリングするための条件。最大 5 つの名前と値のペアを指定できます。「名前」は [TrainingPlanSummary](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TrainingPlanSummary.html) のフィールド名、「値」はフィルターの対象となる値です。例: `Name=Status,Value=Active`。

次の例では、 AWS CLI コマンドを使用して、上記のオプションパラメータの一部を使用してトレーニングプランのリストを取得します。

```
aws sagemaker list-training-plans --max-results 10 --sort-by StartTime --sort-order Descending --start-time-after 13000000 --filters Name=Status,Value=Active
```

# トレーニングプランの詳細を表示する
<a name="training-plan-details-using-api-cli-sdk"></a>

トレーニングプランのステータスをモニタリングしたり、詳細を取得したりするには、[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlan.html) API を使用できます。API レスポンスには、トレーニングプランの現在の状態を反映する `Status` フィールドが含まれます。
+ プランの購入が失敗した場合、ステータスは `Failed` に設定されます。
+ 支払いが成功すると、プランの開始日に基づいて、ステータスが `Scheduled` から `Pending` に移行します。
+ プランの開始日になると、ステータスは `Active` に変わります。
+ 複数の非連続のリザーブドキャパシティを持つプランの場合、ステータスは、次のリザーブドキャパシティの開始日まで、アクティブな期間の間は `Scheduled` に戻ります。
+ プランの終了日後、ステータスは `Expired` になります。

ステータスが `Scheduled` になったら、SageMaker トレーニングジョブまたは HyperPod クラスターワークロードのプランで予約されているキャパシティを利用できます。

**注記**  
プランに関連付けられたトレーニングジョブは、プランが `Active` になるまで `Pending` ステータスのままになります。
コンピューティングキャパシティのトレーニングプランを使用する HyperPod クラスターの場合、インスタンスグループのステータスは作成後に `InService` として表示されます。

次の例では、 AWS CLI コマンドを使用して、トレーニングプランの詳細をその名前で取得します。

```
aws sagemaker describe-training-plan \
--training-plan-name "name"
```

この JSON ドキュメントは、SageMaker トレーニングプラン API からのサンプルレスポンスです。このレスポンスは、正常に作成された単一のトレーニングプランに関する詳細を提供します。

```
      { 
         "AvailableInstanceCount": 2,
         "CurrencyCode": "USD",
         "DurationHours": 48,
         "DurationMinutes": 0,
         "EndTime": "2024-09-28T04:30:00-07:00",
         "InUseInstanceCount": 2,
         "[ReservedCapacitySummaries](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ReservedCapacitySummary.html)": [ 
            { 
               "AvailabilityZone": "string",
               "DurationHours": 48,
               "DurationMinutes": 0,
               "EndTime": "2024-09-28T04:30:00-07:00",
               "InstanceType": "ml.p5.48xlarge",
               "ReservedCapacityArn": "arn:aws:sagemaker:us-east-1:123456789123:reserved-capacity/large-models-fine-tuning-rc1",
               "StartTime": "2024-09-26T04:30:00-07:00",
               "Status": "Scheduled",
               "TotalInstanceCount": 4,
               "UltraServerCount": 4,
               "UltraServerType": "ml.p6e-gb200.36xlarge"
            }
         ],
         "StartTime": "2024-09-26T04:30:00-07:00",
         "Status": "Scheduled",
         "StatusMessage": "Payment confirmed, training plan scheduled."
         "TargetResources": [ "training-job" ],
         "TotalInstanceCount": 4,
         "TotalUltraServerCount": 4,
         "TrainingPlanArn": "arn:aws:sagemaker:us-east-1:123456789123:training-plan/large-models-fine-tuning",
         "TrainingPlanName": "large-models-fine-tuning",
         "UpfrontFee": "xxxx.xx"
      }
```

次のセクションでは、`DescribeTrainingPlan` API オペレーションの必須入力リクエストパラメータを定義します。

## 必須パラメータ
<a name="training-plan-details-required-params"></a>
+ `TrainingPlanName`: 記述するトレーニングプランの名前。

# トレーニングプランの拡張
<a name="training-plan-extension"></a>

SageMaker トレーニングプランを使用すると、ワークロードの中断を避けるために既存のトレーニングプランを拡張できます。トレーニングプランの有効期限が近づいたら、SageMaker AI コンソールから直接、または API または を使用してプログラムで拡張できます AWS CLI。これにより、新しいプランを作成し、新しいトレーニングプラン ARN でワークロードを再設定する必要がなくなります。

トレーニングプラン拡張機能を使用すると、実行中の SageMaker トレーニングジョブまたは SageMaker HyperPod クラスターは、プランが拡張された後も中断することなくシームレスに動作し続けます。拡張プランには新しい終了日が反映され、トレーニングプランのすべての拡張の履歴を取得できます。

**重要**  
拡張をキャンセルまたは変更してインスタンスを追加または削除することはできません。

## 主な特徴
<a name="training-plan-extension-features"></a>
+ コンソールまたは API を使用してトレーニングプランを拡張する
+ プランを 1 日単位で最大 14 日間、または 7 日単位で最大 182 日間延長する
+ プランを何度でも拡張する
+ コンソールまたは API を使用してトレーニングプランの拡張履歴を表示/一覧表示する
+ 再設定なしで SageMaker AI でワークロードを実行するシームレスな継続

## 前提条件
<a name="training-plan-extension-prerequisites"></a>

トレーニングプランを拡張する前に、以下を確認してください。
+ トレーニングプランのステータスは `Active`または である必要があります`Scheduled`。
+ プランのステータスに拡張機能があってはなりません`Payment Pending`。
+ 延長は、プランの有効期限が切れる少なくとも 1 時間または最大 56 日前にリクエストできます。

**Topics**
+ [主な特徴](#training-plan-extension-features)
+ [前提条件](#training-plan-extension-prerequisites)
+ [SageMaker AI コンソールを使用してトレーニングプランを拡張する](training-plan-extension-using-console.md)
+ [SageMaker API または を使用してトレーニングプランを拡張する AWS CLI](training-plan-extension-using-api-cli-sdk.md)

# SageMaker AI コンソールを使用してトレーニングプランを拡張する
<a name="training-plan-extension-using-console"></a>

SageMaker トレーニングプランは、SageMaker AI コンソール UI を使用して既存のトレーニングプランを拡張する便利な方法を提供します。このガイドでは、SageMaker AI コンソールを使用して SageMaker トレーニングジョブと SageMaker HyperPod クラスターのトレーニングプランを拡張するプロセスについて説明します。 SageMaker 

コンソールを使用してトレーニングプランを拡張するには:

1. SageMaker AI コンソール ([https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/)) に移動します。

1. 左側のナビゲーションペイン**でトレーニングプラン**を選択します。

1. リストから拡張するトレーニングプランを選択します。

1. **拡張**ボタンを選択します。

1. 拡張機能の終了日を入力し、**検索**を選択して利用可能な拡張機能を検索します。

1. 期間、アベイラビリティーゾーン、前払い料金、開始時刻と終了時刻などの詳細を含む拡張機能のリストを確認します。

1. 要件に最も適した拡張機能を選択します。

1. 確認ダイアログで拡張機能の詳細を確認し、**送信**を選択して購入を確認します。

拡張機能を購入すると、新しい延長期間を反映するようにトレーニングプランの終了日が更新されます。

## 拡張履歴の表示
<a name="training-plan-extension-history-console"></a>

トレーニングプランの拡張履歴を表示するには:

1. SageMaker AI コンソールの**トレーニングプラン**ページに移動します。

1. 表示するトレーニングプランを選択します。

1. トレーニングプランの詳細ページで、**拡張機能**セクションを表示して、拡張機能提供 ID、開始日と終了日、ステータス、拡張機能が作成された日時など、過去の拡張機能をすべて表示します。

## 拡張ステータス値
<a name="training-plan-extension-status-values-console"></a>

拡張機能のステータス値は次のとおりです。
+ `Pending`: 拡張機能がリクエストされ、支払い処理を待っています。
+ `Active`: 拡張機能は正常に購入され、アクティブになっています。
+ `Scheduled`: 拡張機能は今後開始される予定です。
+ `Failed`: 拡張機能の購入に失敗しました (支払いの問題など）。
+ `Expired`: 延長期間が終了しました。

# SageMaker API または を使用してトレーニングプランを拡張する AWS CLI
<a name="training-plan-extension-using-api-cli-sdk"></a>

SageMaker トレーニングプランは、API を通じてプログラムでトレーニングプランを拡張することをサポートしています。 AWS CLI または SageMaker SDKs を使用して、トレーニングプラン API を操作できます。

トレーニングプランの拡張には、次の API アクションが含まれます。
+ **`SearchTrainingPlanOfferings`:** トレーニングプランの ARN と必要な拡張期間を指定して、使用可能な拡張サービスを検索します。API は、 `TrainingPlanExtensionOfferings`フィールドに拡張機能を返します。
+ **`ExtendTrainingPlan`:** 特定の拡張機能を購入して、 を指定してトレーニングプランを拡張します`TrainingPlanExtensionOfferingId`。これにより、追加のコンピューティング容量が予約され、トレーニングプランの終了日が更新されます。
+ **`DescribeTrainingPlanExtensionHistory`:** ステータス、日付、支払い情報を含む過去のすべての拡張を含む、トレーニングプランの完全な拡張履歴を表示します。

**Topics**
+ [拡張機能を検索する](search-extension-offerings-api-cli-sdk.md)
+ [拡張機能を購入する](extend-training-plan-api-cli-sdk.md)
+ [拡張履歴の表示](describe-extension-history-api-cli-sdk.md)

# 拡張機能を検索する
<a name="search-extension-offerings-api-cli-sdk"></a>

API を `TrainingPlanArn`パラメータ[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html)とともに使用して、トレーニングプランで使用できる拡張機能を見つけます。

次の例では、 AWS CLI コマンドを使用して、既存のトレーニングプランの拡張機能を検索します。

```
aws sagemaker search-training-plan-offerings \
--training-plan-arn "arn:aws:sagemaker:us-east-2:123456789012:training-plan/my-training-plan" \
--duration-hours 48
```

この JSON ドキュメントは、SageMaker トレーニングプラン API からのサンプルレスポンスです。レスポンスには、指定されたトレーニングプランで利用可能な拡張機能`TrainingPlanExtensionOfferings`が含まれます。

```
{
    "TrainingPlanOfferings": [],
    "TrainingPlanExtensionOfferings": [
        {
            "TrainingPlanExtensionOfferingId": "tpeo-SHA-256-hash-value",
            "AvailabilityZone": "us-east-2a",
            "StartDate": "2025-09-23T12:00:00Z",
            "EndDate": "2025-09-25T12:00:00Z",
            "DurationHours": 48,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD"
        }
    ]
}
```

以下のセクションでは、拡張機能を検索するときに `SearchTrainingPlanOfferings` API オペレーションの必須およびオプションの入力リクエストパラメータを定義します。

## 必須パラメータ
<a name="search-extension-offerings-required-params"></a>

[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html) API を呼び出して拡張機能を検索する場合は、次の値を指定する必要があります。
+ `TrainingPlanArn`: 拡張するトレーニングプランの 。は、ステータスが `Active`または の既存のトレーニングプランを参照`TrainingPlanArn`する必要があります`Scheduled`。

## 任意指定のパラメータ
<a name="search-extension-offerings-optional-params"></a>

以下のセクションでは、拡張機能を検索するときに `SearchTrainingPlanOfferings` API リクエストに渡すことができるオプションパラメータの詳細について説明します。
+ `DurationHours`: 拡張機能に必要な時間単位の期間。`DurationHours` は、24 の最も近い倍数に切り上げられます。

# 拡張機能を購入する
<a name="extend-training-plan-api-cli-sdk"></a>

拡張機能を選択したら、 [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html) API を使用して拡張機能を購入します。

次の例では、 AWS CLI コマンドを使用してトレーニングプランを拡張します。

```
aws sagemaker extend-training-plan \
--training-plan-extension-offering-id "tpeo-SHA-256-hash-value"
```

この JSON ドキュメントは、SageMaker トレーニングプラン API からのサンプルレスポンスです。レスポンスには、トレーニングプランの拡張機能のリストが含まれます。

```
{
    "TrainingPlanExtensions": [
        {
            "TrainingPlanExtensionOfferingId": "tpeo-SHA-256-hash-value",
            "ExtendedAt": "2025-09-17T10:00:00Z",
            "StartDate": "2025-09-23T12:00:00Z",
            "EndDate": "2025-09-25T12:00:00Z",
            "Status": "Pending",
            "PaymentStatus": "Pending",
            "AvailabilityZone": "us-east-2a",
            "DurationHours": 48,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD"
        }
    ]
}
```

次のセクションでは、 `ExtendTrainingPlan` API オペレーションの必須入力リクエストパラメータを定義します。

## 必須パラメータ
<a name="extend-training-plan-required-params"></a>

[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html) API を呼び出してトレーニングプランを拡張する場合は、次の値を指定する必要があります。
+ `TrainingPlanExtensionOfferingId`: 購入する拡張機能の ID。この ID は、`SearchTrainingPlanOfferings`API コールのレスポンス`TrainingPlanExtensionOfferings`で から取得できます。形式は `tpeo-*` で始まる必要があります。

# 拡張履歴の表示
<a name="describe-extension-history-api-cli-sdk"></a>

[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html) API を使用して、トレーニングプランの完全な拡張履歴を表示します。

次の例では、 AWS CLI コマンドを使用して拡張履歴を取得します。

```
aws sagemaker describe-training-plan-extension-history \
--training-plan-arn "arn:aws:sagemaker:us-east-2:123456789012:training-plan/my-training-plan"
```

この JSON ドキュメントは、SageMaker トレーニングプラン API からのサンプルレスポンスです。レスポンスには、トレーニングプランのすべての拡張機能のページ分割されたリストが含まれます。

```
{
    "TrainingPlanExtensions": [
        {
            "TrainingPlanExtensionOfferingId": "tpeo-SHA-256-hash-value",
            "ExtendedAt": "2025-09-17T10:00:00Z",
            "StartDate": "2025-09-23T12:00:00Z",
            "EndDate": "2025-09-25T12:00:00Z",
            "Status": "Active",
            "PaymentStatus": "Completed",
            "AvailabilityZone": "us-east-2a",
            "DurationHours": 48,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD"
        }
    ],
    "NextToken": null
}
```

以下のセクションでは、時系列予測に使用される `DescribeTrainingPlanExtensionHistory` API の必須およびオプションの入力リクエストパラメータを定義します。

## 必須パラメータ
<a name="describe-extension-history-required-params"></a>

[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html) API を呼び出すときは、次の値を指定する必要があります。
+ `TrainingPlanArn`: 拡張履歴を取得するトレーニングプランの 。

## 任意指定のパラメータ
<a name="describe-extension-history-optional-params"></a>

次のセクションでは、表形式データを使用する場合に `DescribeTrainingPlanExtensionHistory` API アクションに渡すことができるいくつかのオプションのパラメータの詳細を説明します。
+ `NextToken`: 前のレスポンスが切り捨てられた場合は、このトークンを受け取ります。次のリクエストでこれを使用して、次の結果セットを受け取ります。
+ `MaxResults`: レスポンスで返される拡張機能の最大数。

## 拡張ステータス値
<a name="extension-status-values-api"></a>

拡張機能のステータス値は次のとおりです。
+ `Pending`: 拡張機能がリクエストされ、支払い処理を待っています。
+ `Active`: 拡張機能は正常に購入され、アクティブになっています。
+ `Scheduled`: 拡張機能は今後開始される予定です。
+ `Failed`: 拡張機能の購入に失敗しました (支払いの問題など）。
+ `Expired`: 延長期間が終了しました。

# SageMaker トレーニングジョブのトレーニングプラン使用率
<a name="training-plan-utilization-for-training-jobs"></a>

トレーニングジョブを作成する際に、選択したプランを指定することにより、トレーニングジョブに SageMaker トレーニングプランを使用できます。

**注記**  
トレーニングジョブで使用するトレーニングプランのステータスは `Scheduled` または `Active` である必要があります。

トレーニングジョブに必要なキャパシティがすぐに利用できない場合、ジョブはキャパシティが利用可能になるまで、または `StoppingCondition` が満たされるまで、あるいはジョブがキャパシティが確保されるまで 2 日間 `Pending` となるまで、いずれか早い方まで待機します。停止条件が満たされると、ジョブは停止します。ジョブが 2 日間保留中の場合、ジョブは `InsufficientCapacityError` となり、終了します。

**重要**  
**リザーブドキャパシティの終了プロセス:** リザーブドキャパシティの終了時刻の 30 分前まで、すべてのリザーブドインスタンスにフルアクセスできます。リザーブドキャパシティの残り時間が 30 分になると、SageMaker トレーニングプランはそのリザーブドキャパシティー内で実行中のインスタンスを終了するプロセスを開始します。  
これらの終了によって進行状況が失われないように、トレーニングジョブのチェックポイントを設定することをお勧めします。

## トレーニングジョブにチェックポイントを作成する
<a name="training-jobs-checkpointing"></a>

SageMaker トレーニングジョブに SageMaker トレーニングプランを使用する場合は、トレーニングスクリプトにチェックポイントを実装します。これにより、リザーブドキャパシティの有効期限が切れる前にトレーニングの進行状況を保存できます。チェックポイントは、リザーブドキャパシティを使用する場合に特に重要です。これは、ジョブが 2 つのリザーブドキャパシティ間で中断された場合、またはトレーニングプランが終了日に達した場合に、最後に保存された時点からトレーニングを再開できるためです。

`SAGEMAKER_CURRENT_CAPACITY_BLOCK_EXPIRATION_TIMESTAMP` 環境変数を使用して、この値を指定できます。この変数は、チェックポイントプロセスを開始するタイミングを決定するのに役立ちます。このロジックをトレーニングスクリプトに組み込むことで、モデルの進行状況が適切な間隔で保存されるようにします。

Python トレーニングスクリプトでこのチェックポイントロジックを実装する方法の例を次に示します。

```
import os
import time
from datetime import datetime, timedelta

def is_close_to_expiration(threshold_minutes=30):
    # Retrieve the expiration timestamp from the environment variable
    expiration_time_str = os.environ.get('SAGEMAKER_CURRENT_CAPACITY_BLOCK_EXPIRATION_TIMESTAMP', '0')
    
    # If the timestamp is not set (default '0'), return False
    if expiration_time_str == '0':
        return False
    
    # Convert the timestamp string (in milliseconds) to a datetime object
    expiration_time = datetime(1970, 1, 1) + timedelta(milliseconds=int(expiration_time_str))
    
    # Calculate the time difference between now and the expiration time
    time_difference = expiration_time - datetime.now()
    
    # Return True if we're within the threshold time of expiration
    return time_difference < timedelta(minutes=threshold_minutes)

def start_checkpointing():
    # Placeholder function for checkpointing logic
    print("Starting checkpointing process...")
    # TODO: Implement actual checkpointing logic here
    # For example:
    # - Save model state
    # - Save optimizer state
    # - Save current epoch and iteration numbers
    # - Save any other relevant training state

# Main training loop
num_epochs = 100
final_checkpointing_done = False
for epoch in range(num_epochs):
    # TODO: Replace this with your actual training code
    # For example:
    # - Load a batch of data
    # - Forward pass
    # - Calculate loss
    # - Backward pass
    # - Update model parameters
    
    # Check if we're close to capacity expiration and haven't done final checkpointing
    if not final_checkpointing_done and is_close_to_expiration():
        start_checkpointing()
        final_checkpointing_done = True
    
    # Simulate some training time (remove this in actual implementation)
    time.sleep(1)
print("Training completed.")
```

**注記**  
トレーニングジョブのプロビジョニングは先入れ先出し (FIFO) の順序に従いますが、大規模なジョブを実行できない場合は、先に作成された大規模なクラスタージョブよりも前に、後で作成された小規模なクラスタージョブにキャパシティが割り当てられる場合があります。
SageMaker トレーニングのマネージドウォームプールは、SageMaker トレーニングプランと互換性があります。クラスターを再利用するには、同じクラスターを再利用するために、後続の `CreateTrainingJob` リクエストで同一の `TrainingPlanArn` 値を指定する必要があります。

**Topics**
+ [トレーニングジョブにチェックポイントを作成する](#training-jobs-checkpointing)
+ [SageMaker AI コンソールを使用してトレーニングジョブを作成する](use-training-plan-for-training-jobs-using-console.md)
+ [API、SageMaker SDK AWS CLIを使用してトレーニングジョブを作成する](use-training-plan-for-training-jobs-using-api-cli-sdk.md)

# SageMaker AI コンソールを使用してトレーニングジョブを作成する
<a name="use-training-plan-for-training-jobs-using-console"></a>

SageMaker AI UI を使用して、トレーニングジョブに SageMaker トレーニングプランを使用できます。トレーニング ジョブを作成する際に、インスタンスの選択とリージョンが利用可能なプランと一致する場合、利用可能なプランが提案されます。

SageMaker コンソールでトレーニングプランのリザーブドキャパシティを使用してトレーニングジョブを作成するには:

1. SageMaker AI コンソール ([https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/)) に移動します。

1. 左側のナビゲーションペインで **[トレーニング]**、**[トレーニングジョブ]** の順に選択します。

1. **[トレーニングジョブの作成]** をクリックします。

1. トレーニングジョブのリソースを設定する際は、**[インスタンスキャパシティ]** セクションを探します。選択したインスタンスタイプとリージョンに一致するプランがある場合は、ここに表示されます。コンピューティングキャパシティのニーズに合ったトレーニングプランを選択します。

   適切なプランがない場合は、インスタンスタイプまたはリージョンを調整するか、トレーニングプランを使用せずに続行できます。

1. トレーニングプランを選択した後 (または選択せずに続行した後)、残りのトレーニングジョブ設定を完了し、**[トレーニングジョブの作成]** をクリックしてプロセスを開始します。

![\[新しいトレーニングジョブを作成するための SageMaker AI コンソールページ このページには、ジョブ設定、アルゴリズムオプション、リソース設定、トレーニングプランの選択、停止条件など、さまざまな設定オプションが表示されます。\]](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/images/training-plans/tp-create-training-job.png)


ジョブを確認して起動します。キャパシティがあれば、トレーニングプランが `Active` になり、直ちにジョブの実行が開始されます。

# API、SageMaker SDK AWS CLIを使用してトレーニングジョブを作成する
<a name="use-training-plan-for-training-jobs-using-api-cli-sdk"></a>

SageMakerトレーニングジョブに SageMaker トレーニングプランを使用するには、[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html) APIオペレーションを呼び出す際に、`ResourceConfig` で必要なプランの `TrainingPlanArn` パラメータを指定します。ジョブごとに 1 つのプランのみを使用できます。

**重要**  
`CreateTrainingJob` リクエストの `ResourceConfig` セクションで設定された `InstanceType` フィールドは、トレーニングプランの `InstanceType` と一致する必要があります。

## CLI を使用してプランでトレーニングジョブを実行する
<a name="training-job-cli"></a>

次の例は、 `create-training-job` AWS CLI コマンドの `TrainingPlanArn` 属性を使用して SageMaker トレーニングジョブを作成し、提供されたトレーニングプランに関連付ける方法を示しています。

 AWS CLI [CreateTrainingJob](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html) コマンドを使用してトレーニングジョブを作成する方法の詳細については、「」を参照してください[https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-training-job.html](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-training-job.html)。

```
# Create a training job
aws sagemaker create-training-job \
  --training-job-name training-job-name \
  ...
    
  --resource-config '{
        "InstanceType": "ml.p5.48xlarge",
        "InstanceCount": 8,
        "VolumeSizeInGB": 10,
        "TrainingPlanArn": "training-plan-arn"
        }
    }' \
    ...
```

このコマンド AWS CLI 例では、SageMaker AI で新しいトレーニングジョブを作成し、 `--resource-config`引数でトレーニングプランを渡します。

```
aws sagemaker create-training-job \
  --training-job-name job-name \
  --role-arn arn:aws:iam::111122223333:role/DataAndAPIAccessRole \
  --algorithm-specification '{"TrainingInputMode": "File","TrainingImage": "111122223333.dkr.ecr.us-east-1.amazonaws.com/algo-image:tag", "ContainerArguments": [" "]}' \
  --input-data-config '[{"ChannelName":"training","DataSource":{"S3DataSource":{"S3DataType":"S3Prefix","S3Uri":"s3://bucketname/input","S3DataDistributionType":"ShardedByS3Key"}}}]' \
  --output-data-config '{"S3OutputPath": "s3://bucketname/output"}' \
  --resource-config '{"VolumeSizeInGB":10,"InstanceCount":4,"InstanceType":"ml.p5.48xlarge", "TrainingPlanArn" : "arn:aws:sagemaker:us-east-1:111122223333:training-plan/plan-name"}' \
  --stopping-condition '{"MaxRuntimeInSeconds": 1800}' \
  --region us-east-1
```

トレーニングジョブを作成したら、`DescribeTrainingJob` API を呼び出して、そのジョブがトレーニングプランに適切に割り当てられていることを検証できます。

```
aws sagemaker describe-training-job --training-job-name training-job-name
```

## SageMaker AI Python SDK を使用してプランでトレーニングジョブを実行する
<a name="training-job-sdk"></a>

または、[SageMaker Python SDK](https://sagemaker.readthedocs.io/en/stable/v2.html) を使用してトレーニングプランに関連付けられたトレーニングジョブを作成することもできます。

Studio で JupyterLab の SageMaker Python SDK を使用してトレーニングジョブを作成する場合は、JupyterLab アプリケーションを実行するスペースで使用される実行ロールに、SageMaker トレーニングプランを使用するために必要なアクセス許可があることを確認します。SageMakerトレーニングプランを使用するために必要なアクセス許可の詳細については、「[SageMaker トレーニングプラン向け IAM](training-plan-iam-permissions.md)」を参照してください。

次の例は、SageMaker Python SDK を使用する際に、`Estimator` オブジェクトの `training_plan` 属性を使用して SageMaker トレーニングジョブを作成し、提供されたトレーニングプランに関連付ける方法を説明しています。

SageMaker 推定ツールの詳細については、「[SageMaker 推定ツールを使用してトレーニングジョブを実行する](https://docs.aws.amazon.com/sagemaker/latest/dg/docker-containers-adapt-your-own-private-registry-estimator.html)」を参照してください。

```
import sagemaker
import boto3
from sagemaker import get_execution_role
from sagemaker.estimator import Estimator
from sagemaker.inputs import TrainingInput

# Set up the session and SageMaker client
session = boto3.Session()
region = session.region_name
sagemaker_session = session.client('sagemaker')

# Get the execution role for the training job
role = get_execution_role()

# Define the input data configuration
trainingInput = TrainingInput(
    s3_data='s3://input-path',
    distribution='ShardedByS3Key',
    s3_data_type='S3Prefix'
)

estimator = Estimator(
    entry_point='train.py',
    image_uri="123456789123.dkr.ecr.{}.amazonaws.com/image:tag",
    role=role,
    instance_count=4,
    instance_type='ml.p5.48xlarge',
    training_plan="training-plan-arn",
    volume_size=20,
    max_run=3600,
    sagemaker_session=sagemaker_session,
    output_path="s3://output-path"
)

# Create the training job
estimator.fit(inputs=trainingInput, job_name=job_name)
```

トレーニングジョブを作成したら、`DescribeTrainingJob` API を呼び出して、そのジョブがトレーニングプランに適切に割り当てられていることを検証できます。

```
# Check job details
sagemaker_session.describe_training_job(TrainingJobName=job_name)
```

# Amazon SageMaker HyperPod クラスターのトレーニングプラン使用率
<a name="training-plan-utilization-for-hyperpod"></a>

Amazon SageMaker HyperPod クラスターに SageMaker トレーニングプランを使用するには、クラスターを作成または更新する際にクラスターインスタンスレベルで使用するトレーニングプランを指定します。

**注記**  
HyperPod クラスターで使用するトレーニングプランのステータスは `Scheduled` または `Active` である必要があります。
クラスターの設定がトレーニングプランで指定されたアベイラビリティーゾーン (AZ) と一致していることを確認します。  
VPC のセットアップ、リソースの場所、セキュリティグループの設定については、SageMaker HyperPod ドキュメントの「[カスタム Amazon VPC で SageMaker HyperPod を設定する](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-vpc)」を参照してください。  
Amazon FSx for Lustre を使用して HyperPod を設定する場合は、「[(オプション) Amazon FSx for Lustre で SageMaker HyperPod を設定する](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-fsx)」で、リージョンと AZ の選択について理解し、VPC 設定要件を確認して、AZ 配置のベストプラクティスを理解しておきます。
インスタンスグループごとにプランを選択できます。ただし、クラスターのプライマリインスタンスグループにトレーニングプランを使用することはお勧めしません。プライマリノードには、トレーニングプランのキャパシティの固定期間や不連続になる可能性のある特質には沿わない、継続的かつ安定したリソースが必要であるためです。

**Topics**
+ [SageMaker AI コンソールを使用してトレーニングプランで SageMaker HyperPod クラスターを作成する](use-training-plan-for-hyperpod-creation-using-console.md)
+ [SageMaker AI コンソールを使用してトレーニングプランで SageMaker HyperPod クラスターを更新する](use-training-plan-for-hyperpod-update-using-console.md)
+ [SageMaker API を使用してトレーニングプランで SageMaker HyperPod クラスターを作成する、または AWS CLI](use-training-plan-for-hyperpod-creation-using-api-cli-sdk.md)
+ [SageMaker API を使用してトレーニングプランで SageMaker HyperPod クラスターを更新する、または AWS CLI](use-training-plan-for-hyperpod-update-using-api-cli-sdk.md)

# SageMaker AI コンソールを使用してトレーニングプランで SageMaker HyperPod クラスターを作成する
<a name="use-training-plan-for-hyperpod-creation-using-console"></a>

SageMaker AI コンソール UI からトレーニングプランを使用して SageMaker HyperPod クラスターを作成するには、次の手順に従います。

1. SageMaker AI コンソール ([https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/)) に移動します。

1. 左側のナビゲーションペインで **[Hyperpod]**、**[クラスターを作成]** の順に選択します。

1. インスタンスグループを設定する際は、コンピューティングキャパシティのニーズに合ったプランを選択できます。

![\[SageMaker HyperPod クラスター内にインスタンスグループを作成するためのモーダルウィンドウを表示する SageMaker AI コンソールインターフェイス フォームには、インスタンスグループ名、インスタンスタイプ、数量、インスタンスキャパシティ (オンデマンドプランとトレーニングプランのオプション付き)、作成時のライフサイクルスクリプトのディレクトリパスなどのフィールドが含まれています。\]](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/images/training-plans/tp-create-hyperpod-cluster.png)


クラスターを確認して作成します。トレーニングプランを使用するインスタンスグループは、トレーニングプランが `Active` になると、利用可能なキャパシティに応じて、指定されたターゲットインスタンス数までスケールアップします。各リザーブドキャパシティ期間が終了する 30 分前に、インスタンスグループはゼロインスタンスへのスケールダウンを開始します。このスケールダウン状態は、次のリザーブドキャパシティ期間が始まるか、プランが終了するまで維持されます。このプロセス全体を通して、正常なインスタンスグループは、現在のインスタンス数に関係なく、最初の作成後に `InService` ステータスを維持します。

# SageMaker AI コンソールを使用してトレーニングプランで SageMaker HyperPod クラスターを更新する
<a name="use-training-plan-for-hyperpod-update-using-console"></a>

SageMaker AI コンソール UI を使用して、既存の SageMaker HyperPod クラスターのトレーニングプランを更新、削除、または追加できます。SageMaker HyperPod クラスターのインスタンスグループを更新するには、次の手順に従います。

1. SageMaker AI コンソール ([https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/)) に移動します。

1. 左側のナビゲーションペインで、**[Hyperpod]** を選択します。

1. クラスター名に関連付けられたハイパーリンクを使用して、クラスターの詳細ページに移動します。

1. インスタンスグループを設定する際は、コンピューティングキャパシティのニーズに合ったプランを選択できます。

![\[SageMaker HyperPod クラスター内のインスタンスグループを更新するためのモーダルウィンドウを表示する SageMaker AI コンソールインターフェイス フォームには、インスタンスグループ名、インスタンスタイプ、数量、インスタンスキャパシティ (オンデマンドプランとトレーニングプランのオプション付き)、作成時のライフサイクルスクリプトのディレクトリパスなどのフィールドが含まれています。\]](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/images/training-plans/tp-update-hyperpod-clusters.png)


クラスターを確認して更新します。

# SageMaker API を使用してトレーニングプランで SageMaker HyperPod クラスターを作成する、または AWS CLI
<a name="use-training-plan-for-hyperpod-creation-using-api-cli-sdk"></a>

Amazon SageMaker HyperPod クラスターで SageMaker トレーニングプランを使用するには、[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html) オペレーションを呼び出す際に、[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html) の [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-TrainingPlanArn](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-TrainingPlanArn) パラメータで使用するトレーニングプランの ARN を指定します。

プランの指定された AZ に関連付けられたサブネットが、クラスターの設定の `VPCConfig` に含まれていることを確認します。[``DescribeTrainingPlan](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlan.html) API コールのレスポンスでトレーニングプランの `AvailabilityZone` を取得できます。

次のサンプルは、新しい SageMaker HyperPod クラスターを作成し、 `create-cluster` AWS CLI コマンドの `--instance-groups` 属性でインスタンスグループにトレーニングプランを提供する方法を示しています。

```
# Create a cluster         
aws sagemaker create-cluster \
  --cluster-name cluster-name \
  --instance-groups '[ \
        { \
            "InstanceCount": 1,\
            "InstanceGroupName": "controller-nodes",\
            "InstanceType": "ml.t3.xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
        },\
        { \
            "InstanceCount": 2, \
            "InstanceGroupName": "worker-nodes",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id}:role/execution_role}",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        }]'
```

を使用して HyperPod クラスターを作成する方法については AWS CLI、「」を参照してください[https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-cluster.html](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-cluster.html)。

クラスターを作成したら、`DescribeCluster` API を呼び出して、インスタンスグループにトレーニングプランから適切にキャパシティが割り当てられたことを喧噪できます。

```
aws sagemaker describe-cluster --cluster-name cluster-name
```

# SageMaker API を使用してトレーニングプランで SageMaker HyperPod クラスターを更新する、または AWS CLI
<a name="use-training-plan-for-hyperpod-update-using-api-cli-sdk"></a>

コマンドを使用して既存のクラスターのインスタンスグループを更新することで、トレーニングプランを追加、更新、または削除できます`update-cluster` AWS CLI 。次のサンプルは、SageMaker HyperPod クラスターを更新し、インスタンスグループに新しいトレーニングプランを提供する方法を説明しています。

```
# Update a cluster
aws sagemaker update-cluster \
  --cluster-name cluster-name \
  --instance-groups '[ \
        { \
            "InstanceCount": 1,\
            "InstanceGroupName": "controller-nodes",\
            "InstanceType": "ml.t3.xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
        },\
        { \
            "InstanceCount": 2, \
            "InstanceGroupName": "worker-nodes",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id}:role/execution_role}",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        },\
        {\
            "InstanceCount": 1,\
            "InstanceGroupName": "worker-nodes-2",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        }\
    ]'
```

# AWS マネジメントコンソールを使用して SageMaker トレーニングプランのクォータを表示する
<a name="training-plan-quotas"></a>

**重要**  
SageMaker トレーニングプランの料金の詳細については、「[Amazon SageMaker の料金](https://aws.amazon.com/sagemaker/pricing/)」ページを参照してください。**[オンデマンド料金]** の **[Amazon SageMaker HyperPod フレキシブルなトレーニングプラン]** セクションまで移動します。必要なリージョンを選択すると、使用可能なインスタンスタイプとそれに対応する料金が表示されます。
トレーニングジョブまたは HyperPod サービスのクォータで、プランで指定されているインスタンスの数を超えるインスタンスタイプあたりの最大インスタンス数が許可されていることを確認します。

SageMaker トレーニングプランの現在のクォータと制限は、 AWS マネジメントコンソールを使用して表示できます。

特定のクォータ値を検索するには:

1. [ Service Quotas コンソール](https://console.aws.amazon.com/servicequotas/home/services/sagemaker/quotas)を開きます。

1. 左側のナビゲーションペインで **[AWS services]** ( のサービス) を選択します。

1.  AWS サービスリストから Amazon **Amazon SageMaker**を検索して選択します。

1. **サービスクォータ**リストでは、サービスクォータ名、適用された値 (使用可能な場合）、 AWS デフォルトのクォータ、およびクォータ値が調整可能かどうかを確認できます。

特定のクォータを検索するには、**[サービスクォータ]** リストの上部にある検索バーを使用できます。検索するクォータの `Limit Name` を入力します。例えば、リージョンあたりのトレーニングプラン数のクォータを検索するには、検索バーに「**training-plan-total\$1count**」と入力します。

SageMaker トレーニングプランのクォータ制限名の概要は、次の表のとおりです。


**SageMaker トレーニングプランのクォータの制限**  

| 制限の名前 | [Display Name] (表示名) | 
| --- | --- | 
| training-plan-total\$1count | リージョンあたりのトレーニングプラン数 | 
| reserved-capacity-ml-p4d-24xlarge | リージョンごとのトレーニング プラン全体でリザーブドキャパシティ内の ml.p4d.24xlarge インスタンスの数 | 
| reserved-capacity-ml-p5-48xlarge | リージョンごとのトレーニング プラン全体でリザーブドキャパシティ内の ml.p5.48xlarge インスタンスの数 | 
| reserved-capacity-ml-p5e-48xlarge | リージョンごとのトレーニング プラン全体でリザーブドキャパシティ内の ml.p5e.48xlarge インスタンスの数 | 
| reserved-capacity-ml-p5en-48xlarge | リージョンごとのトレーニング プラン全体でリザーブドキャパシティ内の ml.p5en.48xlarge インスタンスの数 | 
| reserved-capacity-ml-trn1-32xlarge | リージョンごとのトレーニング プラン全体でリザーブドキャパシティ内の ml-trn1-32xlarge インスタンスの数 | 
| reserved-capacity-ml-trn2-48xlarge | リージョンごとのトレーニング プラン全体でリザーブドキャパシティ内の ml.trn2.48xlarge インスタンスの数 | 

SageMaker トレーニングプランにより高い制限が必要な場合は、クォータの引き上げをリクエストできる場合があります。クォータを引き上げられるかどうかは、クォータが調整可能かどうかによって決まります。これは、**[サービスクォータ]** コンソールで確認できます。

クォータの引き上げをリクエストするには:

1. **[サービスクォータ]** コンソールで、特定のクォータに移動します。

1. クォータが調整可能な場合、**[調整可能性]** 列にリストされている値に基づいて、アカウントレベルまたはリソースレベルでクォータの引き上げをリクエストできます。

1. **[クォータ値を引き上げる]** に、新しい値を入力します。新しい値は現在値よりも大きい値である必要があります。

1. **[リクエスト]** を選択します。

1. クォータ引き上げリクエストは、 によるレビューと承認の対象となります AWS。保留中または最近解決されたリクエストをコンソールに表示するには、サービスの詳細ページから **[リクエスト履歴]** タブに移動するか、ナビゲーションペインから **[ダッシュボード]** を選択します。保留中のリクエストの場合は、リクエストのステータスを選択してリクエストの受信をオープンします。リクエストの初期ステータスは `Pending` です。ステータスが に変わると`Quota requested`、 AWS サポートのケース番号が表示されます。リクエストのチケットを開くには、ケース番号を選択します。

クォータの引き上げをリクエストする方法の全般的な詳細については、「*AWS Service Quotas ユーザーガイド*」の「[クォータの引き上げをリクエストする](https://docs.aws.amazon.com/servicequotas/latest/userguide/request-quota-increase.html)」を参照してください。

# リリースノート
<a name="training-plan-release-notes"></a>

Amazon SageMaker トレーニングプランの最新の更新については、以下のリリースノートを参照してください。

## Amazon SageMaker トレーニングプランリリースノート: 2024 年 12 月 4 日
<a name="training-plan-release-notes-20241204"></a>

**新機能**
+  AWS re:Invent 2024 で Amazon SageMaker トレーニングプランを開始しました。