

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 培训计划延期
<a name="training-plan-extension"></a>

SageMaker 培训计划允许您延长现有的培训计划，以避免工作量中断。当训练计划即将到期时，您可以直接通过 SageMaker AI 控制台延长该计划，也可以使用 API 或 AWS CLI以编程方式延长该计划。这样就无需创建新计划和使用新的训练计划 ARN 重新配置工作负荷。

通过延长训练计划，计划延长后，您的正在运行的 SageMaker 训练作业或 SageMaker HyperPod 集群可以继续无缝运行，而不会中断。延期计划反映了新的结束日期，您可以检索训练计划中所有延期的历史记录。

**重要**  
请注意，不能取消或修改扩展以添加或删除实例。

## 主要 功能
<a name="training-plan-extension-features"></a>
+ 通过控制台或 API 扩展训练计划
+ 以 1 天为增量延长计划，最多 14 天，或以 7 天为增量延长计划，最多 182 天
+ 将计划延长任意次数
+ 在控制台中或通过 API 查看/列出训练计划的延期历史记录
+ 无需重新配置即可在 SageMaker AI 中无缝继续运行工作负载

## 先决条件
<a name="training-plan-extension-prerequisites"></a>

在延长培训计划之前，请确保以下几点：
+ 培训计划的状态必须为`Active`或`Scheduled`。
+ 该计划的`Payment Pending`状态不得有任何延期。
+ 计划到期前最少 1 小时或最多 56 天可以申请延期。

**Topics**
+ [主要 功能](#training-plan-extension-features)
+ [先决条件](#training-plan-extension-prerequisites)
+ [使用 SageMaker AI 控制台延长训练计划](training-plan-extension-using-console.md)
+ [使用 SageMaker API 延长培训计划或 AWS CLI](training-plan-extension-using-api-cli-sdk.md)

# 使用 SageMaker AI 控制台延长训练计划
<a name="training-plan-extension-using-console"></a>

SageMaker 训练计划提供了一种通过 SageMaker AI 控制台用户界面扩展现有训练计划的便捷方式。本指南将引导您完成使用 SageMaker AI 控制台为 SageMaker 训练作业和 SageMaker HyperPod 集群扩展训练计划的过程。

要使用控制台延长训练计划，请执行以下操作：

1. 导航到 SageMaker AI 控制台，网址为[https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/)。

1. 在左侧导航窗格中选择 “**培训计划**”。

1. 从列表中选择要延长的训练计划。

1. 选择 “**扩展**” 按钮。

1. 输入所需的延期结束日期，然后选择 “**搜索**” 以查找可用的扩展服务。

1. 查看扩展服务列表，其中包括持续时间、可用区、预付费用以及开始和结束时间等详细信息。

1. 选择最符合您要求的扩展产品。

1. 在确认对话框中查看扩展详细信息，然后选择**提交**以确认您的购买。

购买延期后，培训计划的结束日期会更新，以反映新的延长时长。

## 查看扩展历史记录
<a name="training-plan-extension-history-console"></a>

要查看培训计划的延期历史记录，请执行以下操作：

1. 在 SageMaker AI 控制台中导航到 “**训练计划**” 页面。

1. 选择要查看的训练计划。

1. 在培训计划详情页面中，查看**扩展**部分以查看所有以往的延期，包括扩展课程编号、开始和结束日期、状态以及扩展模块的创建时间。

## 分机状态值
<a name="training-plan-extension-status-values-console"></a>

扩展可以具有以下状态值：
+ `Pending`: 已申请延期，正在等待付款处理。
+ `Active`：扩展程序已成功购买且处于活动状态。
+ `Scheduled`: 延期计划在将来的某个时间开始。
+ `Failed`：扩展购买失败（例如，由于付款问题）。
+ `Expired`: 延期已结束。

# 使用 SageMaker API 延长培训计划或 AWS CLI
<a name="training-plan-extension-using-api-cli-sdk"></a>

SageMaker 培训计划支持通过其 API 以编程方式扩展培训计划。您可以使用 AWS CLI 或与训练计划 API 进行交互 SageMaker SDKs。

培训计划扩展涉及以下 API 操作：
+ **`SearchTrainingPlanOfferings`：**通过指定您的培训计划 ARN 和所需的延期持续时间来搜索可用的延期课程。API 会返回该`TrainingPlanExtensionOfferings`领域的扩展产品。
+ **`ExtendTrainingPlan`:** 购买特定的扩展产品以延长您的培训计划，方法是提供`TrainingPlanExtensionOfferingId`. 这将保留额外的计算容量并更新您的训练计划的结束日期。
+ **`DescribeTrainingPlanExtensionHistory`：**查看培训计划的完整延期历史记录，包括过去的所有延期及其状态、日期和付款信息。

**Topics**
+ [搜索扩展产品](search-extension-offerings-api-cli-sdk.md)
+ [购买扩展](extend-training-plan-api-cli-sdk.md)
+ [查看扩展历史记录](describe-extension-history-api-cli-sdk.md)

# 搜索扩展产品
<a name="search-extension-offerings-api-cli-sdk"></a>

使用带有`TrainingPlanArn`参数的 [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html)API 来查找适用于您的培训计划的可用扩展选项。

以下示例使用 AWS CLI 命令搜索现有培训计划的扩展选项。

```
aws sagemaker search-training-plan-offerings \
--training-plan-arn "arn:aws:sagemaker:us-east-2:123456789012:training-plan/my-training-plan" \
--duration-hours 48
```

此 JSON 文档是来自 SageMaker 训练计划 API 的示例响应。答复包括`TrainingPlanExtensionOfferings`包含指定培训计划的可用扩展选项。

```
{
    "TrainingPlanOfferings": [],
    "TrainingPlanExtensionOfferings": [
        {
            "TrainingPlanExtensionOfferingId": "tpeo-SHA-256-hash-value",
            "AvailabilityZone": "us-east-2a",
            "StartDate": "2025-09-23T12:00:00Z",
            "EndDate": "2025-09-25T12:00:00Z",
            "DurationHours": 48,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD"
        }
    ]
}
```

以下各节定义了搜索扩展产品时 `SearchTrainingPlanOfferings` API 操作的必填和可选输入请求参数。

## 必填参数
<a name="search-extension-offerings-required-params"></a>

在调用 [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html)API 搜索扩展产品时，必须提供以下值：
+ `TrainingPlanArn`: 您要延长的训练计划。`TrainingPlanArn`必须引用状态为`Active`或的现有培训计划`Scheduled`。

## 可选参数
<a name="search-extension-offerings-optional-params"></a>

以下各节详细介绍了在搜索扩展产品时可以传递给 `SearchTrainingPlanOfferings` API 请求的一些可选参数。
+ `DurationHours`：延期所需的持续时间（以小时为单位）。`DurationHours` 向上取整至最接近的 24 的倍数。

# 购买扩展
<a name="extend-training-plan-api-cli-sdk"></a>

选择扩展产品后，使用 [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html)API 购买扩展程序。

以下示例使用 AWS CLI 命令来扩展训练计划。

```
aws sagemaker extend-training-plan \
--training-plan-extension-offering-id "tpeo-SHA-256-hash-value"
```

此 JSON 文档是来自 SageMaker 训练计划 API 的示例响应。答复包括培训计划的延期清单。

```
{
    "TrainingPlanExtensions": [
        {
            "TrainingPlanExtensionOfferingId": "tpeo-SHA-256-hash-value",
            "ExtendedAt": "2025-09-17T10:00:00Z",
            "StartDate": "2025-09-23T12:00:00Z",
            "EndDate": "2025-09-25T12:00:00Z",
            "Status": "Pending",
            "PaymentStatus": "Pending",
            "AvailabilityZone": "us-east-2a",
            "DurationHours": 48,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD"
        }
    ]
}
```

以下部分定义了 `ExtendTrainingPlan` API 操作的必填输入请求参数。

## 必填参数
<a name="extend-training-plan-required-params"></a>

在调用 [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html)API 延长训练计划时，必须提供以下值：
+ `TrainingPlanExtensionOfferingId`: 您要购买的扩展产品的 ID。您可以在 `SearchTrainingPlanOfferings` API 调用的响应`TrainingPlanExtensionOfferings`中从中检索此 ID。其格式应以 `tpeo-*` 开头。

# 查看扩展历史记录
<a name="describe-extension-history-api-cli-sdk"></a>

使用 [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html)API 查看训练计划的完整扩展历史记录。

以下示例使用 AWS CLI 命令检索扩展历史记录。

```
aws sagemaker describe-training-plan-extension-history \
--training-plan-arn "arn:aws:sagemaker:us-east-2:123456789012:training-plan/my-training-plan"
```

此 JSON 文档是来自 SageMaker 训练计划 API 的示例响应。响应中包含训练计划所有扩展的分页列表。

```
{
    "TrainingPlanExtensions": [
        {
            "TrainingPlanExtensionOfferingId": "tpeo-SHA-256-hash-value",
            "ExtendedAt": "2025-09-17T10:00:00Z",
            "StartDate": "2025-09-23T12:00:00Z",
            "EndDate": "2025-09-25T12:00:00Z",
            "Status": "Active",
            "PaymentStatus": "Completed",
            "AvailabilityZone": "us-east-2a",
            "DurationHours": 48,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD"
        }
    ],
    "NextToken": null
}
```

以下各部分定义了 `DescribeTrainingPlanExtensionHistory` API 操作的必需和可选输入请求参数。

## 必填参数
<a name="describe-extension-history-required-params"></a>

调用 [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html)API 时，必须提供以下值：
+ `TrainingPlanArn`: 要检索其延期历史记录的训练计划。

## 可选参数
<a name="describe-extension-history-optional-params"></a>

以下各部分提供了有关可传递给 `DescribeTrainingPlanExtensionHistory` API 请求的一些可选参数的信息。
+ `NextToken`: 如果之前的响应被截断，您将收到此标记。在下次请求中使用它来接收下一组结果。
+ `MaxResults`：响应中要返回的最大分机数。

## 分机状态值
<a name="extension-status-values-api"></a>

扩展可以具有以下状态值：
+ `Pending`: 已申请延期，正在等待付款处理。
+ `Active`：扩展程序已成功购买且处于活动状态。
+ `Scheduled`: 延期计划在将来的某个时间开始。
+ `Failed`：扩展购买失败（例如，由于付款问题）。
+ `Expired`: 延期已结束。