View a markdown version of this page

訓練計畫延伸 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

訓練計畫延伸

SageMaker 訓練計畫可讓您擴展現有的訓練計畫,以避免工作負載中斷。當訓練計畫即將到期時,您可以直接透過 SageMaker AI 主控台或使用 API 或 以程式設計方式進行擴展 AWS CLI。這不需要建立新的計劃,並使用新的訓練計劃 ARN 重新設定工作負載。

使用訓練計畫擴充功能時,執行中的 SageMaker 訓練任務或 SageMaker HyperPod 叢集會在計畫擴充後繼續順暢運作,而不會中斷。延伸計劃反映新的結束日期,您可以擷取訓練計劃所有延伸項目的歷史記錄。

重要

請注意,無法取消或修改擴充功能來新增或移除執行個體。

主要功能

  • 透過主控台或 API 擴展訓練計畫

  • 將計劃以 1 天為增量最多 14 天,或以 7 天為增量最多 182 天

  • 將計劃擴展任意次數

  • 在主控台或透過 API 檢視/列出訓練計畫的延伸歷史記錄

  • 在 SageMaker AI 中無縫繼續執行工作負載,無需重新設定

先決條件

在擴展訓練計畫之前,請確定下列事項:

  • 訓練計畫的狀態必須為 ActiveScheduled

  • 計劃不得有任何處於 Payment Pending 狀態的延伸項目。

  • 在計劃到期前,最多可以請求延長 1 小時或最多 56 天。