Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Visualizzazione dei dettagli del piano di addestramento
Per monitorare lo stato o recuperare i dettagli di un piano di addestramento, puoi utilizzare l’API DescribeTrainingPlan. La risposta dell’API include un campo Status che riflette lo stato attuale del piano di addestramento:
-
Se l’acquisto del piano non riesce, lo stato viene impostato su
Failed. -
Una volta completato il pagamento, lo stato passa da
PendingaScheduled, in base alla data di inizio del piano. -
Quando il piano raggiunge la data di inizio, lo stato cambia in
Active. -
Per i piani con più capacità riservate discontinue, lo stato torna su
Scheduledtra un periodo di attività e l’altro, finché non viene raggiunta la data di inizio della capacità riservata successiva. -
Dopo la data di fine del piano, lo stato diventa
Expired.
Una volta raggiunto lo statoScheduled, è possibile utilizzare la capacità riservata nel piano per i lavori di SageMaker formazione o i carichi di lavoro HyperPod del cluster.
Nota
-
I job di addestramento associati al piano rimangono nello stato
Pendingfino a quando il piano non diventaActive. -
Per HyperPod i cluster che utilizzano un piano di formazione per la capacità di calcolo, lo stato del gruppo di istanze viene visualizzato come una volta creato.
InService -
Per le app Studio, l'app viene avviata con la capacità GPU riservata al momento del piano di formazione.
Active
L'esempio seguente utilizza un AWS CLI comando per recuperare i dettagli di un piano di allenamento in base al nome.
aws sagemaker describe-training-plan \ --training-plan-name "name"
Questo documento JSON è un esempio di risposta dall'API dei piani SageMaker di formazione. Questa risposta fornisce dettagli su un piano di addestramento creato correttamente.
{ "AvailableInstanceCount": 2, "CurrencyCode": "USD", "DurationHours": 48, "DurationMinutes": 0, "EndTime": "2024-09-28T04:30:00-07:00", "InUseInstanceCount": 2, "ReservedCapacitySummaries": [ { "AvailabilityZone": "string", "DurationHours": 48, "DurationMinutes": 0, "EndTime": "2024-09-28T04:30:00-07:00", "InstanceType": "ml.p5.48xlarge", "ReservedCapacityArn": "arn:aws:sagemaker:us-east-1:123456789123:reserved-capacity/large-models-fine-tuning-rc1", "StartTime": "2024-09-26T04:30:00-07:00", "Status": "Scheduled", "TotalInstanceCount": 4, "UltraServerCount": 4, "UltraServerType": "ml.p6e-gb200.36xlarge" } ], "StartTime": "2024-09-26T04:30:00-07:00", "Status": "Scheduled", "StatusMessage": "Payment confirmed, training plan scheduled." "TargetResources": [ "training-job" ], "TotalInstanceCount": 4, "TotalUltraServerCount": 4, "TrainingPlanArn": "arn:aws:sagemaker:us-east-1:123456789123:training-plan/large-models-fine-tuning", "TrainingPlanName": "large-models-fine-tuning", "UpfrontFee": "xxxx.xx" }
Le sezioni seguenti definiscono il parametro di richiesta di input obbligatorio per l’operazione API DescribeTrainingPlan.
Parametri obbligatori
-
TrainingPlanName: il nome del piano di addestramento da descrivere.