View a markdown version of this page

Osservabilità - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Osservabilità

Monitoraggio standard di Kubernetes

Puoi monitorare Spaces utilizzando strumenti Kubernetes standard come description e logs. kubectl kubectl

Monitoraggio dello stato dello spazio

# List all Spaces with status kubectl get workspace -A # Get detailed information about a specific Space kubectl describe workspace <workspace-name>

Visualizzazione dei registri spaziali

# View workspace container logs kubectl logs -l workspace.jupyter.org/workspace-name=<workspace-name> -c workspace # View SSM agent sidecar logs (for remote IDE connectivity) kubectl logs -l workspace.jupyter.org/workspace-name=<workspace-name> -c ssm-agent-sidecar # Follow logs in real-time kubectl logs -l workspace.jupyter.org/workspace-name=<workspace-name> -c workspace -f

Comprensione delle condizioni dello spazio

Gli spazi riportano quattro tipi di condizioni nel loro stato:

  • Disponibile: True quando lo spazio è pronto per l'uso. Tutte le risorse richieste (pod, servizi, storage) sono funzionanti e integre.

  • Progressione: True quando lo Spazio viene creato, aggiornato o riconciliato. Passa a una volta stabile. False

  • Degradato: True quando vengono rilevati errori nelle risorse spaziali. Controlla il messaggio sulla condizione per i dettagli.

  • Interrotto: True quando lo stato desiderato di Space è impostato suStopped. I pod vengono terminati ma l'archiviazione e la configurazione vengono preservate.

CloudWatch Integrazione dei log

Puoi installare il componente aggiuntivo di CloudWatch registrazione per inviare i log di Space ad Amazon CloudWatch Logs per la gestione e la conservazione centralizzate dei log. Ciò consente l'aggregazione dei log su più cluster e l'integrazione con Insights per l'interrogazione e l'analisi. CloudWatch Tutti i kubectl log sopra disponibili possono essere interrogati con questo plugin. CloudWatch

Riferimento:. https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod-eks-cluster-observability-cluster-cloudwatch-ci.html

HyperPod Osservabilità Add-on

Il componente aggiuntivo SageMaker HyperPod Observability fornisce dashboard completi per il monitoraggio dell'utilizzo delle risorse spaziali. Dopo aver installato il componente aggiuntivo, puoi visualizzare lo spazio, la memoria e l'utilizzo della CPU nella scheda Attività della HyperPod console, che mostra le metriche nelle dashboard di Amazon Managed Grafana.

Riferimento: https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod-observability-addon.html

Metriche chiave disponibili:

  • Utilizzo della CPU e della memoria per spazio

  • Metriche della GPU (se applicabile)