Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Osservabilità
Monitoraggio standard di Kubernetes
Puoi monitorare Spaces utilizzando strumenti Kubernetes standard come description e logs. kubectl kubectl
Monitoraggio dello stato dello spazio
# List all Spaces with status kubectl get workspace -A # Get detailed information about a specific Space kubectl describe workspace <workspace-name>
Visualizzazione dei registri spaziali
# View workspace container logs kubectl logs -l workspace.jupyter.org/workspace-name=<workspace-name> -c workspace # View SSM agent sidecar logs (for remote IDE connectivity) kubectl logs -l workspace.jupyter.org/workspace-name=<workspace-name> -c ssm-agent-sidecar # Follow logs in real-time kubectl logs -l workspace.jupyter.org/workspace-name=<workspace-name> -c workspace -f
Comprensione delle condizioni dello spazio
Gli spazi riportano quattro tipi di condizioni nel loro stato:
-
Disponibile:
Truequando lo spazio è pronto per l'uso. Tutte le risorse richieste (pod, servizi, storage) sono funzionanti e integre. -
Progressione:
Truequando lo Spazio viene creato, aggiornato o riconciliato. Passa a una volta stabile.False -
Degradato:
Truequando vengono rilevati errori nelle risorse spaziali. Controlla il messaggio sulla condizione per i dettagli. -
Interrotto:
Truequando lo stato desiderato di Space è impostato suStopped. I pod vengono terminati ma l'archiviazione e la configurazione vengono preservate.
CloudWatch Integrazione dei log
Puoi installare il componente aggiuntivo di CloudWatch registrazione per inviare i log di Space ad Amazon CloudWatch Logs per la gestione e la conservazione centralizzate dei log. Ciò consente l'aggregazione dei log su più cluster e l'integrazione con Insights per l'interrogazione e l'analisi. CloudWatch Tutti i kubectl log sopra disponibili possono essere interrogati con questo plugin. CloudWatch
HyperPod Osservabilità Add-on
Il componente aggiuntivo SageMaker HyperPod Observability fornisce dashboard completi per il monitoraggio dell'utilizzo delle risorse spaziali. Dopo aver installato il componente aggiuntivo, puoi visualizzare lo spazio, la memoria e l'utilizzo della CPU nella scheda Attività della HyperPod console, che mostra le metriche nelle dashboard di Amazon Managed Grafana.
Riferimento: https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod-observability-addon.html
Metriche chiave disponibili:
-
Utilizzo della CPU e della memoria per spazio
-
Metriche della GPU (se applicabile)