本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
SageMaker HyperPod 叢集可觀測性的先決條件
在繼續執行在您的 HyperPod 叢集上安裝指標匯出工具套件的步驟之前,請確定符合下列先決條件。
啟用 IAM Identity Center
若要啟用 SageMaker HyperPod 叢集的可觀測性,您必須先啟用 IAM Identity Center。這是部署設定 Amazon Managed Grafana 工作區和 Amazon Managed Service for Prometheus CloudFormation 的堆疊的先決條件。這兩種服務也需要 IAM Identity Center 進行驗證和授權,以確保使用者可以安全存取和管理監控基礎設施。
如需啟用 IAM Identity Center 的詳細指引,請參閱《AWS IAM Identity Center 使用者指南》中的啟用 IAM Identity Center 一節。
成功啟用 IAM Identity Center 後,請設定一個使用者帳戶,其將在下列整個組態程序中擔任管理使用者。
建立和部署 CloudFormation 堆疊以實現 SageMaker HyperPod 可觀測性
為 SageMaker HyperPod 可觀測性建立和部署 CloudFormation 堆疊,以使用 Amazon Managed Service for Prometheus 和 Amazon Managed Grafana 即時監控 HyperPod 叢集指標。若要部署堆疊,請注意,您也應該事先啟用 IAM Identity Center
使用範例 CloudFormation 指令碼 cluster-observability.yaml