本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
连接到 HyperPod 集群并向集群提交任务
您可以在 Amazon SageMaker Studio IDE 中的 HyperPod 集群上启动机器学习工作负载。当你在 HyperPod 集群上启动 Studio IDE 时,有一组命令可以帮助你入门。您可以在 Studio IDE 中处理训练脚本、将 Docker 容器用于训练脚本以及向集群提交作业。以下部分介绍如何将集群连接到 Studio IDE。
在 Amazon SageMaker Studio 中,您可以导航到集群中的一个HyperPod集群(在 “计算” 下),并查看您的集群列表。您可以将集群连接到操作下列出的 IDE。
您也可以从选项列表中选择自定义文件系统。有关如何进行此项设置的信息,请参阅在 Studio HyperPod 中设置。
或者,您也可以使用 AWS CLI创建空间并启动 IDE。为此,请使用以下命令。以下示例为 创建一个 user-profile-namePrivate JupyterLab 空间,并附加 适用于 Lustre 的 FSx 文件系统。fs-id
-
使用创建空间
create-spaceAWS CLI。 aws sagemaker create-space \ --regionyour-region\ --ownership-settings "OwnerUserProfileName=user-profile-name" \ --space-sharing-settings "SharingType=Private" \ --space-settings "AppType=JupyterLab,CustomFileSystems=[{FSxLustreFileSystem={FileSystemId=fs-id}}]" -
使用创建应用程序
create-appAWS CLI。 aws sagemaker create-app \ --regionyour-region\ --space-namespace-name\ --resource-spec '{"ec2InstanceType":"'"instance-type"'","appEnvironmentArn":"'"image-arn"'"}'
打开您的应用程序后,可以直接向连接到的集群提交任务。