

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 在 HyperPod 群集节点上以交互方式开发生命周期脚本
<a name="sagemaker-hyperpod-lifecycle-best-practices-slurm-slurm-develop-lifecycle-scripts"></a>

本节介绍如何在不重复创建和删除 HyperPod 集群的情况下以交互方式开发生命周期脚本。

1. 使用基本生命周期脚本创建 HyperPod 集群。

1. 登录集群节点。

1. 通过编辑并在节点上反复运行脚本 (`configure_xyz.sh`) 来开发脚本。

   1. HyperPod 以 root 用户身份运行生命周期脚本，因此我们建议您在开发时以 root 用户身份运行，以确保脚本在运行时在相同的条件下进行测试 HyperPod。`configure_xyz.sh`

1. 通过添加类似以下代码的行，将脚本整合到 `lifecycle_script.py` 中。

   ```
   ExecuteBashScript("./utils/configure_xyz.sh").run()
   ```

1. 将更新的生命周期脚本上传到最初用于上传基本生命周期脚本的 S3 存储桶。

1. `lifecycle_script.py`通过创建新集 HyperPod 群来测试的集成版本。您也可以使用手动替换实例，通过创建新实例来测试更新的生命周期脚本。有关详细说明，请参阅[手动替换节点](https://docs.aws.amazon.com//sagemaker/latest/dg/sagemaker-hyperpod-resiliency-slurm-replace-faulty-instance.html#sagemaker-hyperpod-resiliency-slurm-replace-faulty-instance-replace)。请注意，只有工作节点是可更换的。