

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 在上创建 Slurm 集群之前验证 JSON 配置文件 HyperPod
<a name="sagemaker-hyperpod-lifecycle-best-practices-slurm-slurm-validate-json-files"></a>

要在提交集群创建请求前验证 JSON 配置文件，请使用配置验证脚本 [https://github.com/aws-samples/awsome-distributed-training/blob/main/1.architectures/5.sagemaker-hyperpod/validate-config.py](https://github.com/aws-samples/awsome-distributed-training/blob/main/1.architectures/5.sagemaker-hyperpod/validate-config.py)。该脚本解析并比较您的 HyperPod 集群配置 JSON 文件和 Slurm 配置 JSON 文件，并确定这两个文件之间以及亚马逊 EC2、Amazon VPC 和亚马逊资源之间是否存在任何资源配置错误。 FSx 例如，要验证 [提供的基本生命周期脚本 HyperPod](sagemaker-hyperpod-lifecycle-best-practices-slurm-slurm-base-config.md) 一节的 `create_cluster.json` 和 `provisioning_parameters.json` 文件，请按以下步骤运行验证脚本。

```
python3 validate-config.py --cluster-config create_cluster.json --provisioning-parameters provisioning_parameters.json
```

下面是一个成功验证的输出示例。

```
✔️  Validated instance group name worker-group-1 is correct ...

✔️  Validated subnet subnet-012345abcdef67890 ...
✔️  Validated security group sg-012345abcdef67890 ingress rules ...
✔️  Validated security group sg-012345abcdef67890 egress rules ...
✔️  Validated FSx Lustre DNS name fs-012345abcdef67890.fsx.us-east-1.amazonaws.com
✔️  Validated FSx Lustre mount name abcdefgh
✅ Cluster Validation succeeded
```