

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# HyperPod 클러스터 노드에서 대화형으로 수명 주기 스크립트 개발
<a name="sagemaker-hyperpod-lifecycle-best-practices-slurm-slurm-develop-lifecycle-scripts"></a>

이 섹션에서는 HyperPod 클러스터를 반복적으로 생성 및 삭제하지 않고 수명 주기 스크립트를 대화형으로 개발하는 방법을 설명합니다.

1. 기본 수명 주기 스크립트를 사용하여 HyperPod 클러스터를 생성합니다.

1. 클러스터 노드에 로그인합니다.

1. 노드에서 스크립트(`configure_xyz.sh`)를 편집하고 반복적으로 실행하여 스크립트를 개발합니다.

   1. HyperPod는 수명 주기 스크립트를 루트 사용자로 실행하므로 개발 중에 `configure_xyz.sh`를 루트 사용자로 실행하여 HyperPod 에서 실행되는 동안 스크립트가 동일한 조건에서 테스트되는지 확인하는 것이 좋습니다.

1. 다음과 유사한 코드 줄을 추가하여 스크립트를 `lifecycle_script.py`에 통합합니다.

   ```
   ExecuteBashScript("./utils/configure_xyz.sh").run()
   ```

1. 업데이트된 수명 주기 스크립트를 처음에 기본 수명 주기 스크립트 업로드에 사용한 S3 버킷에 업로드합니다.

1. 새 HyperPod 클러스터를 생성하여 `lifecycle_script.py`의 통합 버전을 테스트합니다. 수동 인스턴스 교체를 사용하여 새 인스턴스를 생성하여 업데이트된 수명 주기 스크립트를 테스트할 수도 있습니다. 자세한 지침은 [노드 수동 교체를](https://docs.aws.amazon.com//sagemaker/latest/dg/sagemaker-hyperpod-resiliency-slurm-replace-faulty-instance.html#sagemaker-hyperpod-resiliency-slurm-replace-faulty-instance-replace) 참조하세요. 작업자 노드만 교체할 수 있습니다.