

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# AWS PCS의 Slurm 버전
<a name="slurm-versions"></a>

SchedMD는 새로운 기능, 최적화 및 보안 패치로 Slurm을 지속적으로 개선합니다. SchedMD는 [정기적으로](https://slurm.schedmd.com/upgrades.html#release_cycle) 새 메이저 버전을 릴리스하고 언제든지 최대 3개의 버전을 지원할 계획입니다. AWS PCS는 패치 버전으로 Slurm 컨트롤러를 자동으로 업데이트하도록 설계되었습니다.

SchedMD가 특정 메이저 버전에 대한 [지원을](https://slurm.schedmd.com/upgrades.html#compatibility_window) 종료하면 AWS PCS는 해당 버전을 수명 종료(EOL)로 지정합니다. EOL 후에는 기존 클러스터가 지원을 보장하지 않고 최대 12개월 동안 계속 실행될 수 있지만 해당 버전으로 새 클러스터를 생성할 수 없습니다. Slurm 메이저 버전이 EOL에 가까운 경우 고객이 클러스터를 최신 지원 버전으로 업그레이드할 시기를 알 수 있도록 AWS PCS는 사전 알림을 보냅니다.

지원되는 최신 Slurm 버전을 사용하여 클러스터를 배포하고 최신 개선 및 개선 사항에 액세스하는 것이 좋습니다.

## AWS PCS에서 지원되는 Slurm 버전
<a name="slurm-versions_releases"></a>

다음 표에는 지원되는 Slurm 버전과 각 버전에 대한 중요한 날짜 및 정보가 나와 있습니다.


| Slurm 버전 | SchedMD 릴리스 날짜 | AWS PCS 릴리스 날짜 | AWS PCS EOL 날짜 | 호환되는 최소 AWS PCS 에이전트 버전 | 지원되는 AWS PCS 샘플 AMIs | 
| --- | --- | --- | --- | --- | --- | 
| 25.05 | 5/29/2025 | 10/16/2025 | 5/31/2027 | 1.0.0-1 |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/ko_kr/pcs/latest/userguide/slurm-versions.html)  | 
| 24.11 | 11/29/2024 | 5/14/2025 | 5/31/2026 | 1.0.0-1 |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/ko_kr/pcs/latest/userguide/slurm-versions.html)  | 

## AWS PCS에서 지원되지 않는 Slurm 버전
<a name="slurm-versions_unsupported"></a>

다음 표에는 AWS PCS에서 지원되지 않는 Slurm 버전이 나와 있습니다.


| Slurm 버전 | SchedMD 릴리스 날짜 | AWS PCS 릴리스 날짜 | AWS PCS EOL 날짜 | 
| --- | --- | --- | --- | 
| 24.05 | 5/30/2024 | 12/18/2024 | 11/30/2025 | 
| 23.11 | 11/21/2023 | 8/28/2024 | 5/31/2025 | 

# AWS PCS의 Slurm 버전 릴리스 정보
<a name="slurm-versions_release-notes"></a>

이 주제에서는 현재 AWS PCS에서 지원되는 각 Slurm 버전의 중요한 변경 사항에 대해 설명합니다. 클러스터를 업그레이드할 때 이전 버전과 새 버전 간의 변경 사항을 검토하는 것이 좋습니다.

## Slurm 25.05
<a name="slurm-versions_release-notes_25.05"></a>

**AWS PCS에 구현된 변경 사항**
+ 이제 Slurm requeue\$1on\$1resume\$1failure SchedulerParameter가 기본적으로 활성화되어 있습니다.
+ "stderr"는 Slurm 25.05에서 비활성화되었으므로 LogTimeFormat의 옵션으로 제거되었습니다.
+ AWS PCS는 다중 클러스터 sackd 구성을 지원합니다. 로그인 노드는 여러 클러스터에 액세스할 수 있습니다.

Slurm 25.05에 대한 자세한 내용은 다음 간행물을 참조하세요.
+ SchedMD 릴리스 발표: [https://www.schedmd.com/slurm-version-25-05-0-is-now-available/](https://www.schedmd.com/slurm-version-25-05-0-is-now-available/)
+ SchedMD 릴리스 정보: [https://github.com/SchedMD/slurm/blob/slurm-25-05-0-1/RELEASE\$1NOTES.md](https://github.com/SchedMD/slurm/blob/slurm-25-05-0-1/RELEASE_NOTES.md)

## Slurm 24.11
<a name="slurm-versions_release-notes_24.11"></a>

**AWS PCS에 구현된 변경 사항**
+ AWS PCS는 Slurm 회계를 지원합니다. 자세한 내용은 [AWS PCS의 Slurm 회계](slurm-accounting.md) 단원을 참조하십시오.

Slurm 24.11에 대한 자세한 내용은 다음 간행물을 참조하세요.
+ [SchedMD 릴리스 발표](https://www.schedmd.com/slurm-version-24-11-0-is-now-available/)
+ [SchedMD 릴리스 정보](https://github.com/SchedMD/slurm/blob/slurm-24-11-0-1/RELEASE_NOTES)

## Slurm 24.05
<a name="slurm-versions_release-notes_24.05"></a>

**AWS PCS에 구현된 변경 사항**
+ 이제 새 Slurm Step Manager 모듈이 AWS PCS에서 기본적으로 활성화됩니다. 이 모듈은 단계 관리를 중앙 컨트롤러에서 컴퓨팅 노드로 오프로드하여 단계 사용량이 많은 환경에서 시스템 동시성을 크게 개선함으로써 상당한 이점을 제공합니다. 이 구성을 지원하고 더 나은 격리 `Prolog` 및 `Epilog` 프로세스 실행을 위해 새 prolog 플래그(`Contain`, `Alloc`)가 활성화됩니다.
+ 컨트롤러에서 컴퓨팅 노드로의 계층적 통신은 Slurm 노드 내 통신을 최적화하도록 활성화되어 확장성과 성능을 개선합니다. 또한 라우팅 구성은 이제 플러그인의 기본 라우팅 알고리즘 대신 컨트롤러와의 통신에 파티션 노드 목록을 사용하여 시스템 복원력을 개선합니다.
+ 새 해시 플러그인은 이전를 `HashPlugin=hash/sha3` 대체합니다`hash/k12 plugin`. 이제 AWS PCS 클러스터에서이 기능이 기본적으로 활성화됩니다.
+ Slurm 컨트롤러 로그에는 이제에 대한 모든 인바운드 원격 프로시저 호출(RPC)에 대한 향상된 감사 기능이 포함됩니다`slurmctld`. 로그에는 연결 처리 전 소스 주소, 인증된 사용자 및 RPC 유형이 포함됩니다.

Slurm 24.05에 대한 자세한 내용은 다음 간행물을 참조하세요.
+ [SchedMD 릴리스 발표](https://www.schedmd.com/slurm-version-24-05-0-is-now-available/)
+ [SchedMD 릴리스 정보](https://github.com/SchedMD/slurm/blob/slurm-24-05-0-1/RELEASE_NOTES)

## Slurm 23.11
<a name="slurm-versions_release-notes_23.11"></a>

**AWS PCS에서 변경할 수 있는 Slurm 설정**
+  의 `SuspendTime` 기본값은 입니다`60`. AWS PCS `scaleDownIdleTimeInSeconds` 구성 파라미터를 사용하여 설정합니다. 자세한 내용은 *AWS PCS API* 참조에서 `ClusterSlurmConfiguration` 데이터 형식의 [https://docs.aws.amazon.com//pcs/latest/APIReference/API_ClusterSlurmConfiguration.html#PCS-Type-ClusterSlurmConfiguration-scaleDownIdleTimeInSeconds](https://docs.aws.amazon.com//pcs/latest/APIReference/API_ClusterSlurmConfiguration.html#PCS-Type-ClusterSlurmConfiguration-scaleDownIdleTimeInSeconds) 파라미터를 참조하세요.
+  `MaxJobCount` 및 `MaxArraySize`는 클러스터에 대해 선택한 크기를 기반으로 합니다. 자세한 내용은 *AWS PCS* `CreateCluster` API 참조에서 API 작업의 [https://docs.aws.amazon.com//pcs/latest/APIReference/API_CreateCluster.html#PCS-CreateCluster-request-size](https://docs.aws.amazon.com//pcs/latest/APIReference/API_CreateCluster.html#PCS-CreateCluster-request-size) 파라미터를 참조하세요.
+  `SelectTypeParameters` Slurm 설정은 기본적으로 입니다`CR_CPU`. 클러스터를 생성할 때 `slurmCustomSettings`에서 설정할 값으로 제공할 수 있습니다. 자세한 내용은 API 작업의 [https://docs.aws.amazon.com//pcs/latest/APIReference/API_ClusterSlurmConfigurationRequest.html#PCS-Type-ClusterSlurmConfigurationRequest-slurmCustomSettings](https://docs.aws.amazon.com//pcs/latest/APIReference/API_ClusterSlurmConfigurationRequest.html#PCS-Type-ClusterSlurmConfigurationRequest-slurmCustomSettings) 파라미터 및 PCS `CreateCluster` API 참조의 [SlurmCustomSetting](https://docs.aws.amazon.com//pcs/latest/APIReference/API_SlurmCustomSetting.html)을 참조하세요. *AWS * 
+ 클러스터 `Epilog` 수준에서 `Prolog` 및를 설정할 수 있습니다. 클러스터를 생성할 때 `slurmCustomSettings`에서 설정할 값으로 제공할 수 있습니다. 자세한 내용은 [https://docs.aws.amazon.com//pcs/latest/APIReference/API_CreateCluster.html](https://docs.aws.amazon.com//pcs/latest/APIReference/API_CreateCluster.html) 및 PCS API 참조의 [SlurmCustomSetting](https://docs.aws.amazon.com//pcs/latest/APIReference/API_SlurmCustomSetting.html)을 참조하세요. *AWS * 
+ 컴퓨팅 노드 그룹 수준에서 `Weight` 및 `RealMemory`를 설정할 수 있습니다. 컴퓨팅 노드 그룹을 생성할 때에서 `slurmCustomSettings` 설정할 값으로 제공할 수 있습니다. 자세한 내용은 PCS API 참조의 [https://docs.aws.amazon.com//pcs/latest/APIReference/API_CreateComputeNodeGroup.html](https://docs.aws.amazon.com//pcs/latest/APIReference/API_CreateComputeNodeGroup.html) 및 [SlurmCustomSetting](https://docs.aws.amazon.com//pcs/latest/APIReference/API_SlurmCustomSetting.html)을 참조하세요. *AWS * 

# AWS PCS의 Slurm 버전에 대해 자주 묻는 질문
<a name="slurm-versions_faq"></a>

AWS PCS는 여러 Slurm 버전에 대한 지원을 유지합니다. 새 Slurm 버전이 도입되면 AWS PCS는 해당 버전이 SchedMD에서 지원 종료(EOS)에 도달할 때까지 기술 지원 및 보안 패치를 제공합니다. AWS PCS는 AWS 용어와 일치하도록 Slurm 버전의 EOS 날짜를 수명 종료(EOL)로 지칭합니다.

**AWS PCS는 Slurm 버전을 얼마나 오래 지원하나요?**  
AWS Slurm 버전에 대한 PCS 지원은 SchedMD의 메이저 버전 지원 주기와 일치합니다. AWS PCS는 현재 버전과 2개의 최신 이전 메이저 버전을 지원합니다. SchedMD가 새 메이저 버전을 릴리스하면 AWS PCS는 지원되는 가장 오래된 버전에 대한 지원을 종료합니다. AWS PCS는 가능한 한 빨리 Slurm의 새 메이저 버전을 릴리스하지만 SchedMD의 릴리스와 AWS PCS에서의 가용성 사이에 지연이 있을 수 있습니다.

**클러스터가 새 Slurm 패치 버전 릴리스를 받으려면 어떻게 해야 하나요?**  
 버그 및 보안 수정을 해결하기 위해 AWS PCS는 내부 서비스 소유 계정에서 실행되는 클러스터 컨트롤러에 패치를 자동으로 적용하도록 설계되었습니다. 의 EC2 인스턴스에 패치를 설치하려면 컴퓨팅 노드 그룹의 AWS 계정 Amazon Machine Image(AMI)를 업데이트하고 업데이트된 AMI를 사용하도록 컴퓨팅 노드 그룹을 업데이트합니다. 자세한 내용은 [AWS PCS용 사용자 지정 Amazon Machine Image(AMIs)](working-with_ami_custom.md) 단원을 참조하십시오.

**참고**  
 Slurm 컨트롤러는 업데이트하는 동안 사용할 수 없습니다. 실행 중인 작업은 영향을 받지 않습니다. 클러스터의 컨트롤러를 사용할 수 없게 되기 전에 제출된 작업은 컨트롤러를 사용할 수 있을 때까지 보류됩니다.

**예정된 Slurm 버전 EOL 이벤트에 대한 정보는 어떻게 받나요?**  
 EOL 날짜 6개월 전에 이메일 메시지가 전송됩니다. 매월 EOL 날짜 1주일 전에 최종 이메일 메시지와 함께 EOL 날짜 1주일 전에 이메일 메시지가 전송됩니다. EOL 날짜 이후에는 EOL Slurm 버전으로 AWS PCS 클러스터를 실행하는 고객에게 12개월 동안 매월 이메일 메시지를 보냅니다. 해당 버전에 대한 보안 취약성이 식별되면 EOL Slurm 버전이 있는 클러스터를 일시 중지할 수 있습니다.

**클러스터에서 사용하는 Slurm 버전이 EOL Slurm 버전을 실행 중인지 확인하려면 어떻게 해야 하나요?**  
EOL Slurm 버전의 클러스터가 실행 중임을 알리는 이메일 메시지가 전송됩니다. EOL Slurm 버전을 사용하는 클러스터의 세부 정보가 포함된 AWS Health Dashboard 알림을 알림에 게시합니다. 또한 AWS PCS 콘솔을 사용하여 EOL Slurm 버전이 있는 클러스터를 식별할 수 있습니다.

**Slurm 버전이 EOL에 가깝거나 그 이상인 경우 어떻게 해야 하나요?**  
지원되는 최신 버전의 Slurm으로 새 클러스터를 생성하고 컴퓨팅 노드 그룹 AMIs. AMIs의 Slurm 버전과 실행 중인 EC2 인스턴스는 클러스터의 Slurm 버전보다 2개 이상 뒤쳐서는 안 됩니다. 자세한 내용은 [AWS PCS용 사용자 지정 Amazon Machine Image(AMIs)](working-with_ami_custom.md) 단원을 참조하십시오.

**EOL 날짜까지 최신 버전의 Slurm으로 전환하지 않으면 어떻게 되나요?**  
EOL Slurm 버전으로 새 클러스터를 생성할 수 없습니다. 기존 클러스터는 AWS 지원 없이 최대 12개월 동안 작동할 수 있으며 작업을 유지 관리하는 데 즉각적인 조치가 필요하지 않습니다. EOL 날짜 이후에는 지원, 보안 업데이트 및 가용성이 보장되지 않습니다. 보안상의 이유로 클러스터를 일시 중지할 수 있습니다. 지원되는 Slurm 버전을 사용하여 AWS PCS 클러스터에 대한 보안 및 지원을 유지하는 것이 좋습니다.

**EOL Slurm 버전으로 클러스터를 운영할 경우 어떤 위험이 있나요?**  
EOL Slurm 버전이 있는 클러스터에는 상당한 보안 및 운영 위험이 있습니다. SchedMD의 활성 모니터링이 없으면 보안 취약성이 감지되지 않거나 해결되지 않을 수 있습니다. 중요한 취약성이 발견되면 클러스터를 즉시 일시 중지할 수 있습니다.

**클러스터가 일시 중지되면 작업, 클러스터 컴퓨팅, 스토리지 및 네트워킹 리소스는 어떻게 되나요?**  
 AWS PCS에서 관리하는 모든 리소스가 종료됩니다. 여기에는 Slurm 컨트롤러, 컴퓨팅 노드 그룹 및 EC2 인스턴스가 포함됩니다. 컴퓨팅 인스턴스에서 실행되는 모든 작업은 즉시 종료되고 클러스터는 일시 중지 상태로 전환됩니다. 외부 파일 시스템과 같은 고객 관리형 리소스는 그대로 유지됩니다. AWS PCS 콘솔 및 API 작업을 사용하여 클러스터의 구성에 액세스할 수 있습니다.

**일시 중지된 클러스터를 다시 시작하여 나머지 작업을 재개할 수 있습니까?**  
아니요, 일시 중지된 클러스터를 다시 시작할 수 없습니다. 일시 중지된 클러스터의 구성을 사용하여 지원되는 Slurm 버전으로 새 클러스터를 생성할 수 있습니다. 나머지 작업은 외부 파일 시스템에 저장한 경우 실행할 수 있습니다.

**12개월 유예 기간 이후에 연장을 요청할 수 있나요?**  
아니요. 12개월 유예 기간 이후에는 클러스터를 실행하도록 확장을 요청할 수 없습니다. 지원되는 Slurm 버전으로 전환하는 데 도움이 되도록 연장된 시간을 제공합니다. 클러스터 작업이 중단되지 않도록 Slurm 버전이 EOL에 도달하기 전에 전환하는 것이 좋습니다.