Elastic Fabric Adapter - AWS ParallelCluster

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Elastic Fabric Adapter

Elastic Fabric Adapter(EFA)는 동일한 서브넷에 있는 다른 인스턴스와의 대기 시간이 짧은 네트워크 통신을 위한 OS 바이패스 기능을 갖춘 네트워크 디바이스입니다. EFA는 Libfabric을 사용하여 노출되며 Messaging Passing Interface(MPI)를 사용하는 애플리케이션에서 사용할 수 있습니다.

AWS ParallelCluster 및 Slurm 스케줄러와 함께 EFA를 사용하려면 SlurmQueues / ComputeResources / Efa /를 Enabled로 설정합니다true.

EFA를 지원하는 Amazon EC2 인스턴스 목록을 보려면 Linux 인스턴스용 Amazon EC2 사용 설명서지원되는 인스턴스 유형을 참조하세요.

배치 그룹에서 EFA 지원 인스턴스를 실행하는 것이 좋습니다. 이렇게 하면 인스턴스가 단일 가용 영역의 지연율이 낮은 그룹에서 시작됩니다. AWS ParallelCluster를 사용하여 배치 그룹을 구성하는 방법에 대한 자세한 내용은 SlurmQueues/Networking/PlacementGroup를 참조하세요.

참고

여러 가용 영역에 걸친 Elastic Fabric Adapter(EFA)는 지원되지 않습니다. 자세한 내용은 Scheduling/SlurmQueues/Networking/SubnetIds를 참조하세요.

참고

기본적으로 Ubuntu 배포는 ptrace(프로세스 추적) 보호를 활성화합니다. Libfabric이 제대로 작동하도록 ptrace 보호가 비활성화됩니다. 자세한 정보는 Amazon EC2 사용 설명서ptrace 보호 비활성화를 참조하세요.

기본 EFA 네트워크 구성

AWS ParallelCluster 3.15.0부터 EFA가 활성화되면는 EFA 전용 네트워크 인터페이스를 AWS ParallelCluster 자동으로 구성하여 EFA 트래픽을 IP 트래픽과 분리합니다. 이렇게 하면 IP 주소 소비를 최소화하면서 EFA 대역폭이 극대화됩니다.는 인스턴스 유형의 기능을 기반으로 최적의 구성을 AWS ParallelCluster 결정합니다.

이 기본 구성은 긴밀하게 결합된 HPC 및 분산 AI/ML 훈련을 포함하여 대부분의 워크로드에 권장됩니다.

EFA 네트워크 인터페이스 사용자 지정

워크로드에 보조 네트워크 카드에서 ENA 대역폭을 최대화하거나 사용 가능한 네트워크 카드의 하위 집합을 구성하는 등 다른 네트워크 구성이 필요한 경우 SlurmQueues / ComputeResources / LaunchTemplateOverrides 파라미터를 사용하여 기본 설정을 재정의할 수 있습니다. 이렇게 하면 컴퓨팅 노드의 전체 네트워크 인터페이스 구성이 시작 템플릿에 정의된 구성으로 바뀝니다.

step-by-step 연습은 단원을 참조하십시오시작 템플릿 재정의로 컴퓨팅 노드 네트워크 인터페이스 사용자 지정.

주의

인스턴스 유형에서 지원하지 않는 방식으로 네트워크 인터페이스를 구성하면 인스턴스가 시작되지 않습니다. 인스턴스 유형에 지원되는 네트워크 구성을 확인하려면 Amazon EC2 API 참조의 DescribeInstanceTypes를 참조하세요.

자세한 내용은 Amazon EC2 사용 설명서Elastic Fabric AdapterAWS 오픈 소스 블로그Elastic Fabric Adapter 및 AWS ParallelCluster를 사용한 HPC 워크로드 규모 조정을 참조하세요.