Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Elastic Fabric Adapter
Elastic Fabric Adapter (EFA) è un dispositivo di rete che dispone di funzionalità di bypass del sistema operativo per comunicazioni di rete a bassa latenza con altre istanze sulla stessa sottorete. EFA è esposto utilizzando Libfabric e può essere utilizzato dalle applicazioni che utilizzano l'interfaccia MPI (Messaging Passing Interface).
Per utilizzare EFA con AWS ParallelCluster e uno Slurm scheduler, imposta SlurmQueues//ComputeResourcesEfa/Enabledsu. true
Per visualizzare l'elenco delle istanze Amazon EC2 che supportano EFA, consulta Tipi di istanze supportati nella Guida per l'utente di Amazon EC2 per le istanze Linux.
Ti consigliamo di eseguire le istanze abilitate per EFA in un gruppo di collocamento. In questo modo le istanze vengono lanciate in un gruppo a bassa latenza in un'unica zona di disponibilità. Per ulteriori informazioni su come configurare i gruppi di collocamento con AWS ParallelCluster, vedere SlurmQueues//. NetworkingPlacementGroup
Nota
Elastic Fabric Adapter (EFA) non è supportato in diverse zone di disponibilità. Per ulteriori informazioni, consulta Scheduling//Networking SlurmQueues/. SubnetIds
Nota
Per impostazione predefinita, Ubuntu le distribuzioni abilitano la protezione ptrace (traccia del processo). ptracela protezione è disabilitata in modo che Libfabric funzioni correttamente. Per ulteriori informazioni, consulta Disabilita la protezione ptrace nella Guida per l'utente di Amazon EC2.
Configurazione di rete EFA predefinita
A partire dalla versione AWS ParallelCluster 3.15.0, quando EFA è abilitato, configura AWS ParallelCluster automaticamente le interfacce di rete solo EFA per separare il traffico EFA dal traffico IP. Ciò massimizza la larghezza di banda EFA riducendo al minimo il consumo di indirizzi IP. AWS ParallelCluster determina la configurazione ottimale in base alle funzionalità del tipo di istanza.
Questa configurazione predefinita è consigliata per la maggior parte dei carichi di lavoro, tra cui HPC strettamente abbinato e formazione distribuita. AI/ML
Personalizzazione delle interfacce di rete EFA
Se il carico di lavoro richiede una configurazione di rete diversa, ad esempio l'ottimizzazione della larghezza di banda ENA sulle schede di rete secondarie o la configurazione di un sottoinsieme di schede di rete disponibili, è possibile sovrascrivere le impostazioni predefinite utilizzando il parametro//. SlurmQueuesComputeResourcesLaunchTemplateOverrides Ciò sostituisce l'intera configurazione dell'interfaccia di rete dei nodi di calcolo con la configurazione definita nel modello di avvio.
Per una step-by-step procedura dettagliata, consulta. Personalizza le interfacce di rete dei nodi di calcolo con sostituzioni dei modelli di avvio
avvertimento
Se configuri le interfacce di rete in un modo non supportato dal tipo di istanza, le istanze non verranno avviate. Per verificare le configurazioni di rete supportate per il tuo tipo di istanza, consulta DescribeInstanceTypesil riferimento alle API di Amazon EC2.
Per ulteriori informazioni, consulta Elastic Fabric Adapter nella Guida per l'utente di Amazon EC2 e ridimensiona i carichi di lavoro HPC con Elastic Fabric Adapter e AWS ParallelCluster