Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Elastic Fabric Adapter
Elastic Fabric Adapter (EFA) es un dispositivo de red que tiene funciones de omisión del sistema operativo para las comunicaciones en red de baja latencia con otras instancias en la misma subred. EFA se expone mediante Libfabric, y lo pueden utilizar las aplicaciones que utilizan Messaging Passing Interface (MPI).
Para usar EFA con un Slurm programador, AWS ParallelCluster defina///en. SlurmQueuesComputeResourcesEfaEnabledtrue
Para ver la lista de instancias de Amazon EC2 compatibles con EFA, consulte Tipos de instancias admitidas en la Guía del usuario para instancias de Linux de Amazon EC2.
Le recomendamos que ejecute las instancias habilitadas para EFA en un grupo de ubicación. De esta forma, las instancias se lanzan en un grupo de baja latencia en una única zona de disponibilidad. Para obtener más información sobre cómo configurar los grupos de ubicación con AWS ParallelCluster, consulte SlurmQueues/Networking/PlacementGroup.
nota
Elastic Fabric Adapter (EFA) no es compatible con diferentes zonas de disponibilidad. Para obtener más información, consulte Programación//Redes SlurmQueues/. SubnetIds
nota
De forma predeterminada, las distribuciones de Ubuntu habilitan la protección (seguimiento del proceso) de ptrace. La protección de ptrace está deshabilitada para que Libfabric funcione correctamente. Para obtener más información, consulte Deshabilitar la protección ptrace en la Guía del usuario de Amazon EC2.
Configuración de red EFA predeterminada
A partir de la AWS ParallelCluster versión 3.15.0, cuando EFA está activado, configura AWS ParallelCluster automáticamente las interfaces de red exclusivas de EFA para separar el tráfico EFA del tráfico IP. Esto maximiza el ancho de banda de la EFA y minimiza el consumo de direcciones IP. AWS ParallelCluster determina la configuración óptima en función de las capacidades del tipo de instancia.
Esta configuración predeterminada se recomienda para la mayoría de las cargas de trabajo, incluida la HPC estrechamente acoplada y la formación distribuida. AI/ML
Personalización de las interfaces de red EFA
Si su carga de trabajo requiere una configuración de red diferente, como maximizar el ancho de banda ENA en las tarjetas de red secundarias o configurar un subconjunto de tarjetas de red disponibles, puede anular la configuración predeterminada mediante el parámetro//. SlurmQueuesComputeResourcesLaunchTemplateOverrides Esto reemplaza toda la configuración de la interfaz de red de los nodos de procesamiento por la configuración definida en la plantilla de lanzamiento.
Para ver un step-by-step tutorial, consultePersonalice las interfaces de red de nodos de cómputo con anulaciones de plantillas de lanzamiento.
aviso
Si configuras las interfaces de red de una forma que no sea compatible con el tipo de instancia, las instancias no se lanzarán. Para verificar las configuraciones de red compatibles con su tipo de instancia, consulte la DescribeInstanceTypesreferencia de la API de Amazon EC2.
Para obtener más información, consulte Elastic Fabric Adapter en la Guía del usuario de Amazon EC2 y Escalado de las cargas de trabajo de HPC con Elastic Fabric Adapter y AWS ParallelCluster