翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Elastic Fabric Adapter
Elastic Fabric Adapter (EFA) は、同じサブネット上の他のインスタンスとの低レイテンシーのネットワーク通信用の OS バイパス機能を備えたネットワークデバイスです。EFA は Libfabric を使用して公開され、メッセージングパッシングインターフェイス (MPI) を使用するアプリケーションで使用できます。
AWS ParallelCluster とスSlurmケジューラで EFA を使用するには、SlurmQueues/ComputeResources/// Efa Enabledを に設定しますtrue。
EFA をサポートする Amazon EC2 インスタンスのリストを確認するには、「Linux インスタンス用 Amazon EC2 ユーザーガイド」の「サポートされるインスタンスタイプ」を参照してください。
EFA 対応インスタンスはプレイスメントグループで実行することをお勧めします。これにより、インスタンスは、1 つのアベイラビリティーゾーン内の低レイテンシーグループに起動されます。 AWS ParallelClusterを使用してプレイスメントグループを設定する方法の詳細については、「SlurmQueues」/「Networking」/「PlacementGroup」を参照してください。
注記
Elastic Fabric Adapter (EFA) は、異なるアベイラビリティーゾーン間ではサポートされていません。詳細については、「スケジューリング」/「SlurmQueues」/「ネットワーク」/「SubnetIds」を参照してください。
注記
デフォルトでは、Ubuntu ディストリビューションは ptrace (プロセストレース) 保護を有効にします。Libfabric が正常に動作するように ptrace 保護は無効になっています。詳細については、「Amazon EC2 ユーザーガイド」の「ptrace 保護を無効にする」を参照してください。
デフォルトの EFA ネットワーク設定
EFA が有効になっている AWS ParallelCluster 3.15.0 以降、 は EFA のみのネットワークインターフェイス AWS ParallelCluster を自動的に設定して、EFA トラフィックを IP トラフィックから分離します。これにより、IP アドレスの消費を最小限に抑えながら EFA 帯域幅を最大化できます。 は、インスタンスタイプの機能に基づいて最適な設定 AWS ParallelCluster を決定します。
このデフォルト設定は、緊密に結合された HPC や分散 AI/ML トレーニングなど、ほとんどのワークロードに推奨されます。
EFA ネットワークインターフェイスのカスタマイズ
セカンダリネットワークカードでの ENA 帯域幅の最大化や使用可能なネットワークカードのサブセットの設定など、ワークロードに別のネットワーク設定が必要な場合は、// SlurmQueues ComputeResourcesLaunchTemplateOverridesパラメータを使用してデフォルト設定を上書きできます。これにより、コンピューティングノードのネットワークインターフェイス設定全体が、起動テンプレートで定義された設定に置き換えられます。
ステップstep-by-stepチュートリアルについては、「」を参照してください起動テンプレートの上書きを使用してコンピューティングノードのネットワークインターフェイスをカスタマイズする。
警告
インスタンスタイプでサポートされていない方法でネットワークインターフェイスを設定すると、インスタンスは起動に失敗します。インスタンスタイプでサポートされているネットワーク設定を確認するには、Amazon EC2 API リファレンス」のDescribeInstanceTypes」を参照してください。
詳細については、「Amazon EC2 ユーザーガイド」の「Elastic Fabric Adapter」と、「AWS Open Source Blog」の「Scale HPC workloads with elastic fabric adapter and AWS ParallelCluster