

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# AWS GPU AMI de aprendizado profundo PyTorch 2.4 (Ubuntu 22.04)
<a name="aws-deep-learning-ami-gpu-pytorch-2.4-ubuntu-22-04"></a>

Se precisar de ajuda para começar, consulte [Conceitos básicos da DLAMI](getting-started.md).

#### Formato de nome da AMI
<a name="name-gpu-pytorch-2.4-ubuntu-22-04"></a>
+ Driver OSS Nvidia de aprendizado profundo AMI PyTorch GPU 2.4. \$1 \$1PATCH\$1VERSION\$1 (Ubuntu 22.04) \$1 \$1YYYY-MM-DD\$1

#### Instâncias do EC2 com suporte
<a name="instances-gpu-pytorch-2.4-ubuntu-22-04"></a>
+ Consulte [Alterações importantes no DLAMI](important-changes.md).
+ O aprendizado profundo com driver OSS Nvidia é compatível com G4dn, G5, G6, Gr6, P4, P4de, P5, P5e e P5en.

#### A AMI inclui o seguinte:
<a name="contents-gpu-pytorch-2.4-ubuntu-22-04"></a>
+ ** AWS Serviço suportado**: EC2
+ **Sistema operacional**: Ubuntu 22.04
+ **Arquitetura de computação**: x86
+ **Python**:/opt/conda/envs/pytorch/bin/python
+ **Driver NVIDIA**:
  + Driver OSS Nvidia: 550.144.03
+ **Pilha NVIDIA CUDA12 4.1:**
  + Caminho de instalação de CUDA, NCCL e cuDDN:/-12.4/ usr/local/cuda
  + **CUDA padrão:** 12.4
    + CAMINHO/usr/local/cuda points to /usr/local/cuda-12.4/
    + Variáveis de ambiente atualizadas abaixo:
      +  LD\$1LIBRARY\$1PATH para ter/usr/local/cuda/lib:/usr/local/cuda/lib64:/usr/local/cuda:/usr/local/cuda/targets/x86\$164-linux/lib
      + PATH para ter/usr/local/cuda/bin/:/usr/local/cuda/include/
  + Versão NCCL do sistema compilado presente em/usr/local/cuda/: 2.21.5
  + PyTorch Versão NCCL compilada do ambiente PyTorch conda: 2.20.5
+  **Local dos testes NCCL:** 
  + all\$1reduce, all\$1gather e reduce\$1scatter:/-cuda-xx.x/ usr/local/cuda-xx.x/efa/test
  + Para executar testes NCCL, o LD\$1LIBRARY\$1PATH já está atualizado com os caminhos necessários.
    +  PATHs Os comuns já foram adicionados ao LD\$1LIBRARY\$1PATH:
      +  /opt/amazon/efa/lib:/opt/amazon/openmpi/lib:/opt/aws-ofi-nccl/lib:/usr/local/lib:/usr/lib
  + LD\$1LIBRARY\$1PATH é atualizado com caminhos de versão CUDA
    +  /usr/local/cuda/lib:/usr/local/cuda/lib64:/usr/local/cuda:/usr/local/cud/targets/x86\$164-linux/lib
+ **Instalador do EFA**: 1.34.0
+ **Nvidia GDRCopy: 2.4.1**
+ **Nvidia Transformer Engine:** v1.11.0
+ **AWS Plugin OFI NCCL**: é instalado como parte do EFA Installer-AWS
  + O **caminho de instalação:**/opt/aws-ofi-nccl/ . Path /opt/aws-ofi-nccl/libé adicionado ao LD\$1LIBRARY\$1PATH.
  + **Testa o caminho** para o anel, message\$1transfer:/opt/aws-ofi-nccl/tests
  + Nota: o PyTorch pacote também vem com o plug-in AWS OFI NCCL vinculado dinamicamente como um pacote conda e PyTorch usará esse aws-ofi-nccl-dlc pacote em vez do sistema OFI NCCL. AWS 
+ **AWS CLI v2** **como aws2 e AWS CLI v1 como aws**
+ **Tipo de volume do EBS**: gp3
+ **Versão do Python:** 3.11
+  **Consulte o AMI-ID com o parâmetro SSM (a região de exemplo é us-east-1):** 
  +  **Driver OSS Nvidia**: 

    ```
    aws ssm get-parameter --region us-east-1 \
            --name /aws/service/deeplearning/ami/x86_64/oss-nvidia-driver-gpu-pytorch-2.4-ubuntu-22.04/latest/ami-id \
            --query "Parameter.Value" \
            --output text
    ```
+  **Consulte o AMI-ID com AWSCLI (a região de exemplo é us-east-1):** 
  +  **Driver OSS Nvidia:** 

    ```
    aws ec2 describe-images --region us-east-1 \
        --owners amazon \
        --filters 'Name=name,Values=Deep Learning OSS Nvidia Driver AMI GPU PyTorch 2.4.? (Ubuntu 22.04) ????????' 'Name=state,Values=available' \
        --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' \
        --output text
    ```

#### Notices
<a name="notices-gpu-pytorch-2.4-ubuntu-22-04"></a>

**Instâncias P5/P5e**
+ DeviceIndex é exclusivo para cada um NetworkCard e deve ser um número inteiro não negativo menor que o limite de ENIs por. NetworkCard Em P5, o número de ENIs por NetworkCard é 2, o que significa que os únicos valores válidos para DeviceIndex são 0 ou 1. Abaixo está o exemplo do comando de inicialização da instância P5 do EC2 usando awscli que aparece NetworkCardIndex do número 0-31 e DeviceIndex como 0 para a primeira interface e DeviceIndex como 1 para as demais 31 interfaces.

```
aws ec2 run-instances --region $REGION \
    --instance-type $INSTANCETYPE \
    --image-id $AMI --key-name $KEYNAME \
    --iam-instance-profile "Name=dlami-builder" \
    --tag-specifications "ResourceType=instance,Tags=[{Key=Name,Value=$TAG}]" \
    --network-interfaces "NetworkCardIndex=0,DeviceIndex=0,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=1,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=2,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=3,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=4,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      ...
      "NetworkCardIndex=31,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa"
```

#### Data de lançamento: 2025-02-17
<a name="2025-02-17-gpu-pytorch-2.4-ubuntu-22-04"></a>

**Nome da AMI:** Deep Learning OSS Nvidia Driver AMI GPU PyTorch 2.4.1 (Ubuntu 22.04) 20250216

##### Atualização
<a name="w2aac25c13b7c11c13b5"></a>
+ Atualização do NVIDIA Container Toolkit da versão 1.17.3 para 1.17.4.
  + Consulte a página de notas de lançamento aqui para obter mais informações: [ https://github.com/NVIDIA/nvidia-container-toolkit/releases/tag/v1.17.4](https://github.com/NVIDIA/nvidia-container-toolkit/releases/tag/v1.17.4)
  + No NVIDIA Container Toolkit versão 1.17.4, a montagem das bibliotecas compatíveis com CUDA agora está desabilitada. Para garantir a compatibilidade com várias versões do CUDA em fluxos de trabalho de contêiner, atualize o LD\$1LIBRARY\$1PATH para incluir as bibliotecas compatíveis com CUDA, conforme mostrado no tutorial [Se você usa uma camada de compatibilidade com CUDA](https://docs.aws.amazon.com/sagemaker/latest/dg/inference-gpu-drivers.html#collapsible-cuda-compat).

#### Data de lançamento: 2025-01-21
<a name="2025-01-21-gpu-pytorch-2.4-ubuntu-22-04"></a>

**Nome da AMI:** Deep Learning OSS Nvidia Driver AMI GPU PyTorch 2.4.1 (Ubuntu 22.04) 20250119

##### Atualização
<a name="w2aac25c13b7c11c15b5"></a>
+ Atualização do driver Nvidia da versão 550.127.05 para 550.144.03 para corrigir as CVEs presentes no [NVIDIA GPU Display Driver Security Bulletin de janeiro de 2025](https://nvidia.custhelp.com/app/answers/detail/a_id/5614).

#### Data de lançamento: 2024-11-18
<a name="2024-11-18-gpu-pytorch-2.4-ubuntu-22-04"></a>

**Nome da AMI:** Deep Learning OSS Nvidia Driver AMI GPU PyTorch 2.4.1 (Ubuntu 22.04) 20241116

##### Fixo
<a name="w2aac25c13b7c11c17b5"></a>
+ Devido a uma alteração no kernel do Ubuntu para solucionar defeitos na funcionalidade de Randomização do Layout do Espaço de Endereçamento do Kernel (KASLR), as instâncias G4Dn/G5 não conseguem inicializar corretamente o CUDA no driver OSS Nvidia. Para mitigar esse problema, esse DLAMI inclui uma funcionalidade que carrega dinamicamente o driver proprietário para instâncias G4Dn e G5. Aguarde um breve período de inicialização desse carregamento para garantir que as instâncias funcionem corretamente.
  + Para conferir o status e a integridade desse serviço, use estes comandos:

```
sudo systemctl is-active dynamic_driver_load.service active
```

#### Data de lançamento: 2024-10-16
<a name="2024-10-16-gpu-pytorch-2.4-ubuntu-22-04"></a>

**Nome da AMI**: Deep Learning OSS Nvidia Driver AMI GPU PyTorch 2.4.1 (Ubuntu 22.04) 20241016

##### Adição
<a name="w2aac25c13b7c11c19b5"></a>
+ [Foi adicionada a Nvidia TransformerEngine v1.11.0 para acelerar os modelos Transformer (para obter mais detalhes, consulte transformer- .html) https://docs.nvidia.com/deeplearning/ engine/user-guide/index](https://docs.nvidia.com/deeplearning/transformer-engine/user-guide/index.html)

#### Data de lançamento: 2024-09-30
<a name="2024-09-30-gpu-pytorch-2.4-ubuntu-22-04"></a>

**Nome da AMI**: Deep Learning OSS Nvidia Driver AMI GPU PyTorch 2.4.1 (Ubuntu 22.04) 20240929

##### Atualização
<a name="w2aac25c13b7c11c21b5"></a>
+ Atualização do Nvidia Container Toolkit da versão 1.16.1 para a 1.16.2, solucionando a vulnerabilidade de segurança [CVE-2024-0133](https://nvd.nist.gov/vuln/detail/CVE-2024-0133).

#### Data de lançamento: 2024-09-26
<a name="2024-09-26-gpu-pytorch-2.4-ubuntu-22-04"></a>

**Nome da AMI**: Deep Learning OSS Nvidia Driver AMI GPU PyTorch 2.4.1 (Ubuntu 22.04) 20240925

##### Adição
<a name="w2aac25c13b7c11c23b5"></a>
+ Lançamento inicial da série Deep Learning AMI GPU PyTorch 2.4.1 (Ubuntu 22.04). Incluindo um ambiente conda pytorch complementado com NVIDIA Driver R550, CUDA=12.4.1, cuDNN=8.9.7, NCCL=2.20.5 e EFA=1.34.0. PyTorch 