

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# AWS GPU AMI PyTorch 2.4 con apprendimento approfondito (Ubuntu 22.04)
<a name="aws-deep-learning-ami-gpu-pytorch-2.4-ubuntu-22-04"></a>

Per informazioni su come iniziare, consulta. [Guida introduttiva a DLAMI](getting-started.md)

#### Formato del nome AMI
<a name="name-gpu-pytorch-2.4-ubuntu-22-04"></a>
+ GPU AMI Nvidia Driver OSS con apprendimento approfondito 2.4 PyTorch . \$1 \$1PATCH\$1VERSION\$1 (Ubuntu 22.04) \$1 \$1YYYYY-MM-GG\$1

#### Istanze EC2 supportate
<a name="instances-gpu-pytorch-2.4-ubuntu-22-04"></a>
+ Consulta la sezione [Modifiche importanti a DLAMI](important-changes.md).
+ Deep Learning con OSS Il driver Nvidia supporta G4dn, G5, G6, Gr6, P4, P4de, P5, P5e, P5en.

#### L'AMI include quanto segue:
<a name="contents-gpu-pytorch-2.4-ubuntu-22-04"></a>
+ ** AWS Servizio supportato**: EC2
+ **Sistema operativo**: Ubuntu 22.04
+ **Architettura di calcolo**: x86
+ **Python**:/opt/conda/envs/pytorch/bin/python
+ **Driver NVIDIA**:
  + Driver del sistema operativo Nvidia: 550.144.03
+ ** CUDA12Pila NVIDIA** 2.1:
  + Percorso di installazione di CUDA, NCCL e cuDDN:/-12.4/ usr/local/cuda
  + **CUDA predefinito:** 12.4
    + PERCORSOusr/local/cuda points to /usr/local/cuda/-12.4/
    + Aggiornato di seguito le variabili di ambiente:
      +  LD\$1LIBRARY\$1PATH da avere/usr/local/cuda/lib:/usr/local/cuda/lib64:/usr/local/cuda:/usr/local/cuda/targets/x86\$164-linux/lib
      + PERCORSO da avere//usr/local/cuda/bin/:/usr/local/cuda/include
  + Versione NCCL del sistema compilato presente in/usr/local/cuda/: 2.21.5
  + PyTorch Versione NCCL compilata dall'ambiente conda: 2.20.5 PyTorch 
+  **Luogo dei test NCCL:** 
  + all\$1reduce, all\$1gather e reduce\$1scatter:/-cuda-xx.x/ usr/local/cuda-xx.x/efa/test
  + Per eseguire i test NCCL, LD\$1LIBRARY\$1PATH è già aggiornato con i percorsi necessari.
    + I comuni sono già stati aggiunti a LD\$1LIBRARY\$1PATH: PATHs 
      +  /opt/amazon/efa/lib:/opt/amazon/openmpi/lib:/opt/aws-ofi-nccl/lib:/usr/local/lib:/usr/lib
  + LD\$1LIBRARY\$1PATH viene aggiornato con i percorsi della versione CUDA
    +  /usr/local/cuda/lib:/usr/local/cuda/lib64:/usr/local/cuda:/usr/local/cud/targets/x86\$164-linux/lib
+ **Programma di installazione EFA**: 1.34.0
+ **Nvidia: GDRCopy** 2.4.1
+ **Motore Nvidia Transformer**: v1.11.0
+ **AWS Plugin OFI NCCL**: viene installato come parte di EFA Installer-AWS
  + Il **percorso di installazione:/viene aggiunto a LD\$1LIBRARY\$1PATH**. opt/aws-ofi-nccl/ . Path /opt/aws-ofi-nccl/lib
  + **Verifica il percorso per ring**, message\$1transfer:/opt/aws-ofi-nccl/tests
  + Nota: il PyTorch pacchetto include anche il plug-in AWS OFI NCCL collegato dinamicamente come pacchetto conda e PyTorch utilizzerà quel aws-ofi-nccl-dlc pacchetto invece del sistema OFI NCCL. AWS 
+ **AWS CLI **v2 come aws2 e v1 come aws AWS CLI ****
+ Tipo di **volume EBS: gp3**
+ **Versione Python**: 3.11
+  **Interroga l'AMI-ID con il parametro SSM (la regione di esempio è us-east-1):** 
  +  **Driver OSS Nvidia:** 

    ```
    aws ssm get-parameter --region us-east-1 \
            --name /aws/service/deeplearning/ami/x86_64/oss-nvidia-driver-gpu-pytorch-2.4-ubuntu-22.04/latest/ami-id \
            --query "Parameter.Value" \
            --output text
    ```
+  **Interroga l'AMI-ID con AWSCLI (la regione di esempio è us-east-1):** 
  +  **Driver OSS Nvidia:** 

    ```
    aws ec2 describe-images --region us-east-1 \
        --owners amazon \
        --filters 'Name=name,Values=Deep Learning OSS Nvidia Driver AMI GPU PyTorch 2.4.? (Ubuntu 22.04) ????????' 'Name=state,Values=available' \
        --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' \
        --output text
    ```

#### Note
<a name="notices-gpu-pytorch-2.4-ubuntu-22-04"></a>

**Istanze P5/P5e**
+ DeviceIndex è unico per ciascuna NetworkCard e deve essere un numero intero non negativo inferiore al limite di ENI per. NetworkCard In P5, il numero di ENI per NetworkCard è 2, il che significa che gli unici valori validi per DeviceIndex sono 0 o 1. Di seguito è riportato l'esempio del comando di avvio dell'istanza EC2 P5 che utilizza awscli visualizzato NetworkCardIndex dal numero 0-31 e DeviceIndex come 0 per la prima interfaccia e come 1 per le restanti 31 interfacce. DeviceIndex 

```
aws ec2 run-instances --region $REGION \
    --instance-type $INSTANCETYPE \
    --image-id $AMI --key-name $KEYNAME \
    --iam-instance-profile "Name=dlami-builder" \
    --tag-specifications "ResourceType=instance,Tags=[{Key=Name,Value=$TAG}]" \
    --network-interfaces "NetworkCardIndex=0,DeviceIndex=0,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=1,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=2,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=3,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=4,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      ...
      "NetworkCardIndex=31,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa"
```

#### Data di rilascio: 2025-02-17
<a name="2025-02-17-gpu-pytorch-2.4-ubuntu-22-04"></a>

**Nome AMI:** Deep Learning OSS Nvidia Driver AMI GPU PyTorch 2.4.1 (Ubuntu 22.04) 20250216

##### Aggiornato
<a name="w2aac25c13b7c11c13b5"></a>
+ Aggiornato NVIDIA Container Toolkit dalla versione 1.17.3 alla versione 1.17.4
  + [Per ulteriori informazioni, consulta la pagina delle note di rilascio qui:/1.17.4 https://github.com/NVIDIA/ nvidia-container-toolkit releases/tag/v](https://github.com/NVIDIA/nvidia-container-toolkit/releases/tag/v1.17.4)
  + Nella versione 1.17.4 di Container Toolkit, il montaggio delle librerie compatte CUDA è ora disabilitato. [Per garantire la compatibilità con più versioni CUDA sui flussi di lavoro dei container, assicurati di aggiornare LD\$1LIBRARY\$1PATH per includere le tue librerie di compatibilità CUDA, come mostrato nel tutorial If you use a CUDA compatibility layer.](https://docs.aws.amazon.com/sagemaker/latest/dg/inference-gpu-drivers.html#collapsible-cuda-compat)

#### Data di rilascio: 2025-01-21
<a name="2025-01-21-gpu-pytorch-2.4-ubuntu-22-04"></a>

**Nome AMI:** Deep Learning OSS Nvidia Driver AMI GPU PyTorch 2.4.1 (Ubuntu 22.04) 20250119

##### Aggiornato
<a name="w2aac25c13b7c11c15b5"></a>
+ [Driver Nvidia aggiornato dalla versione 550.127.05 alla 550.144.03 per soddisfare i requisiti CVE presenti nel NVIDIA GPU Display Driver Security Bulletin di gennaio 2025.](https://nvidia.custhelp.com/app/answers/detail/a_id/5614)

#### Data di rilascio: 2024-11-18
<a name="2024-11-18-gpu-pytorch-2.4-ubuntu-22-04"></a>

**Nome AMI:** Deep Learning OSS Nvidia Driver AMI GPU PyTorch 2.4.1 (Ubuntu 22.04) 20241116

##### Fixed
<a name="w2aac25c13b7c11c17b5"></a>
+ A causa di una modifica nel kernel Ubuntu per correggere un difetto nella funzionalità Kernel Address Space Layout Randomization (KASLR), le istanze G4Dn/G5 non sono in grado di inizializzare correttamente CUDA sul driver OSS Nvidia. Per mitigare questo problema, questo DLAMI include funzionalità che caricano dinamicamente il driver proprietario per le istanze G4Dn e G5. Attendi un breve periodo di inizializzazione per questo caricamento per garantire che le istanze siano in grado di funzionare correttamente.
  + Per verificare lo stato e l'integrità di questo servizio, puoi utilizzare i seguenti comandi:

```
sudo systemctl is-active dynamic_driver_load.service active
```

#### Data di rilascio: 2024-10-16
<a name="2024-10-16-gpu-pytorch-2.4-ubuntu-22-04"></a>

**Nome AMI**: Deep Learning OSS Nvidia Driver AMI GPU PyTorch 2.4.1 (Ubuntu 22.04) 20241016

##### Aggiunto
<a name="w2aac25c13b7c11c19b5"></a>
+ [Aggiunta Nvidia TransformerEngine v1.11.0 per accelerare i modelli Transformer (per maggiori dettagli, consulta transformer- .html) https://docs.nvidia.com/deeplearning/ engine/user-guide/index](https://docs.nvidia.com/deeplearning/transformer-engine/user-guide/index.html)

#### Data di rilascio: 2024-09-30
<a name="2024-09-30-gpu-pytorch-2.4-ubuntu-22-04"></a>

**Nome AMI**: Deep Learning OSS Nvidia Driver AMI GPU PyTorch 2.4.1 (Ubuntu 22.04) 20240929

##### Aggiornato
<a name="w2aac25c13b7c11c21b5"></a>
+ [Nvidia Container Toolkit è stato aggiornato dalla versione 1.16.1 alla 1.16.2, risolvendo la vulnerabilità di sicurezza CVE-2024-0133.](https://nvd.nist.gov/vuln/detail/CVE-2024-0133)

#### Data di rilascio: 2024-09-26
<a name="2024-09-26-gpu-pytorch-2.4-ubuntu-22-04"></a>

**Nome AMI**: Deep Learning OSS Nvidia Driver AMI GPU PyTorch 2.4.1 (Ubuntu 22.04) 20240925

##### Aggiunto
<a name="w2aac25c13b7c11c23b5"></a>
+ Versione iniziale della serie Deep Learning AMI GPU PyTorch 2.4.1 (Ubuntu 22.04). Include un pytorch in ambiente conda abbinato a NVIDIA Driver R550, CUDA=12.4.1, cuDNN=8.9.7, NCCL=2.20.5 ed EFA=1.34.0. PyTorch 