SageMaker Note di rilascio della libreria di parallelismo dei dati AI - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

SageMaker Note di rilascio della libreria di parallelismo dei dati AI

Consulta le seguenti note di rilascio per tenere traccia degli ultimi aggiornamenti per la libreria SageMaker AI Distributed Data Parallelism (SMDDP).

La libreria di parallelismo dei SageMaker dati distribuiti AI v2.5.0

Data: 17 ottobre 2024

Nuove funzionalità

  • È stato aggiunto il supporto per la v2.4.1 con CUDA PyTorch v12.1.

Integrazione nei contenitori Docker distribuiti dalla libreria SageMaker AI Model Parallelism (SMP)

Questa versione della libreria SMDDP è stata migrata a La libreria di parallelismo dei modelli v2.6.0 SageMaker.

658645717510.dkr.ecr.<us-west-2>.amazonaws.com/smdistributed-modelparallel:2.4.1-gpu-py311-cu121

Per le Regioni in cui sono disponibili le immagini Docker SMP, consulta Regioni AWS.

File binario di questa versione

È possibile scaricare o installare la libreria utilizzando l’URL seguente.

https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.4.1/cu121/2024-10-09/smdistributed_dataparallel-2.5.0-cp311-cp311-linux_x86_64.whl

La libreria di parallelismo dei SageMaker dati distribuiti AI v2.3.0

Data: 11 giugno 2024

Nuove funzionalità

  • Aggiunto il supporto per la PyTorch v2.3.0 con CUDA v12.1 e Python v3.11.

  • È stato aggiunto PyTorch il supporto per Lightning v2.2.5. Questo è integrato nel contenitore del framework SageMaker AI per la versione 2.3.0. PyTorch

  • Aggiunta la convalida del tipo di istanza durante l’importazione per impedire il caricamento della libreria SMDDP su tipi di istanza non supportati. Per un elenco dei tipi di istanza compatibili con la libreria SMDDP, consulta Framework e tipi di Regioni AWS istanze supportati.

Integrazione nei contenitori SageMaker AI Framework

Questa versione della libreria SMDDP viene migrata al seguente SageMaker AI Framework Container.

  • PyTorch v2.3.0

    763104351884.dkr.ecr.<region>.amazonaws.com/pytorch-training:2.3.0-gpu-py311-cu121-ubuntu20.04-sagemaker

Per un elenco completo delle versioni della libreria SMDDP e dei container predefiniti, consulta Framework e tipi di Regioni AWS istanze supportati.

File binario di questa versione

È possibile scaricare o installare la libreria utilizzando l’URL seguente.

https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.3.0/cu121/2024-05-23/smdistributed_dataparallel-2.3.0-cp311-cp311-linux_x86_64.whl

Altre modifiche

  • La libreria SMDDP v2.2.0 è integrata nel contenitore del framework AI per la SageMaker v2.2.0. PyTorch

La SageMaker libreria di parallelismo dei dati distribuiti AI v2.2.0

Data: 4 marzo 2024

Nuove funzionalità

  • È stato aggiunto il supporto per la v2.2.0 con CUDA PyTorch v12.1.

Integrazione nei contenitori Docker distribuiti dalla libreria SageMaker AI Model Parallelism (SMP)

Questa versione della libreria SMDDP è stata migrata a La libreria di SageMaker parallelismo dei modelli v2.2.0.

658645717510.dkr.ecr.<region>.amazonaws.com/smdistributed-modelparallel:2.2.0-gpu-py310-cu121

Per le Regioni in cui sono disponibili le immagini Docker SMP, consulta Regioni AWS.

File binario di questa versione

È possibile scaricare o installare la libreria utilizzando l’URL seguente.

https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.2.0/cu121/2024-03-04/smdistributed_dataparallel-2.2.0-cp310-cp310-linux_x86_64.whl

La libreria di parallelismo dei SageMaker dati distribuiti AI v2.1.0

Data: 1° marzo 2024

Nuove funzionalità

  • È stato aggiunto il supporto per la v2.1.0 con CUDA PyTorch v12.1.

Correzioni di bug

  • Risolto il problema di perdita di memoria della CPU in SMDDP v2.0.1.

Integrazione in AI Framework Containers SageMaker

Questa versione della libreria SMDDP ha superato i test di benchmark ed è stata migrata al seguente SageMaker AI Framework Container.

  • PyTorch v2.1.0

    763104351884.dkr.ecr.<region>.amazonaws.com/pytorch-training:2.1.0-gpu-py310-cu121-ubuntu20.04-sagemaker

Integrazione in contenitori Docker distribuiti dalla libreria SageMaker AI Model Parallelism (SMP)

Questa versione della libreria SMDDP è stata migrata a La libreria di SageMaker parallelismo dei modelli v2.1.0.

658645717510.dkr.ecr.<region>.amazonaws.com/smdistributed-modelparallel:2.1.2-gpu-py310-cu121

Per le Regioni in cui sono disponibili le immagini Docker SMP, consulta Regioni AWS.

File binario di questa versione

È possibile scaricare o installare la libreria utilizzando l’URL seguente.

https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.1.0/cu121/2024-02-04/smdistributed_dataparallel-2.1.0-cp310-cp310-linux_x86_64.whl

La libreria di parallelismo dei SageMaker dati distribuiti AI v2.0.1

Data: 7 dicembre 2023

Nuove funzionalità

Problemi noti

  • Si verifica un problema di perdita di memoria della CPU a causa di un aumento graduale della memoria della CPU durante l’addestramento con AllReduce SMDDP in modalità DDP.

Integrazione in SageMaker AI Framework Containers

Questa versione della libreria SMDDP ha superato i test di benchmark ed è stata migrata al seguente SageMaker AI Framework Container.

  • PyTorch v2.0.1

    763104351884.dkr.ecr.<region>.amazonaws.com/pytorch-training:2.0.1-gpu-py310-cu118-ubuntu20.04-sagemaker

File binario di questa versione

È possibile scaricare o installare la libreria utilizzando l’URL seguente.

https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.0.1/cu118/2023-12-07/smdistributed_dataparallel-2.0.2-cp310-cp310-linux_x86_64.whl

Altre modifiche