View a markdown version of this page

Ejecución de trabajos de GPU - AWS Batch

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Ejecución de trabajos de GPU

Los trabajos de GPU le permiten ejecutar los trabajos que utilizan las GPU de una instancia.

Se admiten los siguientes tipos de GPU-based instancias de Amazon EC2. Para obtener más información, consulte instancias G3 de Amazon EC2, instancias G4 de Amazon EC2, instancias G5 de Amazon EC2, instancias G6 de Amazon EC2, instancias P2 de Amazon EC2, instancias P3 de Amazon EC2, instancias P4d de Amazon EC2, instancias P5 de Amazon EC2, instancias P6 de Amazon EC2, instancias Trn1 de Amazon EC2, instancias Trn2 de Amazon EC2, instancias de Inf1 de Amazon EC2, instancias Inf2 de Amazon EC2, instancias Dl1 de Amazon EC2 e instancias Dl2 de Amazon EC2.

Tipo de instancia

GPU

Memoria de GPU

vCPUs

Memoria

Ancho de banda de la red

g3s.xlarge

1

8 GiB

4

30,5 GiB

10 Gbps

g3.4xlarge

1

8 GiB

16

122 GiB

Hasta 10 Gbps

g3.8xlarge

2

16 GiB

32

244 GiB

10 Gbps

g3.16xlarge

4

32 GiB

64

488 GiB

25 Gbps

g4dn.xlarge

1

16 GiB

4

16 GiB

Hasta 25 Gbps.

g4dn.2xlarge

1

16 GiB

8

32 GiB

Hasta 25 Gbps.

g4dn.4xlarge

1

16 GiB

16

64 GiB

Hasta 25 Gbps.

g4dn.8xlarge

1

16 GiB

32

128 GiB

50 Gbps

g4dn.12xlarge

4

64 GiB

48

192 GiB

50 Gbps

g4dn.16xlarge

1

16 GiB

64

256 GiB

50 Gbps

g5.xlarge

1

24 GiB

4

16 GiB

Hasta 10 Gbps

g5.2xlarge

1

24 GiB

8

32 GiB

Hasta 10 Gbps

g5.4xlarge

1

24 GiB

16

64 GiB

Hasta 25 Gbps.

g5.8xlarge

1

24 GiB

32

128 GiB

25 Gbps

g5.16xlarge

1

24 GiB

64

256 GiB

25 Gbps

g5.12xlarge

4

96 GiB

48

192 GiB

40 Gbps

g5.24xlarge

4

96 GiB

96

384 GiB

50 Gbps

g5.48xlarge

8

192 GiB

192

768 GiB

100 Gbps

g5g.xlarge

1

16 GiB

4

8 GiB

Hasta 10 Gbps

g5g.2xlarge

1

16 GiB

8

16 GiB

Hasta 10 Gbps

g5g.4xlarge

1

16 GiB

16

32 GiB

Hasta 10 Gbps

g5g.8xlarge

1

16 GiB

32

64 GiB

12 Gbps

g5g.16xlarge

2

32 GiB

64

128 GiB

25 Gbps

g5g.metal

2

32 GiB

64

128 GiB

25 Gbps

g6.xlarge

1

24 GiB

4

16 GiB

Hasta 10 Gbps

g6.2xlarge

1

24 GiB

8

32 GiB

Hasta 10 Gbps

g6.4xlarge

1

24 GiB

16

64 GiB

Hasta 25 Gbps.

g6.8xlarge

1

24 GiB

32

128 GiB

25 Gbps

g6.16xlarge

1

24 GiB

64

256 GiB

25 Gbps

g6.12xlarge

4

96 GiB

48

192 GiB

40 Gbps

g6.24xlarge

4

96 GiB

96

384 GiB

50 Gbps

g6.48xlarge

8

192 GiB

192

768 GiB

100 Gbps

g6e.xlarge

1

48 GiB

4

32 GiB

Hasta 20 Gbps

g6e.2xlarge

1

48 GiB

8

64 GiB

Hasta 20 Gbps

g6e.4xlarge

1

48 GiB

16

128 GiB

20 Gbps

g6g.8xlarge

1

48 GiB

32

256 GiB

25 Gbps

g6e.16xlarge

1

48 GiB

64

512 GiB

35 Gbps

g6e.12xlarge

4

192 GiB

48

384 GiB

100 Gbps

g6e.24xlarge

4

192 GiB

96

768 GiB

200 Gbps

g6e.48xlarge

8

384 GiB

192

1536 GiB

400 Gbps

gr6.4xlarge

1

24 GiB

16

128 GiB

Hasta 25 Gbps.

gr6.8xlarge

1

24 GiB

32

256 GiB

25 Gbps

p2.xlarge

1

12 GiB

4

61 GiB

Alto

p2.8xlarge

8

96 GiB

32

488 GiB

10 Gbps

p2.16xlarge

16

192 GiB

64

732 GiB

20 Gbps

p3.2xlarge

1

16 GiB

8

61 GiB

Hasta 10 Gbps

p3.8xlarge

4

64 GiB

32

244 GiB

10 Gbps

p3.16xlarge

8

128 GiB

64

488 GiB

25 Gbps

p3dn.24xlarge

8

256 GiB

96

768 GiB

100 Gbps

p4d.24xlarge

8

320 GiB

96

1152 GiB

400 Gbps

p4de.24xlarge

8

640 GiB

96

1152 GiB

400 Gbps

p5.48xlarge

8

640 GiB

192

2 TiB

3200 Gbps

p5e.48xlarge

8

1128 GiB

192

2 TiB

3200 Gbps

p5en.48xlarge

8

1128 GiB

192

2 TiB

3200 Gbps

p6-b200.48xlarge

8

1440 GiB

192

2 TiB

100 Gbps

trn1.2xlarge

1

32 GiB

8

32 GiB

Hasta 12,5 Gbps

trn1.32xlarge

16

512 GiB

128

512 GiB

800 Gbps

trn1n.32xlarge

16

512 GiB

128

512 GiB

1600 Gbps

trn2.48xlarge

16

1,5 TiB

192

2 TiB

3,2 Tbps

inf1.xlarge

1

8 GiB

4

8 GiB

Hasta 25 Gbps.

inf1.2xlarge

1

8 GiB

8

16 GiB

Hasta 25 Gbps.

inf1.6xlarge

4

32 GiB

24

48 GiB

25 Gbps

inf1.24xlarge

16

128 GiB

96

192 GiB

100 Gbps

inf2.xlarge

1

32 GiB

4

16 GiB

Hasta 15 Gbps

inf2.8xlarge

1

32 GiB

32

128 GiB

Hasta 25 Gbps.

inf2.24xlarge

6

192 GiB

96

384 GiB

50 Gbps

inf2.48xlarge

12

384 GiB

192

768 GiB

100 Gbps

dl1.24xlarge

8

256 GiB

96

768 GiB

400 Gbps

dl2q.24xlarge

8

128 GiB

96

768 GiB

100 Gbps

nota

Para los trabajos de GPU, AWS Batch solo se admiten tipos de instancias que tengan GPU NVIDIA. Por ejemplo, la familia de G4ad no es compatible con la programación de GPU. Puede seguir G4adutilizándolo AWS Batch definiendo solo los requisitos de vcpu y memoria en la definición del trabajo y, a continuación, accediendo a las GPU del host directamente mediante la personalización en una plantilla de lanzamiento de Amazon EC2, los datos de usuario con una AMI optimizada para cómputo de Amazon ECS o Amazon EKS, o una AMI personalizada para usar GPU AMD.

Los tipos de instancias que utilizan una arquitectura ARM64 son compatibles con los trabajos de GPU en las AMI personalizadas que se proporcionan AWS Batch o con los datos de usuario de Amazon EC2 para acceder a las GPU mediante códigos y configuraciones personalizados. Por ejemplo, las familias de instancias de G5g.

El parámetro resourceRequirements de la definición del trabajo especifica el número de GPU que se va a anclar al contenedor. Esta cantidad de GPU no está disponible para ningún otro trabajo que se ejecute en esa instancia mientras dure ese trabajo. Todos los tipos de instancia de un entorno de computación que ejecutan los trabajos de GPU deben pertenecer a las familias de instancias de p3, p4, p5, p6, g3, g3s, g4, g5 o g6. Si no lo hace así, un trabajo de GPU podría quedar bloqueado en el estado RUNNABLE.

Los trabajos que no utilizan las GPU se pueden ejecutar en instancias de GPU. Sin embargo, es posible que su ejecución en las instancias de GPU cueste más que en instancias similares que no sean de GPU. En función de la vCPU específica, la memoria y el tiempo necesario, estos trabajos sin GPU pueden bloquear la ejecución de los trabajos de GPU.