

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 亚马逊 SageMaker HyperPod AMI
<a name="sagemaker-hyperpod-release-ami"></a>

A SageMaker HyperPod mazon Amazon 机器映像 (AMIs) 是用于分布式机器学习工作负载和高性能计算的专用机器映像。它们使用包括 GPU 驱动程序和 AWS Neuron 加速器支持在内的基本组件 AMIs 增强了基础映像。

添加的关键组件 HyperPod AMIs 包括：
+ 支持[自定义构建 AMIs](hyperpod-custom-ami-support.md)的@@ [公众](sagemaker-hyperpod-release-public-ami.md) AMIs
+ 高级编排工具：
  + [使用 Slurm 编排 SageMaker HyperPod 集群Slurm 编排](sagemaker-hyperpod-slurm.md)
  + [使用 Amazon EKS 编排 SageMaker HyperPod 集群](sagemaker-hyperpod-eks.md)
+ 集群管理依赖项
+ 内置韧性功能：
  + 集群运行状况检查
  + 自动恢复功能
+ Support 支持 HyperPod 集群管理和配置

这些增强功能建立在以下基础深度学习 AMIs (DLAMIs) 的基础之上：
+ [AWS 深度学习基础 GPU AMI (Ubuntu 20.04) 用于使用 Slurm](https://aws.amazon.com/releasenotes/aws-deep-learning-base-gpu-ami-ubuntu-20-04/) 进行编排。
+ 基于 Amazon Linux 2 或 Amazon Linux 2023 的 AMI，适用于通过 Amazon EKS 进行编排。

 HyperPod AMIs 根据您的编排偏好选择您的：
+ 有关 Slurm 编排的信息，请参阅[SageMaker HyperPod AMI 发布了 Slurm 版](sagemaker-hyperpod-release-ami-slurm.md)。
+ 有关 Amazon EKS 编排的信息，请参阅[SageMaker HyperPod 亚马逊 EKS 的 AMI 发布](sagemaker-hyperpod-release-ami-eks.md)。

有关 Amazon SageMaker HyperPod 功能版本的信息，请参阅[亚马逊 SageMaker HyperPod 发行说明](sagemaker-hyperpod-release-notes.md)。

# 在 SageMaker HyperPod 集群中更新您的 AMI 版本
<a name="sagemaker-hyperpod-release-ami-update"></a>

A SageMaker HyperPod mazon Amazon 机器映像 (AMIs) 是用于分布式机器学习工作负载和高性能计算的专用机器映像。每个 AMI 都预装了驱动程序、机器学习框架、训练库以及性能监控工具。通过更新集群中的 AMI 版本，您可以在训练作业和工作流中使用这些组件及软件包的最新版本。

 在更新集群中的 AMI 版本时，您可以选择立即执行更新、安排一次性更新，或使用 cron 表达式创建周期性计划。您也可以选择更新一个实例组中的所有实例，或者仅分批次更新实例。如果您选择批量更新，则可以设置 SageMaker AI 一次应升级的实例的百分比或数量。如果您使用这种更新方法，则可以设置 SageMaker AI 应在批次之间等待多长时间的间隔。

如果您选择批量更新，还可以纳入警报和指标列表。在等待间隔 SageMaker 内，AI 会观察这些指标，如果有任何指标超过其阈值，则相应的警报将进入警报状态， SageMaker AI 会回滚 AMI 更新。要使用自动回滚，IAM 执行角色必须具有权限 `cloudwatch:DescribeAlarms`。

**注意**  
批量更新集群仅适用于与 Amazon EKS HyperPod 集成的集群。此外，如果您要创建多个计划，建议您在各个计划之间预留一段时间缓冲。如果计划出现重叠，更新可能会失败。

有关您的 HyperPod 集群的每个 AMI 版本的更多信息，请参阅[亚马逊 SageMaker HyperPod AMI](sagemaker-hyperpod-release-ami.md)。有关常规 HyperPod 版本的更多信息，请参阅[亚马逊 SageMaker HyperPod 发行说明](sagemaker-hyperpod-release-notes.md)。

您可以使用 SageMaker AI API 或 CLI 操作来更新集群或查看特定集群的计划更新。如果您使用的是 AWS 控制台，请按照以下步骤操作：

**注意**  
使用 AWS 控制台更新 AMI 仅适用于与 Amazon EKS 集成的集群。如果你有 Slurm 集群，则必须使用 SageMaker AI API 或 CLI 操作。

1. 打开 Amazon A SageMaker I 控制台，网址为[https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/)。

1. 在左侧，展开**HyperPod 集群**，然后选择**集群管理**。

1. 选择要更新的集群，然后选择**详细信息**和**更新 AMI**。



要通过编程方式创建和管理更新计划，请使用以下 API 操作：
+ [CreateCluster](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html)— 在指定更新时间表的同时创建集群
+ [UpdateCluster](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateCluster.html)— 更新集群以添加更新计划
+ [ UpdateClusterSoftware](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateClusterSoftware.html)— 更新集群的平台软件
+ [ DescribeCluster](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeCluster.html)— 查看您为集群创建的更新计划
+ [DescribeClusterNode](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeClusterNode.html)以及 [ListClusterNodes](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ListClusterNodes.html)— 查看上次更新集群的时间。

## 所需的权限
<a name="sagemaker-hyperpod-release-ami-update-permissions"></a>

根据您在 Amazon EK HyperPod S 集群中配置[容器中断预算](https://kubernetes.io/docs/tasks/run-application/configure-pdb/)的方式，在 AMI 更新过程中驱逐容器、释放节点并阻止任何更新计划。如果违反了预算内的任何限制，则在 AMI 更新期间 HyperPod 跳过该节点。 SageMaker HyperPod 要正确驱逐 pod，必须向 HyperPod 服务相关角色添加必要的权限。以下 yaml 文件具有必要的权限。

```
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRole
metadata:
  name: hyperpod-patching
rules:
- apiGroups: [""]
  resources: ["pods"]
  verbs: ["list"]
- apiGroups: [""]
  resources: ["pods/eviction"]
  verbs: ["create"]
---
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRoleBinding
metadata:
  name: hyperpod-patching
subjects:
- kind: User
  name: hyperpod-service-linked-role
roleRef:
  kind: ClusterRole
  name: hyperpod-patching
  apiGroup: rbac.authorization.k8s.io
```

使用以下命令可应用权限。

```
git clone https://github.com/aws/sagemaker-hyperpod-cli.git 

cd sagemaker-hyperpod-cli/helm_chart

helm upgrade hyperpod-dependencies HyperPodHelmChart --namespace kube-system --install
```

## Cron 表达式
<a name="sagemaker-hyperpod-release-ami-update-cron"></a>

要配置特定时间的一次性更新或周期性计划，请使用 cron 表达式。cron 表达式支持六个字段，各字段之间用空格分隔。所有六个字段均为必填字段。

```
cron(Minutes Hours Day-of-month Month Day-of-week Year)
```


| **字段** | **值** | **通配符** | 
| --- | --- | --- | 
|  Minutes  |  00 – 59  |  不适用  | 
|  Hours  |  00 – 23  |  不适用  | 
|  D ay-of-month  |  01 – 31  | ? | 
|  Month  |  01 – 12  | \$1 / | 
|  D ay-of-week  |  1 – 7 或 MON-SUN  | ? \$1 L | 
|  Year  |  当前年份 – 2099  | \$1 | 

**通配符**
+ **\$1**（星号）通配符包含该字段中的所有值。在 `Hours` 字段中，**\$1** 将包含每个小时。
+ **/**（正斜杠）通配符用于指定增量。在 `Months` 字段中，您可以输入 **\$1/3** 来指定每三个月执行一次。
+ **?**（问号）通配符用于指定一个或另一个。在`Day-of-month`字段中你可以输入 **7**，如果你不在乎第七天是什么日子，你可以输入**？** 在 Day-of-week野外。
+ `day-of-week` 字段中的 **L** 通配符用于指定月或周的最后一天。例如，`5L` 表示当月的最后一个星期五。
+  ay-of-week字段中的 **\$1** 通配符指定一个月内一周中指定某一天的特定实例。例如，3\$12 指该月的第二个星期二：3 指的是星期二，因为它是每周的第三天，2 是指该月内该类型的第二天。

您可以将 cron 表达式用于以下场景：
+ 在特定日期和时间运行的一次性计划。你可以使用`?`通配符来表示这一点， day-of-month也可以无关紧 day-of-week要。

  ```
  cron(30 14 ? 12 MON 2024)
  ```

  ```
  cron(30 14 15 12 ? 2024)
  ```
+ 在特定日期和时间运行的每周计划。以下示例创建了一个无论如何均在每周一中午 12:00 运行的时间表。 day-of-month

  ```
  cron(00 12 ? * 1 *)
  ```
+ 每月计划，无论如何，每月运行一次 day-of-week. 以下计划在每个月 15 日的中午 12:30 运行。

  ```
  cron(30 12 15 * ? *)
  ```
+ 使用的月度计划 day-of-week.

  ```
  cron(30 12 ? * MON *)
  ```
+ 要创建每 N 个月运行一次的计划，请使用 `/` 通配符。以下示例创建了每 3 个月运行一次的每月计划。以下两个示例演示了它如何与 day-of-week和配合使用 day-of-month。

  ```
  cron(30 12 15 */3 ? *)
  ```

  ```
  cron(30 12 ? */3 MON *)
  ```
+ 在指定的星期几对特定实例运行的计划。以下示例创建了一个计划，该计划在每个月第二个星期一的中午 12:30 运行。

  ```
  cron(30 12 ? * 1#2 *)
  ```
+ 在指定的星期几对最后一个实例运行的计划。以下计划在每个月最后一个星期一的中午 12:30 运行。

  ```
  cron(30 12 ? * 1L *)
  ```

# SageMaker HyperPod AMI 发布了 Slurm 版
<a name="sagemaker-hyperpod-release-ami-slurm"></a>

以下发行说明跟踪了适用于 Slurm 编排的 Amazon SageMaker HyperPod AMI 版本的最新更新。 HyperPod AMIs 它们建立在[AWS 深度学习基础 GPU AMI (Ubuntu 22.0](https://aws.amazon.com/releasenotes/aws-deep-learning-base-gpu-ami-ubuntu-22-04/) 4) 之上。 HyperPod服务团队通过[SageMaker HyperPod DLAMI](sagemaker-hyperpod-ref.md#sagemaker-hyperpod-ref-hyperpod-ami)分发软件补丁。有关适用于 Amazon EKS 编排的 HyperPod AMI 版本，请参阅[SageMaker HyperPod 亚马逊 EKS 的 AMI 发布](sagemaker-hyperpod-release-ami-eks.md)。有关 Amazon SageMaker HyperPod 功能版本的信息，请参阅[亚马逊 SageMaker HyperPod 发行说明](sagemaker-hyperpod-release-notes.md)。

**注意**  
要使用最新的 DLAMI 更新现有 HyperPod 集群，请参阅。[更新集群的 SageMaker HyperPod 平台软件](sagemaker-hyperpod-operate-slurm-cli-command.md#sagemaker-hyperpod-operate-slurm-cli-command-update-cluster-software)

## SageMaker HyperPod AMI 在 Slurm 上发布：2026 年 3 月 1 日
<a name="sagemaker-hyperpod-release-ami-slurm-20260301"></a>

 **AMI 常规更新** 
+ 已发布适用于 Slurm 的 SageMaker HyperPod AMI 版本 24.11 的更新。
+ [DLAMI 基本发行说明可在此处获得。](https://docs.aws.amazon.com//dlami/latest/devguide/appendix-ami-release-notes.html#appendix-ami-release-notes-base)

 **SageMaker HyperPod DLAMI 支持 Slurm** 

此版本包含以下更新：

------
#### [ Slurm v24.11 ]
+ Slurm 24.11 (): ARM64
  + Linux 内核版本：6.8
  + Glibc 版本：2.35
  + OpenSSL 版本：3.0.2
  + FSx Lustre 客户端版本：2.15.6-1fsx26
  + 运行版本：1.3.4
  + 容器版本：containerd containerd.io v2.2.1
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.6、12.8、12.9、13.0
  + EFA 安装程序版本：1.45.1
  + Python 版本：3.10.12
  + Slurm 版本：24.11.0
  + nvme-cli 版本：1.16
  + 集合版本：5.12.0。
  + lustre-client 版本：2.15.6-1fsx26
  + nvidia-imex 版本：580.126.09-1
  + 系统版本：249
  + openssh 版本：8.9
  + sudo 版本：1.9.9
  + ufw 版本：0.36.1
  + gcc 版本：11.4.0
  + cmake 版本：3.22.1
  + git 版本：2.34.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300064.1b1344-1
  + nfs-utils 版本：1:2.6 .1-1ubuntu1.2
  + iscsi-initiator-utils 版本：2.1.5-1ubuntu1.1
  + lvm2 版本：2.03.11
  + ec2-instance-connece 版本：1.1.14-0ubuntu1.1
  + rdma-core 版本：60.0-1
+ Slurm 24.11 (x86\$164)：
  + Linux 内核版本：6.8
  + Glibc 版本：2.35
  + OpenSSL 版本：3.0.2
  + FSx Lustre 客户端版本：2.15.6-1fsx26
  + 运行版本：1.3.4
  + 容器版本：containerd containerd.io v2.2.1
  + aws Neuronx DKMS 版本：2.26.5.0
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.6、12.8、12.9、13.0
  + EFA 安装程序版本：1.45.0
  + Python 版本：3.10.12
  + Slurm 版本：24.11.0
  + nvme-cli 版本：1.16
  + stress 版本：1.0.5
  + 集合版本：5.12.0。
  + lustre-client 版本：2.15.6-1fsx26
  + 系统版本：249
  + openssh 版本：8.9
  + sudo 版本：1.9.9
  + ufw 版本：0.36.1
  + gcc 版本：11.4.0
  + cmake 版本：3.22.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300064.1b1344-1
  + nfs-utils 版本：1:2.6 .1-1ubuntu1.2
  + iscsi-initiator-utils 版本：2.1.5-1ubuntu1.1
  + lvm2 版本：2.03.11
  + ec2-instance-connece 版本：1.1.14-0ubuntu1.1
  + rdma-core 版本：60.0-1

------

## SageMaker HyperPod AMI 在 Slurm 上发布：2026 年 2 月 12 日
<a name="sagemaker-hyperpod-release-ami-slurm-20260212"></a>

 **AMI 常规更新** 
+ 已发布适用于 Slurm 的 SageMaker HyperPod AMI 版本 24.11 的更新。
+ [DLAMI 基本发行说明可在此处获得。](https://docs.aws.amazon.com//dlami/latest/devguide/appendix-ami-release-notes.html#appendix-ami-release-notes-base)

 **SageMaker HyperPod DLAMI 支持 Slurm** 

此版本包含以下更新：

------
#### [ Slurm v24.11 ]
+ Slurm 24.11 (): ARM64
  + Linux 内核版本：6.8
  + Glibc 版本：2.35
  + OpenSSL 版本：3.0.2
  + FSx Lustre 客户端版本：2.15.6-1fsx25
  + 运行版本：1.3.4
  + 容器版本：containerd containerd.io v2.2.1
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.6、12.8、12.9、13.0
  + EFA 安装程序版本：1.45.1
  + Python 版本：3.10.12
  + Slurm 版本：24.11.0
  + nvme-cli 版本：1.16
  + 集合版本：5.12.0。
  + lustre-client 版本：2.15.6-1fsx25
  + nvidia-imex 版本：580.126.09-1
  + 系统版本：249
  + openssh 版本：8.9
  + sudo 版本：1.9.9
  + ufw 版本：0.36.1
  + gcc 版本：11.4.0
  + cmake 版本：3.22.1
  + git 版本：2.34.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300064.0b1337-1
  + nfs-utils 版本：1:2.6 .1-1ubuntu1.2
  + iscsi-initiator-utils 版本：2.1.5-1ubuntu1.1
  + lvm2 版本：2.03.11
  + ec2-instance-connece 版本：1.1.14-0ubuntu1.1
  + rdma-core 版本：60.0-1
+ Slurm 24.11 (x86\$164)：
  + Linux 内核版本：6.8
  + Glibc 版本：2.35
  + OpenSSL 版本：3.0.2
  + FSx Lustre 客户端版本：2.15.6-1fsx25
  + 运行版本：1.3.4
  + 容器版本：containerd containerd.io v2.2.1
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.6、12.8、12.9、13.0
  + EFA 安装程序版本：1.45.0
  + Python 版本：3.10.12
  + Slurm 版本：24.11.0
  + nvme-cli 版本：1.16
  + stress 版本：1.0.5
  + 集合版本：5.12.0。
  + lustre-client 版本：2.15.6-1fsx25
  + 系统版本：249
  + openssh 版本：8.9
  + sudo 版本：1.9.9
  + ufw 版本：0.36.1
  + gcc 版本：11.4.0
  + cmake 版本：3.22.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300064.0b1337-1
  + nfs-utils 版本：1:2.6 .1-1ubuntu1.2
  + iscsi-initiator-utils 版本：2.1.5-1ubuntu1.1
  + lvm2 版本：2.03.11
  + ec2-instance-connece 版本：1.1.14-0ubuntu1.1
  + rdma-core 版本：60.0-1

------

## SageMaker HyperPod AMI 在 Slurm 上发布：2026 年 1 月 25 日
<a name="sagemaker-hyperpod-release-ami-slurm-20260125"></a>

 **AMI 常规更新** 
+ 已发布适用于 Slurm 的 SageMaker HyperPod AMI 版本 24.11 的更新。
+ [DLAMI 基本发行说明可在此处获得。](https://docs.aws.amazon.com//dlami/latest/devguide/appendix-ami-release-notes.html#appendix-ami-release-notes-base)

 **SageMaker HyperPod DLAMI 支持 Slurm** 

此版本包含以下更新：

------
#### [ Slurm v24.11 ]
+ Slurm 24.11 (): ARM64
  + Linux 内核版本：6.8
  + Glibc 版本：2.35
  + OpenSSL 版本：3.0.2
  + FSx Lustre 客户端版本：2.15.6-1fsx25
  + 运行版本：1.3.4
  + 容器版本：containerd containerd.io v2.2.1
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.6、12.8、12.9、13.0
  + EFA 安装程序版本：2.3.1amzn3.0
  + Python 版本：3.10.12
  + Slurm 版本：24.11.0
  + nvme-cli 版本：1.16
  + 集合版本：5.12.0。
  + lustre-client 版本：2.15.6-1fsx25
  + nvidia-imex 版本：580.126.09-1
  + 系统版本：249
  + openssh 版本：8.9
  + sudo 版本：1.9.9
  + ufw 版本：0.36.1
  + gcc 版本：11.4.0
  + cmake 版本：3.22.1
  + git 版本：2.34.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300063.0b1323-1
  + nfs-utils 版本：1:2.6 .1-1ubuntu1.2
  + iscsi-initiator-utils 版本：2.1.5-1ubuntu1.1
  + lvm2 版本：2.03.11
  + ec2-instance-connece 版本：1.1.14-0ubuntu1.1
  + rdma-core 版本：60.0-1
+ Slurm 24.11 (x86\$164)：
  + Linux 内核版本：6.8
  + Glibc 版本：2.35
  + OpenSSL 版本：3.0.2
  + FSx Lustre 客户端版本：2.15.6-1fsx25
  + 运行版本：1.3.4
  + 容器版本：containerd containerd.io v2.2.1
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.6、12.8、12.9、13.0
  + EFA 安装程序版本：2.3.1amzn2.0
  + Python 版本：3.10.12
  + Slurm 版本：24.11.0
  + nvme-cli 版本：1.16
  + stress 版本：1.0.5
  + 集合版本：5.12.0。
  + lustre-client 版本：2.15.6-1fsx25
  + 系统版本：249
  + openssh 版本：8.9
  + sudo 版本：1.9.9
  + ufw 版本：0.36.1
  + gcc 版本：11.4.0
  + cmake 版本：3.22.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300063.0b1323-1
  + nfs-utils 版本：1:2.6 .1-1ubuntu1.2
  + iscsi-initiator-utils 版本：2.1.5-1ubuntu1.1
  + lvm2 版本：2.03.11
  + ec2-instance-connece 版本：1.1.14-0ubuntu1.1
  + rdma-core 版本：60.0-1

------

## SageMaker HyperPod AMI 在 Slurm 上发布：2025 年 12 月 29 日
<a name="sagemaker-hyperpod-release-ami-slurm-20251229"></a>

 **AMI 常规更新** 
+ 已发布适用于 Slurm 的 SageMaker HyperPod AMI 版本 24.11 的更新。
+ [DLAMI 基本发行说明可在此处获得。](https://docs.aws.amazon.com//dlami/latest/devguide/appendix-ami-release-notes.html#appendix-ami-release-notes-base)

 **SageMaker HyperPod DLAMI 支持 Slurm** 

此版本包含以下更新：

------
#### [ Slurm v24.11 ]
+ Slurm 24.11 (): ARM64
  + Linux 内核版本：6.8
  + Glibc 版本：2.35
  + OpenSSL 版本：3.0.2
  + FSx Lustre 客户端版本：2.15.6-1fsx25
  + 运行版本：1.3.4
  + 容器版本：containerd containerd.io v2.2.1
  + NVIDIA 驱动程序版本：580.105.08
  + CUDA 版本：12.6、12.8、12.9、13.0
  + EFA 安装程序版本：2.3.1amzn3.0
  + Python 版本：3.10.12
  + Slurm 版本：24.11.0
  + nvme-cli 版本：1.16
  + 集合版本：5.12.0。
  + lustre-client 版本：2.15.6-1fsx25
  + nvidia-imex 版本：580.105.08-1
  + 系统版本：249
  + openssh 版本：8.9
  + sudo 版本：1.9.9
  + ufw 版本：0.36.1
  + gcc 版本：11.4.0
  + cmake 版本：3.22.1
  + git 版本：2.34.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300062.0b1304-1
  + nfs-utils 版本：1:2.6 .1-1ubuntu1.2
  + iscsi-initiator-utils 版本：2.1.5-1ubuntu1.1
  + lvm2 版本：2.03.11
  + ec2-instance-connece 版本：1.1.14-0ubuntu1.1
  + rdma-core 版本：60.0-1
+ Slurm 24.11 (x86\$164)：
  + Linux 内核版本：6.8
  + Glibc 版本：2.35
  + OpenSSL 版本：3.0.2
  + FSx Lustre 客户端版本：2.15.6-1fsx25
  + 运行版本：1.3.4
  + 容器版本：containerd containerd.io v2.2.1
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.105.08
  + CUDA 版本：12.6、12.8、12.9、13.0
  + EFA 安装程序版本：2.3.1amzn2.0
  + Python 版本：3.10.12
  + Slurm 版本：24.11.0
  + nvme-cli 版本：1.16
  + stress 版本：1.0.5
  + 集合版本：5.12.0。
  + lustre-client 版本：2.15.6-1fsx25
  + 系统版本：249
  + openssh 版本：8.9
  + sudo 版本：1.9.9
  + ufw 版本：0.36.1
  + gcc 版本：11.4.0
  + cmake 版本：3.22.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300062.0b1304-1
  + nfs-utils 版本：1:2.6 .1-1ubuntu1.2
  + iscsi-initiator-utils 版本：2.1.5-1ubuntu1.1
  + lvm2 版本：2.03.11
  + ec2-instance-connece 版本：1.1.14-0ubuntu1.1
  + rdma-core 版本：60.0-1

------

## SageMaker HyperPod AMI 在 Slurm 上发布：2025 年 11 月 22 日
<a name="sagemaker-hyperpod-release-ami-slurm-20251128"></a>

 **AMI 常规更新** 
+ 已发布适用于 Slurm 的 SageMaker HyperPod AMI 版本 24.11 的更新。
+ [DLAMI 基本发行说明可在此处获得。](https://docs.aws.amazon.com//dlami/latest/devguide/appendix-ami-release-notes.html#appendix-ami-release-notes-base)

 **SageMaker HyperPod DLAMI 支持 Slurm** 

此版本包含以下更新：

------
#### [ Slurm (arm64) ]
+ Linux 内核版本：6.8
+ Glibc 版本：2.35
+ OpenSSL 版本：3.0.2
+ FSx Lustre 客户端版本：2.15.6-1fsx21
+ 运行版本：1.3.3
+ 容器版本：containerd containerd.io v2.1.5
+ NVIDIA 驱动程序版本：580.95.05
+ CUDA 版本：12.6、12.8、12.9、13.0
+ EFA 安装程序版本：2.1.0amzn5.0
+ Python 版本：3.10.12
+ Slurm 版本：24.11.0
+ nvme-cli 版本：1.16
+ 集合版本：5.12.0。
+ lustre-client 版本：2.15.6-1fsx21
+ nvidia-imex 版本：580.95.05-1
+ 系统版本：249
+ openssh 版本：8.9
+ sudo 版本：1.9.9
+ ufw 版本：0.36.1
+ gcc 版本：11.4.0
+ cmake 版本：3.22.1
+ git 版本：2.34.1
+ 制作版本：4.3
+ cloudwatch-agent 版本：1.300062.0b1304-1
+ nfs-utils 版本：1:2.6 .1-1ubuntu1.2
+ iscsi-initiator-utils 版本：2.1.5-1ubuntu1.1
+ lvm2 版本：2.03.11
+ ec2-instance-connece 版本：1.1.14-0ubuntu1.1
+ rdma-core 版本：58.amzn0-1

------
#### [ Slurm (x86\$164) ]
+ Linux 内核版本：6.8
+ Glibc 版本：2.35
+ OpenSSL 版本：3.0.2
+ FSx Lustre 客户端版本：2.15.6-1fsx21
+ 运行版本：1.3.3
+ 容器版本：containerd containerd.io v2.1.5
+ aws Neuronx DKMS 版本：2.24.7.0
+ NVIDIA 驱动程序版本：580.95.05
+ CUDA 版本：12.6、12.8、12.9、13.0
+ EFA 安装程序版本：2.3.1amzn1.0
+ Python 版本：3.10.12
+ Slurm 版本：24.11.0
+ nvme-cli 版本：1.16
+ stress 版本：1.0.5
+ 集合版本：5.12.0。
+ lustre-client 版本：2.15.6-1fsx21
+ 系统版本：249
+ openssh 版本：8.9
+ sudo 版本：1.9.9
+ ufw 版本：0.36.1
+ gcc 版本：11.4.0
+ cmake 版本：3.22.1
+ 制作版本：4.3
+ cloudwatch-agent 版本：1.300062.0b1304-1
+ nfs-utils 版本：1:2.6 .1-1ubuntu1.2
+ iscsi-initiator-utils 版本：2.1.5-1ubuntu1.1
+ lvm2 版本：2.03.11
+ ec2-instance-connece 版本：1.1.14-0ubuntu1.1
+ rdma-core 版本：59.amzn0-1

------

## SageMaker HyperPod 发布说明：2025 年 11 月 7 日
<a name="sagemaker-hyperpod-release-notes-20251107"></a>

**AMI 包括以下内容：**
+ 支持 AWS 服务：亚马逊 EC2
+ 操作系统：Ubuntu 22.04
+ 计算架构： ARM64
+ 更新的软件包：NVIDIA 驱动程序：580.95.05
+ CUDA 版本：cuda-12.6、cuda-12.8、cuda-12.9、cuda-13.0
+ 安全补丁：[Runc 安全](https://aws.amazon.com/security/security-bulletins/rss/aws-2025-024/)补丁

## SageMaker HyperPod 发布说明：2025 年 9 月 29 日
<a name="sagemaker-hyperpod-release-notes-20250929"></a>

**AMI 包括以下内容：**
+ 支持 AWS 服务：亚马逊 EC2
+ 操作系统：Ubuntu 22.04
+ 计算架构： ARM64
+ 更新的软件包：NVIDIA 驱动程序：570.172.08
+ 安全修复

## SageMaker HyperPod 发布说明：2025 年 8 月 12 日
<a name="sagemaker-hyperpod-release-notes-20250812"></a>

**AMI 包括以下内容：**
+ 支持 AWS 服务：亚马逊 EC2
+ 操作系统：Ubuntu 22.04
+ 计算架构： ARM64
+ 已为以下软件包安装了最新的可用版本：
  + Linux 内核：6.8
  + FSx Lustre
  + Docker
  + AWS CLI v2 在 `/usr/bin/aws`
  + NVIDIA DCGM
  + Nvidia Container Toolkit：
    + 版本命令：`nvidia-container-cli -V`
  + Nvidia-docker2：
    + 版本命令：`nvidia-docker version`
  + nvidia-imex：v570.172.08-1
+ NVIDIA 驱动程序：570.158.01
+ NVIDIA CUDA 12.4、12.5、12.6、12.8 堆栈：
  + CUDA、NCCL 和 cudDN 安装目录：`/usr/local/cuda-xx.x/`
    + 示例：`/usr/local/cuda-12.8/`、`/usr/local/cuda-12.8/`
  + 已编译的 NCCL 版本：
    + 对于 12.4 的 CUDA 目录，编译了 NCCL 版本 2.22.3\$1 .4 CUDA12
    + 对于 12.5 的 CUDA 目录，编译了 NCCL 版本 2.22.3\$1 .5 CUDA12
    + 对于 12.6 的 CUDA 目录，编译了 NCCL 版本 2.24.3\$1 .6 CUDA12
    + 对于 12.8 的 CUDA 目录，编译了 NCCL 版本 2.27.5\$1 .8 CUDA12
  + 默认 CUDA：12.8
    + PATH `/usr/local/cuda` 指向 CUDA 12.8
    + 更新以下环境变量：
      + `LD_LIBRARY_PATH`拥有 `/usr/local/cuda-12.8/lib:/usr/local/cuda-12.8/lib64:/usr/local/cuda-12.8:/usr/local/cuda-12.8/targets/sbsa-linux/lib:/usr/local/cuda-12.8/nvvm/lib64:/usr/local/cuda-12.8/extras/CUPTI/lib64`
      + `PATH`拥有 `/usr/local/cuda-12.8/bin/:/usr/local/cuda-12.8/include/`
      + 对于任何不同的 CUDA 版本，请`LD_LIBRARY_PATH`相应更新。
+ EFA 安装程序：1.42.0
+ 英伟达 GDRCopy：2.5.1
+ AWS OFI NCCL 插件附带 EFA 安装程序
  + 路径`/opt/amazon/ofi-nccl/lib/aarch64-linux-gnu`和`/opt/amazon/ofi-nccl/efa`已添加到`LD_LIBRARY_PATH`。
+ AWS CLI v2 位于`/usr/local/bin/aws2`， AWS CLI v1 位于 `/usr/bin/aws`
+ EBS 卷类型：gp3
+ Python：`/usr/bin/python3.10`

## SageMaker HyperPod 发布说明：2025 年 5 月 27 日
<a name="sagemaker-hyperpod-release-notes-20250527"></a>

SageMaker HyperPod 为发布以下内容[使用 Slurm 编排 SageMaker HyperPod 集群Slurm 编排](sagemaker-hyperpod-slurm.md)。

**新功能和改进**
+ 已使用以下关键组件将基础 AMI 更新至 `Deep Learning Base OSS Nvidia Driver GPU AMI (Ubuntu 22.04) 20250523`：
  + NVIDIA 驱动程序：570.133.20
  + CUDA：12.8（默认值），支持 CUDA 12.4-12.6
  + NCCL 版本：2.26.5
  + EFA 安装程序：1.40.0
  + AWS OFI NCCL：1.14.2-aws
+ 更新了 Neuron SDK 软件包：
  + aws-neuronx-collectives: 2.25.65.0-9858ac9a1（来自 2.24.59.0-838c7fc8b）
  + aws-neuronx-dkms: 2.21.37.0（从 2.20.28.0 开始）
  + aws-neuronx-runtime-lib: 2.25.57.0-166c7a468（来自 2.24.53.0-f239092cc）
  + aws-neuronx-tools: 2.23.9.0（从 2.22.61.0 开始）

**重要提示**
+ NVIDIA 容器工具包 1.17.4 现已禁止挂载 CUDA 兼容性库。
+ 已将 EFA 配置从 1.37 更新至 1.38，EFA 现在包含 AWS OFI NCCL 插件，该插件位于 `/opt/amazon/ofi-nccl` 目录而非原始 `/opt/aws-ofi-nccl/` 路径中。（发布日期：2025 年 2 月 18 日）
+ 为确保稳定性和驱动程序兼容性，已固定内核版本。

## SageMaker HyperPod AMI 在 Slurm 上发布：2025 年 5 月 13 日
<a name="sagemaker-hyperpod-release-ami-slurm-20250513"></a>

亚马逊 SageMaker HyperPod 发布了更新后的 AMI，支持适用于 Slurm 集群的 Ubuntu 22.04 LTS。 AWS 定期更新 AMIs 以确保您可以访问最新的软件堆栈。通过升级到最新的 AMI，可通过全面的软件包更新增强安全性，提升工作负载的性能与稳定性，并实现与新实例类型及最新内核功能的兼容。

**重要**  
从 Ubuntu 20.04 LTS 更新至 Ubuntu 22.04 LTS 会引入重大变更，这些变更可能会影响与为 Ubuntu 20.04 设计的软件和配置的兼容性。

**Topics**
+ [Ubuntu 22.04 AMI 中的关键更新](#sagemaker-hyperpod-ami-slurm-ubuntu22-updates)
+ [升级至 Ubuntu 22.04 AMI](#sagemaker-hyperpod-ami-slurm-ubuntu22-upgrade)
+ [排查升级失败问题](#sagemaker-hyperpod-ami-slurm-ubuntu22-troubleshoot)

### Ubuntu 22.04 AMI 中的关键更新
<a name="sagemaker-hyperpod-ami-slurm-ubuntu22-updates"></a>

下表列出了 Ubuntu 22.04 AMI 与上一版本的 AMI 的组件版本对比。


**Ubuntu 22.04 AMI 与上一版本的 AMI 的组件版本对比**  

| 组件 | 先前版本 | 更新后的版本 | 
| --- | --- | --- | 
|  **Ubuntu 操作系统**  |  20.04 LTS  |  22.04 LTS  | 
|  **Slurm**  |  24.11  |  24.11（未变更）  | 
|  **Python**  |  3.8（默认）  |  3.10（默认）  | 
|  **亚马逊上的 Elastic Fabric Adapter (EFA) FSx**  |  不支持  |  支持  | 
|  **Linux 内核**  |  5.15  |  6.8  | 
|  **GNU C 库（glibc）**  |  2.31  |  2.35  | 
|  **GNU 编译器集合（GCC）**  |  9.4.0  |  11.4.0  | 
|  **libc6**  |  ≤ 2.31  |  支持 ≥ 2.35  | 
|  **网络文件系统（NFS）**  |  1:1.3.4  |  1:2.6.1  | 

**注意**  
尽管 Slurm 版本（24.11）保持不变，但此 AMI 中底层操作系统和库的更新可能会影响系统行为及工作负载兼容性。在升级生产集群之前，您必须测试工作负载。

### 升级至 Ubuntu 22.04 AMI
<a name="sagemaker-hyperpod-ami-slurm-ubuntu22-upgrade"></a>

在将集群升级至 Ubuntu 22.04 AMI 之前，请完成这些准备步骤并查看升级要求。要对排查升级失败问题，请参阅[排查升级失败问题](#sagemaker-hyperpod-ami-slurm-ubuntu22-troubleshoot)。

#### 查看 Python 兼容性
<a name="sagemaker-hyperpod-ami-slurm-ubuntu22-python-compatibility"></a>

Ubuntu 22.04 AMI 使用 Python 3.10 作为默认版本（升级自 Python 3.8）。尽管 Python 3.10 能兼容大多数 Python 3.8 代码，但在升级前，您仍应对现有工作负载进行测试。如果您的工作负载需要 Python 3.8，则可以在生命周期脚本中使用以下命令来安装它：

```
yum install python-3.8
```

在升级集群之前，请确保执行以下操作：

1. 测试代码与 Python 3.10 的兼容性。

1. 确认生命周期脚本能在新环境中正常运行。

1. 检查所有依赖项是否与新版本的 Python 兼容。

1. 如果您通过从中复制默认生命周期脚本来创建 HyperPod 集群 GitHub，请在升级到 Ubuntu 22 之前将以下命令添加到您的`setup_mariadb_accounting.sh`文件中。有关完整的脚本，请参阅[上的 setup\$1mariadb\$1accounting.sh GitHub](https://github.com/aws-samples/awsome-distributed-training/blob/main/1.architectures/5.sagemaker-hyperpod/LifecycleScripts/base-config/setup_mariadb_accounting.sh)。

   ```
   apt-get -y -o DPkg::Lock::Timeout=120 update && apt-get -y -o DPkg::Lock::Timeout=120 install apg
   ```

#### 升级 Slurm 集群
<a name="sagemaker-hyperpod-ami-slurm-ubuntu22-upgrade-cluster"></a>

您可以通过两种方式升级 Slurm 集群以使用新的 AMI：

1. 使用 [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html) API 创建新集群。

1. 使用 [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateClusterSoftware.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateClusterSoftware.html) API 更新现有集群的软件。

#### 已验证的配置
<a name="sagemaker-hyperpod-ami-slurm-ubuntu22-validation"></a>

AWS 已在 G5、G6、G6e、p4d、P5 和 Trn1 实例上测试了各种分布式训练工作负载和基础设施功能，包括：
+ 使用 PyTorch （例如 FSDP、、 LLa MA NeMo、MNIST）进行分布式训练。
+ 使用 Nvidia（P/G 系列）和 Neu AWS ron（Trn1）跨实例类型进行加速器测试。
+ 韧性功能，包括[自动恢复](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod-resiliency-slurm.html#sagemaker-hyperpod-resiliency-slurm-auto-resume)和[深度运行状况检查](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod-eks-resiliency-deep-health-checks.html)。

#### 集群停机时间和可用性
<a name="sagemaker-hyperpod-ami-slurm-ubuntu22-downtime-availability"></a>

在升级过程中，集群将不可用。要最大限度地减少中断，请执行以下操作：
+ 在较小规模的集群上测试升级过程。
+ 在升级前创建检查点，然后在升级完成后，从现有检查点重新启动训练工作负载。

### 排查升级失败问题
<a name="sagemaker-hyperpod-ami-slurm-ubuntu22-troubleshoot"></a>

在升级失败后，先确定失败是否与生命周期脚本有关。这些脚本通常会因语法错误、依赖项缺失或配置不正确而失败。

要调查与生命周期脚本相关的故障，请查看 CloudWatch 日志。所有 SageMaker HyperPod 事件和日志都存储在日志组下：`/aws/sagemaker/Clusters/[ClusterName]/[ClusterID]`。请重点查看日志流 `LifecycleConfig/[instance-group-name]/[instance-id]`，它会提供脚本执行过程中所有错误的详细信息。

如果升级失败与生命周期脚本无关，请收集相关信息（包括集群 ARN、错误日志和时间戳），然后联系 [AWS Support](https://aws.amazon.com/premiumsupport/) 以寻求进一步帮助。

## SageMaker HyperPod AMI 在 Slurm 上发布：2025 年 5 月 7 日
<a name="sagemaker-hyperpod-release-ami-slurm-20250507"></a>

亚马逊fo SageMaker HyperPod r Slurm发布了Ubuntu 22.04（从之前的Ubuntu 20.04）的主要操作系统版本升级。有关更多信息，请查看 DLAMI Ubuntu 22.04（[发行说明](https://aws.amazon.com/releasenotes/aws-deep-learning-base-gpu-ami-ubuntu-22-04/)）：`Deep Learning Base OSS Nvidia Driver GPU AMI (Ubuntu 22.04) 20250503`。

关键软件包升级：
+ Ubuntu 22.04 LTS（升级自 20.04）
+ Python 版本：
  + Python 3.10 现在是 Slurm AMI Ubuntu 22.04 中的默认 Python 版本
  + 此次升级可让您获得 Python 3.10 中引入的最新功能、性能改进以及错误修复。
+ Support 对 EFA 的支持 FSx
+ 新 Linux 内核版本 6.8（更新自 5.15）
+ Glibc 版本：2.35（更新自 2.31）
+ GCC 版本：11.4.0（更新自 9.4.0）
+ 更新的 libc6 版本支持（更新自 libc6 版本 2.31 或更低版本）
+ NFS 版本：1:2.6.1（更新自 1:1.3.4）

## SageMaker HyperPod AMI 在 Slurm 上发布：2025 年 4 月 28 日
<a name="sagemaker-hyperpod-release-ami-slurm-20250428"></a>

**对 Slurm 的改进**
+ 已将 NVIDIA 驱动程序从版本 550.144.03 升级至版本 550.163.01。此次升级旨在解决 [2025 年 4 月 NVIDIA GPU 显示屏安全公告](https://nvidia.custhelp.com/app/answers/detail/a_id/5630)中存在的常见漏洞和漏洞 (CVEs)。

**亚马逊 SageMaker HyperPod DLAMI 支持 Slurm**

------
#### [ Installed the latest version of AWS Neuron SDK ]
+ **aws-neuronx-collectives: 2.24.59.** 0-838c7fc8b
+ **aws-neuronx-dkms: 2.20** .28.0
+ **aws-neuronx-runtime-lib:** 2.24.53.0-f239092cc
+ **aws-neuronx-tools/unknown：2.22.61.0**

------

## SageMaker HyperPod AMI 在 Slurm 上发布：2025 年 2 月 18 日
<a name="sagemaker-hyperpod-release-ami-slurm-20250218"></a>

**对 Slurm 的改进**
+ 已将 Slurm 版本升级至 24.11.
+ 已将 Elastic Fabric Adapter（EFA）版本从 1.37.0 升级至 1.38.0。
+ EFA 现在包含 AWS OFI NCCL 插件。您可以在 `/opt/amazon/ofi-nccl` 目录中而非原始 `/opt/aws-ofi-nccl/` 位置找到此插件。如果您需要更新 `LD_LIBRARY_PATH` 环境变量，请务必修改路径以指向 OFI NCCL 插件的新 `/opt/amazon/ofi-nccl` 位置。
+ 从这些 DLAMIs软件包中移除了 emacs 软件包。您可以从 GNU emac 安装 emacs。

**亚马逊 SageMaker HyperPod DLAMI 支持 Slurm**

------
#### [ Installed the latest version of AWS Neuron SDK 2.19 ]
+ **aws-neuronx-collectives/unknown：**2.23.135.0-3e70920f2 amd64
+ **aws-neuronx-dkms/unknown：**2.19.64.0 amd64
+ **aws-neuronx-runtime-lib/unknown：**2.23.112.0-9b5179492 amd64
+ **aws-neuronx-tools/unknown：**2.20.204.0 amd64

------

## SageMaker HyperPod AMI 在 Slurm 上发布：2024 年 12 月 21 日
<a name="sagemaker-hyperpod-release-ami-slurm-20241221"></a>

**SageMaker HyperPod DLAMI 支持 Slurm**

------
#### [ Deep Learning Slurm AMI ]
+ **NVIDIA 驱动程序：**550.127.05
+ **EFA 驱动程序：**2.13.0-1
+ 已安装最新版本的 Ne AWS uron SDK
  + **aws-neuronx-collectives:** 2.22.33.0
  + **aws-neuronx-dkms: 2.18.20** .0
  + **aws-neuronx-oci-hook: 2.5.** 8.0
  + **aws-neuronx-runtime-lib: 2.22.19** .0
  + **aws-neuronx-tools: 2.19** .0.0

------

## SageMaker HyperPod AMI 在 Slurm 上发布：2024 年 11 月 24 日
<a name="sagemaker-hyperpod-release-ami-slurm-20241124"></a>

**AMI 常规更新**
+ 已在 `MEL`（墨尔本）区域发布。
+ 将 SageMaker HyperPod 基础 DLAMI 更新至以下版本：
  + Slurm：2024-11-22。

## SageMaker HyperPod AMI 在 Slurm 上发布：2024 年 11 月 15 日
<a name="sagemaker-hyperpod-release-ami-slurm-20241115"></a>

**AMI 常规更新**
+ 已安装最新的 `libnvidia-nscq-xxx` 软件包。

**SageMaker HyperPod DLAMI 支持 Slurm**

------
#### [ Deep Learning Slurm AMI ]
+ **NVIDIA 驱动程序：**550.127.05
+ **EFA 驱动程序：**2.13.0-1
+ 已安装最新版本的 Ne AWS uron SDK
  + **aws-neuronx-collectives: v2.22.33.0**-d2128d1aa
  + **aws-neuronx-dkms: v2.17.17** .0
  + **aws-neuronx-oci-hook: v2.4.** 4.0
  + **aws-neuronx-runtime-lib: v2.21.4** 1.0
  + **aws-neuronx-tools: v2.18.** 3.0

------

## SageMaker HyperPod AMI 在 Slurm 上发布：2024 年 11 月 11 日
<a name="sagemaker-hyperpod-release-ami-slurm-20241111"></a>

**AMI 常规更新**
+ 将 SageMaker HyperPod 基础 DLAMI 更新至以下版本：
  + Slurm：2024-10-23。

## SageMaker HyperPod AMI 在 Slurm 上发布：2024 年 10 月 21 日
<a name="sagemaker-hyperpod-release-ami-slurm-20241021"></a>

**AMI 常规更新**
+ 将 SageMaker HyperPod 基础 DLAMI 更新至以下版本：
  + Slurm：2024-09-27。

## SageMaker HyperPod AMI 在 Slurm 上发布：2024 年 9 月 10 日
<a name="sagemaker-hyperpod-release-ami-slurm-20240910"></a>

**SageMaker HyperPod DLAMI 支持 Slurm**

------
#### [ Deep Learning Slurm AMI ]
+ 安装 NVIDIA 驱动程序 v550.90.07
+ 安装 EFA 驱动程序 v2.10
+ 已安装最新版本的 Ne AWS uron SDK
  + **aws-neuronx-collectives: v2.21.4** 6.0
  + **aws-neuronx-dkms: v2.17.17** .0
  + **aws-neuronx-oci-hook: v2.4.** 4.0
  + **aws-neuronx-runtime-lib: v2.21.4** 1.0
  + **aws-neuronx-tools: v2.18.** 3.0

------

## SageMaker HyperPod AMI 在 Slurm 上发布：2024 年 3 月 14 日
<a name="sagemaker-hyperpod-release-ami-slurm-20240314"></a>

**HyperPod 适用于 Slurm 的 DLAMI 软件补丁**
+ 将 [Slurm](https://slurm.schedmd.com/documentation.html) 升级至 v23.11.1
+ 添加了 [Op PMIx en](https://openpmix.github.io/code/getting-the-reference-implementation) v4.2.6，用于启用 [Slurm](https://slurm.schedmd.com/mpi_guide.html#pmix)。 PMIx
+ 基于 [AWS 发布的深度学习基础 GPU AMI (Ubuntu 20.04)](https://aws.amazon.com/releasenotes/aws-deep-learning-base-gpu-ami-ubuntu-20-04/) 于 2023 年 10 月 26 日发布
+ 除基本 AMI 外，还包含此 D HyperPod LAMI 中预装软件包的完整列表
  + [Slurm](https://slurm.schedmd.com/documentation.html)：v23.11.1
  + [打开PMIx ：v4.2.](https://openpmix.github.io/code/getting-the-reference-implementation) 6
  + Munge：v0.5.15
  + `aws-neuronx-dkms`：v2.\$1
  + `aws-neuronx-collectives`：v2.\$1
  + `aws-neuronx-runtime-lib`：v2.\$1
  + `aws-neuronx-tools`：v2.\$1
  + SageMaker HyperPod 支持集群运行状况检查和自动恢复等功能的软件包

**升级步骤**
+ 运行以下命令调用 [UpdateClusterSoftware](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateClusterSoftware.html)API，使用最新的 HyperPod DLAMI 更新现有 HyperPod 集群。要了解更多说明，请参阅 [更新集群的 SageMaker HyperPod 平台软件](sagemaker-hyperpod-operate-slurm-cli-command.md#sagemaker-hyperpod-operate-slurm-cli-command-update-cluster-software)。
**重要**  
运行此 API 前，请备份您的工作。打补丁过程会用更新的 AMI 替换根卷，这意味着存储在实例根卷中的先前数据将丢失。请务必将实例根卷中的数据备份到 Amazon S3 或 Amazon for Lustre。 FSx 有关更多信息，请参阅 [使用提供的备份脚本 SageMaker HyperPod](sagemaker-hyperpod-operate-slurm-cli-command.md#sagemaker-hyperpod-operate-slurm-cli-command-update-cluster-software-backup)。

  ```
   aws sagemaker update-cluster-software --cluster-name your-cluster-name
  ```
**注意**  
请注意，您应该运行 AWS CLI 命令来更新您的 HyperPod 集群。目前无法通过 SageMaker HyperPod 控制台 UI 更新 HyperPod 软件。

## SageMaker HyperPod AMI 在 Slurm 上发布：2023 年 11 月 29 日
<a name="sagemaker-hyperpod-release-ami-slurm-20231129"></a>

**HyperPod 适用于 Slurm 的 DLAMI 软件补丁**

 HyperPod 服务团队通过[SageMaker HyperPod DLAMI](sagemaker-hyperpod-ref.md#sagemaker-hyperpod-ref-hyperpod-ami)分发软件补丁。请查看以下有关最新 HyperPod DLAMI 的详细信息。
+ 基于 [AWS 发布的深度学习基础 GPU AMI (Ubuntu 20.04)](https://aws.amazon.com/releasenotes/aws-deep-learning-base-gpu-ami-ubuntu-20-04/) 于 2023 年 10 月 18 日发布
+ 除基本 AMI 外，还包含此 D HyperPod LAMI 中预装软件包的完整列表
  + [Slurm](https://slurm.schedmd.com/documentation.html)：v23.02.3
  + Munge：v0.5.15
  + `aws-neuronx-dkms`：v2.\$1
  + `aws-neuronx-collectives`：v2.\$1
  + `aws-neuronx-runtime-lib`：v2.\$1
  + `aws-neuronx-tools`：v2.\$1
  + SageMaker HyperPod 支持集群运行状况检查和自动恢复等功能的软件包

# SageMaker HyperPod 亚马逊 EKS 的 AMI 发布
<a name="sagemaker-hyperpod-release-ami-eks"></a>

以下发行说明跟踪了适用于亚马逊 EKS 编排的 Amazon SageMaker HyperPod AMI 版本的最新更新。每份发行说明都包含在 SageMaker HyperPod DLAMIs Amazon EKS 支持中预安装或预配置的软件包的摘要列表。每个 DLAMI 都建立 AL2023 在特定的 Kubernetes 版本之上，并支持该版本。有关 HyperPod Slurm 编排的 DLAMI 版本，请参阅。[SageMaker HyperPod AMI 发布了 Slurm 版](sagemaker-hyperpod-release-ami-slurm.md)有关 Amazon SageMaker HyperPod 功能版本的信息，请参阅[亚马逊 SageMaker HyperPod 发行说明](sagemaker-hyperpod-release-notes.md)。

## SageMaker Hyperpod AMI 在亚马逊 EKS 上发布：2026 年 3 月 1 日
<a name="sagemaker-hyperpod-release-ami-eks-20260301"></a>

 **AMI 常规更新** 
+ 发布了适用于亚马逊 EKS 的 SageMaker Hyperpod AMI 版本 1.28、1.29、1.30、1.31、1.32、1.33、1.33、1.34 的更新。
+ [DLAMI 基本发行说明可在此处获得。](https://docs.aws.amazon.com//dlami/latest/devguide/appendix-ami-release-notes.html#appendix-ami-release-notes-base)

 **SageMaker 适用于 Amazon EKS 的 Hypod DLAMI 支持** 

此版本包含以下更新：

------
#### [ Kubernetes v1.28 ]
+  **AL2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + Linux 内核版本：5.10
  + Glibc 版本：2.26
  + OpenSSL 版本：1.0.2k-fips
  + FSx Lustre 客户端版本：2.12.8
  + Docker 版本：Docker 版本 25.0.14，build 0bab007
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws CLI v2 版本：aws-cli/1.44.44 Python/3.10.17 linux/5.10.248-247.988.amzn2.x86\$164 botocore/1.42.54 botocore/1.42.54
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：570.211.01
  + CUDA 版本：12.2
  + ENA 驱动程序版本：2.16.1g
  + EFA 安装程序版本：1.45.0
  + Python 版本：3.7.16
  + Kubernetes 版本：v1.28.15-eks-ecaa3a6
  + iptables-services 版本：1.8.4
  + nginx 版本：1.20.1
  + nvme-cli 版本：1.11.1
  + epel 发布版本：7
  + stress 版本：1.0.4
  + 集合版本：5.8.1
  + acl 版本：2.2.51
  + rsyslog 版本：8.24.0
  + lustre-client 版本：2.12.8
  + 系统版本：219
  + openssh 版本：7.4
  + sudo 版本：1.8.23
  + gcc 版本：7.3.1
  + cmake 版本：2.8.12.2
  + git 版本：2.47.3
  + 制作版本：3.82
  + cloudwatch-agent 版本：1.300064.1
  + nfs-utils 版本：1.3.0
  + lvm2 版本：2.02.187
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre 客户端版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd1.7.27
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.16.1g
  + EFA 安装程序版本：1.45.0
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.28.15-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.2
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300064.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0

------
#### [ Kubernetes v1.29 ]
+  **AL2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + Linux 内核版本：5.10
  + Glibc 版本：2.26
  + OpenSSL 版本：1.0.2k-fips
  + FSx Lustre 客户端版本：2.12.8
  + Docker 版本：Docker 版本 25.0.14，build 0bab007
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws CLI v2 版本：aws-cli/1.44.44 Python/3.10.17 linux/5.10.248-247.988.amzn2.x86\$164 botocore/1.42.54 botocore/1.42.54
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：570.211.01
  + CUDA 版本：12.2
  + ENA 驱动程序版本：2.16.1g
  + EFA 安装程序版本：1.45.0
  + Python 版本：3.7.16
  + Kubernetes 版本：v1.29.15-eks-ecaa3a6
  + iptables-services 版本：1.8.4
  + nginx 版本：1.20.1
  + nvme-cli 版本：1.11.1
  + epel 发布版本：7
  + stress 版本：1.0.4
  + 集合版本：5.8.1
  + acl 版本：2.2.51
  + rsyslog 版本：8.24.0
  + lustre-client 版本：2.12.8
  + 系统版本：219
  + openssh 版本：7.4
  + sudo 版本：1.8.23
  + gcc 版本：7.3.1
  + cmake 版本：2.8.12.2
  + git 版本：2.47.3
  + 制作版本：3.82
  + cloudwatch-agent 版本：1.300064.1
  + nfs-utils 版本：1.3.0
  + lvm2 版本：2.02.187
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre 客户端版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.16.1g
  + EFA 安装程序版本：1.45.0
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.29.15-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.2
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300064.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0

------
#### [ Kubernetes v1.30 ]
+  **AL2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + Linux 内核版本：5.10
  + Glibc 版本：2.26
  + OpenSSL 版本：1.0.2k-fips
  + FSx Lustre 客户端版本：2.12.8
  + Docker 版本：Docker 版本 25.0.14，build 0bab007
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws CLI v2 版本：aws-cli/1.44.44 Python/3.10.17 linux/5.10.248-247.988.amzn2.x86\$164 botocore/1.42.54 botocore/1.42.54
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：570.211.01
  + CUDA 版本：12.2
  + ENA 驱动程序版本：2.16.1g
  + EFA 安装程序版本：1.45.0
  + Python 版本：3.7.16
  + Kubernetes 版本：v1.30.14-eks-ecaa3a6
  + iptables-services 版本：1.8.4
  + nginx 版本：1.20.1
  + nvme-cli 版本：1.11.1
  + epel 发布版本：7
  + stress 版本：1.0.4
  + 集合版本：5.8.1
  + acl 版本：2.2.51
  + rsyslog 版本：8.24.0
  + lustre-client 版本：2.12.8
  + 系统版本：219
  + openssh 版本：7.4
  + sudo 版本：1.8.23
  + gcc 版本：7.3.1
  + cmake 版本：2.8.12.2
  + git 版本：2.47.3
  + 制作版本：3.82
  + cloudwatch-agent 版本：1.300064.1
  + nfs-utils 版本：1.3.0
  + lvm2 版本：2.02.187
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre 客户端版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.16.1g
  + EFA 安装程序版本：1.45.0
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.30.14-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.2
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300064.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0

------
#### [ Kubernetes v1.31 ]
+  **AL2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + Linux 内核版本：5.10
  + Glibc 版本：2.26
  + OpenSSL 版本：1.0.2k-fips
  + FSx Lustre 客户端版本：2.12.8
  + Docker 版本：Docker 版本 25.0.14，build 0bab007
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws CLI v2 版本：aws-cli/1.44.44 Python/3.10.17 linux/5.10.248-247.988.amzn2.x86\$164 botocore/1.42.54 botocore/1.42.54
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：570.211.01
  + CUDA 版本：12.2
  + ENA 驱动程序版本：2.16.1g
  + EFA 安装程序版本：1.45.0
  + Python 版本：3.7.16
  + Kubernetes 版本：v1.31.13-eks-ecaa3a6
  + iptables-services 版本：1.8.4
  + nginx 版本：1.20.1
  + nvme-cli 版本：1.11.1
  + epel 发布版本：7
  + stress 版本：1.0.4
  + 集合版本：5.8.1
  + acl 版本：2.2.51
  + rsyslog 版本：8.24.0
  + lustre-client 版本：2.12.8
  + 系统版本：219
  + openssh 版本：7.4
  + sudo 版本：1.8.23
  + gcc 版本：7.3.1
  + cmake 版本：2.8.12.2
  + git 版本：2.47.3
  + 制作版本：3.82
  + cloudwatch-agent 版本：1.300064.1
  + nfs-utils 版本：1.3.0
  + lvm2 版本：2.02.187
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre 客户端版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.5
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.16.1g
  + EFA 安装程序版本：1.45.0
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.31.13-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.2
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300064.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (ARM64):
  + Linux 内核版本：6.12
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre 客户端版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.5
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.16.1g
  + EFA 安装程序版本：1.43.3
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.31.13-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.2
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + nvidia-imex 版本：580.126.09
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300064.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：58。

------
#### [ Kubernetes v1.32 ]
+  **AL2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + Linux 内核版本：5.10
  + Glibc 版本：2.26
  + OpenSSL 版本：1.0.2k-fips
  + FSx Lustre 客户端版本：2.12.8
  + Docker 版本：Docker 版本 25.0.14，build 0bab007
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws CLI v2 版本：aws-cli/1.44.46 Python/3.10.17 linux/5.10.248-247.988.amzn2.x86\$164 botocore/1.42.56 botocore/1.42.56
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：570.211.01
  + CUDA 版本：12.2
  + ENA 驱动程序版本：2.16.1g
  + EFA 安装程序版本：1.45.0
  + Python 版本：3.7.16
  + Kubernetes 版本：v1.32.9-eks-ecaa3a6
  + iptables-services 版本：1.8.4
  + nginx 版本：1.20.1
  + nvme-cli 版本：1.11.1
  + epel 发布版本：7
  + stress 版本：1.0.4
  + 集合版本：5.8.1
  + acl 版本：2.2.51
  + rsyslog 版本：8.24.0
  + lustre-client 版本：2.12.8
  + 系统版本：219
  + openssh 版本：7.4
  + sudo 版本：1.8.23
  + gcc 版本：7.3.1
  + cmake 版本：2.8.12.2
  + git 版本：2.47.3
  + 制作版本：3.82
  + cloudwatch-agent 版本：1.300064.1
  + nfs-utils 版本：1.3.0
  + lvm2 版本：2.02.187
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre 客户端版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.5
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.16.1g
  + EFA 安装程序版本：1.45.0
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.32.9-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.2
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300064.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (ARM64):
  + Linux 内核版本：6.12
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre 客户端版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.5
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.16.1g
  + EFA 安装程序版本：1.43.3
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.32.9-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.2
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + nvidia-imex 版本：580.126.09
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300064.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：58。

------
#### [ Kubernetes v1.33 ]
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre 客户端版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.5
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.16.1g
  + EFA 安装程序版本：1.45.0
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.33.5-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.2
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300064.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (ARM64):
  + Linux 内核版本：6.12
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre 客户端版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.5
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.16.1g
  + EFA 安装程序版本：1.43.3
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.33.5-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.2
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + nvidia-imex 版本：580.126.09
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300064.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：58。

------
#### [ Kubernetes v1.34 ]
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre 客户端版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.5
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.16.1g
  + EFA 安装程序版本：1.45.0
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.34.2-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.2
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300064.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (ARM64):
  + Linux 内核版本：6.12
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre 客户端版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.5
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.16.1g
  + EFA 安装程序版本：1.43.3
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.34.2-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.2
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + nvidia-imex 版本：580.126.09
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300064.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：58。

------

## SageMaker Hyperpod AMI 在亚马逊 EKS 上发布：2026 年 2 月 12 日
<a name="sagemaker-hyperpod-release-ami-eks-20260212"></a>

 **AMI 常规更新** 
+ 发布了适用于亚马逊 EKS 的 SageMaker Hyperpod AMI 版本 1.28、1.29、1.30、1.31、1.32、1.33、1.33、1.34 的更新。
+ [DLAMI 基本发行说明可在此处获得。](https://docs.aws.amazon.com//dlami/latest/devguide/appendix-ami-release-notes.html#appendix-ami-release-notes-base)

 **SageMaker 适用于 Amazon EKS 的 Hypod DLAMI 支持** 

此版本包含以下更新：

------
#### [ Kubernetes v1.28 ]
+  **AL2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + Linux 内核版本：5.10
  + Glibc 版本：2.26
  + OpenSSL 版本：1.0.2k-fips
  + FSx Lustre 客户端版本：2.12.8
  + Docker 版本：Docker 版本 25.0.14，build 0bab007
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws CLI v2 版本：aws-cli/1.44.31 Python/3.10.17 linux/5.10.247-246.989.amzn2.x86\$164 botocore/1.42.41
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：570.211.01
  + CUDA 版本：12.2
  + ENA 驱动程序版本：2.15.0g
  + EFA 安装程序版本：1.45.0
  + Python 版本：3.7.16
  + Kubernetes 版本：v1.28.15-eks-ecaa3a6
  + iptables-services 版本：1.8.4
  + nginx 版本：1.20.1
  + nvme-cli 版本：1.11.1
  + epel 发布版本：7
  + stress 版本：1.0.4
  + 集合版本：5.8.1
  + acl 版本：2.2.51
  + rsyslog 版本：8.24.0
  + lustre-client 版本：2.12.8
  + 系统版本：219
  + openssh 版本：7.4
  + sudo 版本：1.8.23
  + gcc 版本：7.3.1
  + cmake 版本：2.8.12.2
  + git 版本：2.47.3
  + 制作版本：3.82
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：1.3.0
  + lvm2 版本：2.02.187
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre 客户端版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd1.7.27
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + EFA 安装程序版本：1.45.0
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.28.15-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.1
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0

------
#### [ Kubernetes v1.29 ]
+  **AL2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + Linux 内核版本：5.10
  + Glibc 版本：2.26
  + OpenSSL 版本：1.0.2k-fips
  + FSx Lustre 客户端版本：2.12.8
  + Docker 版本：Docker 版本 25.0.14，build 0bab007
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws CLI v2 版本：aws-cli/1.44.31 Python/3.10.17 linux/5.10.247-246.989.amzn2.x86\$164 botocore/1.42.41
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：570.211.01
  + CUDA 版本：12.2
  + ENA 驱动程序版本：2.15.0g
  + EFA 安装程序版本：1.45.0
  + Python 版本：3.7.16
  + Kubernetes 版本：v1.29.15-eks-ecaa3a6
  + iptables-services 版本：1.8.4
  + nginx 版本：1.20.1
  + nvme-cli 版本：1.11.1
  + epel 发布版本：7
  + stress 版本：1.0.4
  + 集合版本：5.8.1
  + acl 版本：2.2.51
  + rsyslog 版本：8.24.0
  + lustre-client 版本：2.12.8
  + 系统版本：219
  + openssh 版本：7.4
  + sudo 版本：1.8.23
  + gcc 版本：7.3.1
  + cmake 版本：2.8.12.2
  + git 版本：2.47.3
  + 制作版本：3.82
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：1.3.0
  + lvm2 版本：2.02.187
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre 客户端版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + EFA 安装程序版本：1.45.0
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.29.15-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.1
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0

------
#### [ Kubernetes v1.30 ]
+  **AL2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + Linux 内核版本：5.10
  + Glibc 版本：2.26
  + OpenSSL 版本：1.0.2k-fips
  + FSx Lustre 客户端版本：2.12.8
  + Docker 版本：Docker 版本 25.0.14，build 0bab007
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws CLI v2 版本：aws-cli/1.44.31 Python/3.10.17 linux/5.10.247-246.989.amzn2.x86\$164 botocore/1.42.41
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：570.211.01
  + CUDA 版本：12.2
  + ENA 驱动程序版本：2.15.0g
  + EFA 安装程序版本：1.45.0
  + Python 版本：3.7.16
  + Kubernetes 版本：v1.30.14-eks-ecaa3a6
  + iptables-services 版本：1.8.4
  + nginx 版本：1.20.1
  + nvme-cli 版本：1.11.1
  + epel 发布版本：7
  + stress 版本：1.0.4
  + 集合版本：5.8.1
  + acl 版本：2.2.51
  + rsyslog 版本：8.24.0
  + lustre-client 版本：2.12.8
  + 系统版本：219
  + openssh 版本：7.4
  + sudo 版本：1.8.23
  + gcc 版本：7.3.1
  + cmake 版本：2.8.12.2
  + git 版本：2.47.3
  + 制作版本：3.82
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：1.3.0
  + lvm2 版本：2.02.187
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre 客户端版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + EFA 安装程序版本：1.45.0
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.30.14-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.1
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0

------
#### [ Kubernetes v1.31 ]
+  **AL2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + Linux 内核版本：5.10
  + Glibc 版本：2.26
  + OpenSSL 版本：1.0.2k-fips
  + FSx Lustre 客户端版本：2.12.8
  + Docker 版本：Docker 版本 25.0.14，build 0bab007
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws CLI v2 版本：aws-cli/1.44.31 Python/3.10.17 linux/5.10.247-246.989.amzn2.x86\$164 botocore/1.42.41
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：570.211.01
  + CUDA 版本：12.2
  + ENA 驱动程序版本：2.15.0g
  + EFA 安装程序版本：1.45.0
  + Python 版本：3.7.16
  + Kubernetes 版本：v1.31.13-eks-ecaa3a6
  + iptables-services 版本：1.8.4
  + nginx 版本：1.20.1
  + nvme-cli 版本：1.11.1
  + epel 发布版本：7
  + stress 版本：1.0.4
  + 集合版本：5.8.1
  + acl 版本：2.2.51
  + rsyslog 版本：8.24.0
  + lustre-client 版本：2.12.8
  + 系统版本：219
  + openssh 版本：7.4
  + sudo 版本：1.8.23
  + gcc 版本：7.3.1
  + cmake 版本：2.8.12.2
  + git 版本：2.47.3
  + 制作版本：3.82
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：1.3.0
  + lvm2 版本：2.02.187
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre 客户端版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.5
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + EFA 安装程序版本：1.45.0
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.31.13-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.1
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (ARM64):
  + Linux 内核版本：6.12
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.5
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + EFA 安装程序版本：1.43.3
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.31.13-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.1
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + nvidia-imex 版本：580.126.09
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：58。

------
#### [ Kubernetes v1.32 ]
+  **AL2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + Linux 内核版本：5.10
  + Glibc 版本：2.26
  + OpenSSL 版本：1.0.2k-fips
  + FSx Lustre Client 版本：2.12.8
  + Docker 版本：Docker 版本 25.0.14，build 0bab007
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws CLI v2 版本：aws-cli/1.44.31 Python/3.10.17 linux/5.10.247-246.989.amzn2.x86\$164 botocore/1.42.41
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：570.211.01
  + CUDA 版本：12.2
  + ENA 驱动程序版本：2.15.0g
  + EFA 安装程序版本：1.45.0
  + Python 版本：3.7.16
  + Kubernetes 版本：v1.32.9-eks-ecaa3a6
  + iptables-services 版本：1.8.4
  + nginx 版本：1.20.1
  + nvme-cli 版本：1.11.1
  + epel 发布版本：7
  + stress 版本：1.0.4
  + 集合版本：5.8.1
  + acl 版本：2.2.51
  + rsyslog 版本：8.24.0
  + lustre-client 版本：2.12.8
  + 系统版本：219
  + openssh 版本：7.4
  + sudo 版本：1.8.23
  + gcc 版本：7.3.1
  + cmake 版本：2.8.12.2
  + git 版本：2.47.3
  + 制作版本：3.82
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：1.3.0
  + lvm2 版本：2.02.187
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.5
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + EFA 安装程序版本：1.45.0
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.32.9-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.1
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (ARM64):
  + Linux 内核版本：6.12
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.5
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + EFA 安装程序版本：1.43.3
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.32.9-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.1
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + nvidia-imex 版本：580.126.09
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：58。

------
#### [ Kubernetes v1.33 ]
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.5
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + EFA 安装程序版本：1.45.0
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.33.5-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.1
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (ARM64):
  + Linux 内核版本：6.12
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.5
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + EFA 安装程序版本：1.43.3
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.33.5-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.1
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + nvidia-imex 版本：580.126.09
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：58。

------
#### [ Kubernetes v1.34 ]
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.5
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + EFA 安装程序版本：1.45.0
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.34.2-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.1
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (ARM64):
  + Linux 内核版本：6.12
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.5
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + EFA 安装程序版本：1.43.3
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.34.2-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.1
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + nvidia-imex 版本：580.126.09
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：58。

------

## SageMaker Hyperpod AMI 在亚马逊 EKS 上发布：2026 年 1 月 25 日
<a name="sagemaker-hyperpod-release-ami-eks-20260125"></a>

 **AMI 常规更新** 
+ 发布了适用于亚马逊 EKS 的 SageMaker Hyperpod AMI 版本 1.28、1.29、1.30、1.31、1.32、1.33、1.33、1.34 的更新。
+ [DLAMI 基本发行说明可在此处获得。](https://docs.aws.amazon.com//dlami/latest/devguide/appendix-ami-release-notes.html#appendix-ami-release-notes-base)

 **SageMaker 适用于 Amazon EKS 的 Hypod DLAMI 支持** 

此版本包含以下更新：

------
#### [ Kubernetes v1.28 ]
+  **AL2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + Linux 内核版本：5.10
  + Glibc 版本：2.26
  + OpenSSL 版本：1.0.2k-fips
  + FSx Lustre Client 版本：2.12.8
  + Docker 版本：Docker 版本 25.0.14，build 0bab007
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws CLI v2 版本：aws-cli/1.44.21 Python/3.10.17 linux/5.10.247-246.989.amzn2.x86\$164 botocore/1.42.31
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：570.211.01
  + CUDA 版本：12.2
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.7.16
  + Kubernetes 版本：v1.28.15-eks-ecaa3a6
  + iptables-services 版本：1.8.4
  + nginx 版本：1.20.1
  + nvme-cli 版本：1.11.1
  + epel 发布版本：7
  + stress 版本：1.0.4
  + 集合版本：5.8.1
  + acl 版本：2.2.51
  + rsyslog 版本：8.24.0
  + lustre-client 版本：2.12.8
  + 系统版本：219
  + openssh 版本：7.4
  + sudo 版本：1.8.23
  + gcc 版本：7.3.1
  + cmake 版本：2.8.12.2
  + git 版本：2.47.3
  + 制作版本：3.82
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：1.3.0
  + lvm2 版本：2.02.187
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd1.7.27
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.28.15-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0

------
#### [ Kubernetes v1.29 ]
+  **AL2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + Linux 内核版本：5.10
  + Glibc 版本：2.26
  + OpenSSL 版本：1.0.2k-fips
  + FSx Lustre Client 版本：2.12.8
  + Docker 版本：Docker 版本 25.0.14，build 0bab007
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws CLI v2 版本：aws-cli/1.44.21 Python/3.10.17 linux/5.10.247-246.989.amzn2.x86\$164 botocore/1.42.31
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：570.211.01
  + CUDA 版本：12.2
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.7.16
  + Kubernetes 版本：v1.29.15-eks-ecaa3a6
  + iptables-services 版本：1.8.4
  + nginx 版本：1.20.1
  + nvme-cli 版本：1.11.1
  + epel 发布版本：7
  + stress 版本：1.0.4
  + 集合版本：5.8.1
  + acl 版本：2.2.51
  + rsyslog 版本：8.24.0
  + lustre-client 版本：2.12.8
  + 系统版本：219
  + openssh 版本：7.4
  + sudo 版本：1.8.23
  + gcc 版本：7.3.1
  + cmake 版本：2.8.12.2
  + git 版本：2.47.3
  + 制作版本：3.82
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：1.3.0
  + lvm2 版本：2.02.187
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.29.15-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0

------
#### [ Kubernetes v1.30 ]
+  **AL2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + Linux 内核版本：5.10
  + Glibc 版本：2.26
  + OpenSSL 版本：1.0.2k-fips
  + FSx Lustre Client 版本：2.12.8
  + Docker 版本：Docker 版本 25.0.14，build 0bab007
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws CLI v2 版本：aws-cli/1.44.21 Python/3.10.17 linux/5.10.247-246.989.amzn2.x86\$164 botocore/1.42.31
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：570.211.01
  + CUDA 版本：12.2
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.7.16
  + Kubernetes 版本：v1.30.14-eks-ecaa3a6
  + iptables-services 版本：1.8.4
  + nginx 版本：1.20.1
  + nvme-cli 版本：1.11.1
  + epel 发布版本：7
  + stress 版本：1.0.4
  + 集合版本：5.8.1
  + acl 版本：2.2.51
  + rsyslog 版本：8.24.0
  + lustre-client 版本：2.12.8
  + 系统版本：219
  + openssh 版本：7.4
  + sudo 版本：1.8.23
  + gcc 版本：7.3.1
  + cmake 版本：2.8.12.2
  + git 版本：2.47.3
  + 制作版本：3.82
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：1.3.0
  + lvm2 版本：2.02.187
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.30.14-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0

------
#### [ Kubernetes v1.31 ]
+  **AL2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + Linux 内核版本：5.10
  + Glibc 版本：2.26
  + OpenSSL 版本：1.0.2k-fips
  + FSx Lustre Client 版本：2.12.8
  + Docker 版本：Docker 版本 25.0.14，build 0bab007
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws CLI v2 版本：aws-cli/1.44.21 Python/3.10.17 linux/5.10.247-246.989.amzn2.x86\$164 botocore/1.42.31
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：570.211.01
  + CUDA 版本：12.2
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.7.16
  + Kubernetes 版本：v1.31.13-eks-ecaa3a6
  + iptables-services 版本：1.8.4
  + nginx 版本：1.20.1
  + nvme-cli 版本：1.11.1
  + epel 发布版本：7
  + stress 版本：1.0.4
  + 集合版本：5.8.1
  + acl 版本：2.2.51
  + rsyslog 版本：8.24.0
  + lustre-client 版本：2.12.8
  + 系统版本：219
  + openssh 版本：7.4
  + sudo 版本：1.8.23
  + gcc 版本：7.3.1
  + cmake 版本：2.8.12.2
  + git 版本：2.47.3
  + 制作版本：3.82
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：1.3.0
  + lvm2 版本：2.02.187
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.5
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.31.13-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (ARM64):
  + Linux 内核版本：6.12
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.5
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.31.13-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + nvidia-imex 版本：580.126.09
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：58。

------
#### [ Kubernetes v1.32 ]
+  **AL2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + Linux 内核版本：5.10
  + Glibc 版本：2.26
  + OpenSSL 版本：1.0.2k-fips
  + FSx Lustre Client 版本：2.12.8
  + Docker 版本：Docker 版本 25.0.14，build 0bab007
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws CLI v2 版本：aws-cli/1.44.21 Python/3.10.17 linux/5.10.247-246.989.amzn2.x86\$164 botocore/1.42.31
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：570.211.01
  + CUDA 版本：12.2
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.7.16
  + Kubernetes 版本：v1.32.9-eks-ecaa3a6
  + iptables-services 版本：1.8.4
  + nginx 版本：1.20.1
  + nvme-cli 版本：1.11.1
  + epel 发布版本：7
  + stress 版本：1.0.4
  + 集合版本：5.8.1
  + acl 版本：2.2.51
  + rsyslog 版本：8.24.0
  + lustre-client 版本：2.12.8
  + 系统版本：219
  + openssh 版本：7.4
  + sudo 版本：1.8.23
  + gcc 版本：7.3.1
  + cmake 版本：2.8.12.2
  + git 版本：2.47.3
  + 制作版本：3.82
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：1.3.0
  + lvm2 版本：2.02.187
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.5
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.32.9-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (ARM64):
  + Linux 内核版本：6.12
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.5
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.32.9-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + nvidia-imex 版本：580.126.09
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：58。

------
#### [ Kubernetes v1.33 ]
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.5
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.33.5-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (ARM64):
  + Linux 内核版本：6.12
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.5
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.33.5-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + nvidia-imex 版本：580.126.09
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：58。

------
#### [ Kubernetes v1.34 ]
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.5
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.34.2-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (ARM64):
  + Linux 内核版本：6.12
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.4
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.5
  + NVIDIA 驱动程序版本：580.126.09
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.34.2-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + nvidia-imex 版本：580.126.09
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300062.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：58。

------

## SageMaker Hyperpod AMI 在亚马逊 EKS 上发布：2025 年 12 月 29 日
<a name="sagemaker-hyperpod-release-ami-eks-20251229"></a>

 **AMI 常规更新** 
+ 发布了适用于亚马逊 EKS 的 SageMaker Hyperpod AMI 版本 1.28、1.29、1.30、1.31、1.32、1.33 的更新。
+ [DLAMI 基本发行说明可在此处获得。](https://docs.aws.amazon.com//dlami/latest/devguide/appendix-ami-release-notes.html#appendix-ami-release-notes-base)

 **SageMaker 适用于 Amazon EKS 的 Hypod DLAMI 支持** 

此版本包含以下更新：

------
#### [ Kubernetes v1.28 ]
+  **AL2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + Linux 内核版本：5.10
  + Glibc 版本：2.26
  + OpenSSL 版本：1.0.2k-fips
  + FSx Lustre Client 版本：2.12.8
  + Docker 版本：Docker 版本 25.0.13，build 0bab007
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws CLI v2 版本：aws-cli/1.44.4 Python/3.10.17 linux/5.10.245-245.983.amzn2.x86\$164 botocore/1.42.14
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：570.195.03
  + CUDA 版本：12.2
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.7.16
  + Kubernetes 版本：v1.28.15-eks-ecaa3a6
  + iptables-services 版本：1.8.4
  + nginx 版本：1.20.1
  + nvme-cli 版本：1.11.1
  + epel 发布版本：7
  + stress 版本：1.0.4
  + 集合版本：5.8.1
  + acl 版本：2.2.51
  + rsyslog 版本：8.24.0
  + lustre-client 版本：2.12.8
  + 系统版本：219
  + openssh 版本：7.4
  + sudo 版本：1.8.23
  + gcc 版本：7.3.1
  + cmake 版本：2.8.12.2
  + git 版本：2.47.3
  + 制作版本：3.82
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：1.3.0
  + lvm2 版本：2.02.187
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd1.7.27
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.105.08
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.28.15-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0

------
#### [ Kubernetes v1.29 ]
+  **AL2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + Linux 内核版本：5.10
  + Glibc 版本：2.26
  + OpenSSL 版本：1.0.2k-fips
  + FSx Lustre Client 版本：2.12.8
  + Docker 版本：Docker 版本 25.0.13，build 0bab007
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws CLI v2 版本：aws-cli/1.44.4 Python/3.10.17 linux/5.10.245-245.983.amzn2.x86\$164 botocore/1.42.14
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：570.195.03
  + CUDA 版本：12.2
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.7.16
  + Kubernetes 版本：v1.29.15-eks-ecaa3a6
  + iptables-services 版本：1.8.4
  + nginx 版本：1.20.1
  + nvme-cli 版本：1.11.1
  + epel 发布版本：7
  + stress 版本：1.0.4
  + 集合版本：5.8.1
  + acl 版本：2.2.51
  + rsyslog 版本：8.24.0
  + lustre-client 版本：2.12.8
  + 系统版本：219
  + openssh 版本：7.4
  + sudo 版本：1.8.23
  + gcc 版本：7.3.1
  + cmake 版本：2.8.12.2
  + git 版本：2.47.3
  + 制作版本：3.82
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：1.3.0
  + lvm2 版本：2.02.187
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.105.08
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.29.15-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0

------
#### [ Kubernetes v1.30 ]
+  **AL2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + Linux 内核版本：5.10
  + Glibc 版本：2.26
  + OpenSSL 版本：1.0.2k-fips
  + FSx Lustre Client 版本：2.12.8
  + Docker 版本：Docker 版本 25.0.13，build 0bab007
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws CLI v2 版本：aws-cli/1.44.4 Python/3.10.17 linux/5.10.245-245.983.amzn2.x86\$164 botocore/1.42.14
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：570.195.03
  + CUDA 版本：12.2
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.7.16
  + Kubernetes 版本：v1.30.14-eks-ecaa3a6
  + iptables-services 版本：1.8.4
  + nginx 版本：1.20.1
  + nvme-cli 版本：1.11.1
  + epel 发布版本：7
  + stress 版本：1.0.4
  + 集合版本：5.8.1
  + acl 版本：2.2.51
  + rsyslog 版本：8.24.0
  + lustre-client 版本：2.12.8
  + 系统版本：219
  + openssh 版本：7.4
  + sudo 版本：1.8.23
  + gcc 版本：7.3.1
  + cmake 版本：2.8.12.2
  + git 版本：2.47.3
  + 制作版本：3.82
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：1.3.0
  + lvm2 版本：2.02.187
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.105.08
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.30.14-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0

------
#### [ Kubernetes v1.31 ]
+  **AL2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + Linux 内核版本：5.10
  + Glibc 版本：2.26
  + OpenSSL 版本：1.0.2k-fips
  + FSx Lustre Client 版本：2.12.8
  + Docker 版本：Docker 版本 25.0.13，build 0bab007
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws CLI v2 版本：aws-cli/1.44.4 Python/3.10.17 linux/5.10.245-245.983.amzn2.x86\$164 botocore/1.42.14
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：570.195.03
  + CUDA 版本：12.2
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.7.16
  + Kubernetes 版本：v1.31.13-eks-ecaa3a6
  + iptables-services 版本：1.8.4
  + nginx 版本：1.20.1
  + nvme-cli 版本：1.11.1
  + epel 发布版本：7
  + stress 版本：1.0.4
  + 集合版本：5.8.1
  + acl 版本：2.2.51
  + rsyslog 版本：8.24.0
  + lustre-client 版本：2.12.8
  + 系统版本：219
  + openssh 版本：7.4
  + sudo 版本：1.8.23
  + gcc 版本：7.3.1
  + cmake 版本：2.8.12.2
  + git 版本：2.47.3
  + 制作版本：3.82
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：1.3.0
  + lvm2 版本：2.02.187
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.4
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.105.08
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.31.13-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (ARM64):
  + Linux 内核版本：6.12
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.4
  + NVIDIA 驱动程序版本：580.105.08
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.31.13-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + nvidia-imex 版本：580.105.08
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：58。

------
#### [ Kubernetes v1.32 ]
+  **AL2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + Linux 内核版本：5.10
  + Glibc 版本：2.26
  + OpenSSL 版本：1.0.2k-fips
  + FSx Lustre Client 版本：2.12.8
  + Docker 版本：Docker 版本 25.0.13，build 0bab007
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd1.7.29
  + aws CLI v2 版本：aws-cli/1.44.4 Python/3.10.17 linux/5.10.245-245.983.amzn2.x86\$164 botocore/1.42.14
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：570.195.03
  + CUDA 版本：12.2
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.7.16
  + Kubernetes 版本：v1.32.9-eks-ecaa3a6
  + iptables-services 版本：1.8.4
  + nginx 版本：1.20.1
  + nvme-cli 版本：1.11.1
  + epel 发布版本：7
  + stress 版本：1.0.4
  + 集合版本：5.8.1
  + acl 版本：2.2.51
  + rsyslog 版本：8.24.0
  + lustre-client 版本：2.12.8
  + 系统版本：219
  + openssh 版本：7.4
  + sudo 版本：1.8.23
  + gcc 版本：7.3.1
  + cmake 版本：2.8.12.2
  + git 版本：2.47.3
  + 制作版本：3.82
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：1.3.0
  + lvm2 版本：2.02.187
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.4
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.105.08
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.32.9-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (ARM64):
  + Linux 内核版本：6.12
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.4
  + NVIDIA 驱动程序版本：580.105.08
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.32.9-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + nvidia-imex 版本：580.105.08
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：58。

------
#### [ Kubernetes v1.33 ]
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.4
  + aws Neuronx DKMS 版本：2.25.4.0
  + NVIDIA 驱动程序版本：580.105.08
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.33.5-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-instance-connece 版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：60.0
+ AL2023 (ARM64):
  + Linux 内核版本：6.12
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd/v2 2.1.4
  + NVIDIA 驱动程序版本：580.105.08
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.25
  + Kubernetes 版本：v1.33.5-eks-ecaa3a6
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + nvidia-imex 版本：580.105.08
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-instance-connece 版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：58。

------

## SageMaker Hyperpod AMI 在亚马逊 EKS 上发布：2025 年 11 月 22 日
<a name="sagemaker-hyperpod-release-ami-eks-20251128"></a>

 **AMI 常规更新** 
+ 发布了适用于亚马逊 EKS 的 SageMaker Hyperpod AMI 版本 1.28、1.29、1.30、1.31、1.32、1.33 的更新。
+ [DLAMI 基本发行说明可在此处获得。](https://docs.aws.amazon.com//dlami/latest/devguide/appendix-ami-release-notes.html#appendix-ami-release-notes-base)

 **SageMaker 适用于 Amazon EKS 的 Hypod DLAMI 支持** 

此版本包含以下更新：

------
#### [ Kubernetes v1.28 ]
+  **AL2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + Linux 内核版本：5.10
  + Glibc 版本：2.26
  + OpenSSL 版本：1.0.2k-fips
  + FSx Lustre Client 版本：2.12.8
  + Docker 版本：Docker 版本 25.0.13，build 0bab007
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd1.7.27
  + aws CLI v2 版本：aws-cli/1.42.71 Python/3.10.17 linux/5.10.245-241.978.amzn2.x86\$164 botocore/1.40.71
  + aws Neuronx DKMS 版本：2.24.7.0
  + NVIDIA 驱动程序版本：570.195.03
  + CUDA 版本：12.2
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.7.16
  + Kubernetes 版本：v1.28.15-eks-473151a
  + iptables-services 版本：1.8.4
  + nginx 版本：1.20.1
  + nvme-cli 版本：1.11.1
  + epel 发布版本：7
  + stress 版本：1.0.4
  + 集合版本：5.8.1
  + acl 版本：2.2.51
  + rsyslog 版本：8.24.0
  + lustre-client 版本：2.12.8
  + 系统版本：219
  + openssh 版本：7.4
  + sudo 版本：1.8.23
  + gcc 版本：7.3.1
  + cmake 版本：2.8.12.2
  + git 版本：2.47.3
  + 制作版本：3.82
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：1.3.0
  + lvm2 版本：2.02.187
  + ec2-instance-connece 版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：59。
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd1.7.27
  + aws Neuronx DKMS 版本：2.24.7.0
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.24
  + Kubernetes 版本：v1.28.15-eks-473151a
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-instance-connece 版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：59。

------
#### [ Kubernetes v1.29 ]
+  **AL2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + Linux 内核版本：5.10
  + Glibc 版本：2.26
  + OpenSSL 版本：1.0.2k-fips
  + FSx Lustre Client 版本：2.12.8
  + Docker 版本：Docker 版本 25.0.13，build 0bab007
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd1.7.27
  + aws CLI v2 版本：aws-cli/1.42.71 Python/3.10.17 linux/5.10.245-241.978.amzn2.x86\$164 botocore/1.40.71
  + aws Neuronx DKMS 版本：2.24.7.0
  + NVIDIA 驱动程序版本：570.195.03
  + CUDA 版本：12.2
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.7.16
  + Kubernetes 版本：v1.29.15-eks-473151a
  + iptables-services 版本：1.8.4
  + nginx 版本：1.20.1
  + nvme-cli 版本：1.11.1
  + epel 发布版本：7
  + stress 版本：1.0.4
  + 集合版本：5.8.1
  + acl 版本：2.2.51
  + rsyslog 版本：8.24.0
  + lustre-client 版本：2.12.8
  + 系统版本：219
  + openssh 版本：7.4
  + sudo 版本：1.8.23
  + gcc 版本：7.3.1
  + cmake 版本：2.8.12.2
  + git 版本：2.47.3
  + 制作版本：3.82
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：1.3.0
  + lvm2 版本：2.02.187
  + ec2-instance-connece 版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：59。
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd1.7.27
  + aws Neuronx DKMS 版本：2.24.7.0
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.24
  + Kubernetes 版本：v1.29.15-eks-473151a
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-instance-connece 版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：59。

------
#### [ Kubernetes v1.30 ]
+  **AL2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + Linux 内核版本：5.10
  + Glibc 版本：2.26
  + OpenSSL 版本：1.0.2k-fips
  + FSx Lustre Client 版本：2.12.8
  + Docker 版本：Docker 版本 25.0.13，build 0bab007
  + 运行版本：1.3.2
  + 容器版本：containerd github。 com/containerd/containerd1.7.27
  + aws CLI v2 版本：aws-cli/1.42.69 Python/3.10.17 linux/5.10.245-241.976.amzn2.x86\$164 botocore/1.40.69
  + aws Neuronx DKMS 版本：2.24.7.0
  + NVIDIA 驱动程序版本：570.195.03
  + CUDA 版本：12.2
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.7.16
  + Kubernetes 版本：v1.30.11-eks-473151a
  + iptables-services 版本：1.8.4
  + nginx 版本：1.20.1
  + nvme-cli 版本：1.11.1
  + epel 发布版本：7
  + stress 版本：1.0.4
  + 集合版本：5.8.1
  + acl 版本：2.2.51
  + rsyslog 版本：8.24.0
  + lustre-client 版本：2.12.8
  + 系统版本：219
  + openssh 版本：7.4
  + sudo 版本：1.8.23
  + gcc 版本：7.3.1
  + cmake 版本：2.8.12.2
  + git 版本：2.47.3
  + 制作版本：3.82
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：1.3.0
  + lvm2 版本：2.02.187
  + ec2-instance-connece 版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：58。
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd1.7.27
  + aws Neuronx DKMS 版本：2.24.7.0
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.24
  + Kubernetes 版本：v1.30.11-eks-473151a
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-instance-connece 版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：59。

------
#### [ Kubernetes v1.31 ]
+  **AL2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + Linux 内核版本：5.10
  + Glibc 版本：2.26
  + OpenSSL 版本：1.0.2k-fips
  + FSx Lustre Client 版本：2.12.8
  + Docker 版本：Docker 版本 25.0.13，build 0bab007
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd1.7.27
  + aws CLI v2 版本：aws-cli/1.42.71 Python/3.10.17 linux/5.10.245-241.978.amzn2.x86\$164 botocore/1.40.71
  + aws Neuronx DKMS 版本：2.24.7.0
  + NVIDIA 驱动程序版本：570.195.03
  + CUDA 版本：12.2
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.7.16
  + Kubernetes 版本：v1.31.7-eks-473151a
  + iptables-services 版本：1.8.4
  + nginx 版本：1.20.1
  + nvme-cli 版本：1.11.1
  + epel 发布版本：7
  + stress 版本：1.0.4
  + 集合版本：5.8.1
  + acl 版本：2.2.51
  + rsyslog 版本：8.24.0
  + lustre-client 版本：2.12.8
  + 系统版本：219
  + openssh 版本：7.4
  + sudo 版本：1.8.23
  + gcc 版本：7.3.1
  + cmake 版本：2.8.12.2
  + git 版本：2.47.3
  + 制作版本：3.82
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：1.3.0
  + lvm2 版本：2.02.187
  + ec2-instance-connece 版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：59。
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd1.7.27
  + aws Neuronx DKMS 版本：2.24.7.0
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.24
  + Kubernetes 版本：v1.31.13-eks-113cf36
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-instance-connece 版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：59。
+ AL2023 (ARM64):
  + Linux 内核版本：6.12
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd1.7.27
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.24
  + Kubernetes 版本：v1.31.13-eks-113cf36
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + nvidia-imex 版本：580.95.05
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-instance-connece 版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：58。

------
#### [ Kubernetes v1.32 ]
+  **AL2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + Linux 内核版本：5.10
  + Glibc 版本：2.26
  + OpenSSL 版本：1.0.2k-fips
  + FSx Lustre Client 版本：2.12.8
  + Docker 版本：Docker 版本 25.0.13，build 0bab007
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd1.7.27
  + aws CLI v2 版本：aws-cli/1.42.74 Python/3.10.17 linux/5.10.245-241.978.amzn2.x86\$164 botocore/1.40.74 botocore/1.40.74
  + aws Neuronx DKMS 版本：2.24.7.0
  + NVIDIA 驱动程序版本：570.195.03
  + CUDA 版本：12.2
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.7.16
  + Kubernetes 版本：v1.32.3-eks-473151a
  + iptables-services 版本：1.8.4
  + nginx 版本：1.20.1
  + nvme-cli 版本：1.11.1
  + epel 发布版本：7
  + stress 版本：1.0.4
  + 集合版本：5.8.1
  + acl 版本：2.2.51
  + rsyslog 版本：8.24.0
  + lustre-client 版本：2.12.8
  + 系统版本：219
  + openssh 版本：7.4
  + sudo 版本：1.8.23
  + gcc 版本：7.3.1
  + cmake 版本：2.8.12.2
  + git 版本：2.47.3
  + 制作版本：3.82
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：1.3.0
  + lvm2 版本：2.02.187
  + ec2-instance-connece 版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：59。
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd1.7.27
  + aws Neuronx DKMS 版本：2.24.7.0
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.24
  + Kubernetes 版本：v1.32.9-eks-113cf36
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-instance-connece 版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：59。
+ AL2023 (ARM64):
  + Linux 内核版本：6.12
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd1.7.27
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.24
  + Kubernetes 版本：v1.32.9-eks-113cf36
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + nvidia-imex 版本：580.95.05
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-instance-connece 版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：58。

------
#### [ Kubernetes v1.33 ]
+ AL2023 (x86\$164)：
  + Linux 内核版本：6.1
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd1.7.27
  + aws Neuronx DKMS 版本：2.24.7.0
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.24
  + Kubernetes 版本：v1.33.5-eks-113cf36
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：59。
+ AL2023 (ARM64):
  + Linux 内核版本：6.12
  + Glibc 版本：2.34
  + OpenSSL 版本：3.2.2
  + FSx Lustre Client 版本：2.15.6
  + 运行版本：1.3.3
  + 容器版本：containerd github。 com/containerd/containerd1.7.27
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：12.8
  + ENA 驱动程序版本：2.15.0g
  + Python 版本：3.9.24
  + Kubernetes 版本：v1.33.5-eks-113cf36
  + iptables-services 版本：1.8.8
  + nginx 版本：1.28.0
  + nvme-cli 版本：2.13 1.13
  + stress 版本：1.0.7
  + 集合版本：5.12.0。
  + acl 版本：2.3.1
  + lustre-client 版本：2.15.6
  + nvidia-imex 版本：580.95.05
  + 系统版本：252
  + openssh 版本：8.7
  + sudo 版本：1.9.15
  + gcc 版本：11.5.0
  + cmake 版本：3.22.2
  + git 版本：2.50.1
  + 制作版本：4.3
  + cloudwatch-agent 版本：1.300060.1
  + nfs-utils 版本：2.5.4
  + lvm2 版本：2.03.16
  + ec2-实例连接版本：1.1
  + aws-cfn-bootstrap 版本：2.0
  + rdma-core 版本：58。

------

## SageMaker HyperPod AMI 在亚马逊 EKS 上发布：2025 年 11 月 7 日
<a name="sagemaker-hyperpod-release-ami-eks-20251107"></a>

**AMI 常规更新**
+ 发布了适用于亚马逊 EKS 的 SageMaker HyperPod AMI 版本 1.28、1.29、1.30、1.31、1.32 和 1.33 的更新。
+ [DLAMI 基本发行说明可在此处获得。](https://docs.aws.amazon.com//dlami/latest/devguide/appendix-ami-release-notes.html#appendix-ami-release-notes-base)

**SageMaker HyperPod 适用于 Amazon 的 DLAMI EKS 支持**

此版本包含以下更新：

------
#### [ Kubernetes v1.28 ]
+ **亚马逊 Linux 2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + NVIDIA 驱动程序版本：570.195.03
  + CUDA 版本：12.8
  + Kubernetes 版本：1.28.15
+ AL2023 (x86\$164)：
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：13.0
  + Kubernetes 版本：1.28.15
+ Package 更新包括 boto3、botocore、pip、regex、psutil 和 nvidia 容器工具包组件。
+ 新增软件包：注释文档 0.0.3

------
#### [ Kubernetes v1.29 ]
+ **亚马逊 Linux 2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + NVIDIA 驱动程序版本：570.195.03
  + CUDA 版本：12.8
  + Kubernetes 版本：1.29.15
+ AL2023 (x86\$164)：
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：13.0
  + Kubernetes 版本：1.29.15
+ Package 更新包括内核更新、glibc 更新和各种系统库。
+ 新增软件包：注释文档 0.0.3

------
#### [ Kubernetes v1.30 ]
+ **亚马逊 Linux 2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + NVIDIA 驱动程序版本：570.195.03
  + CUDA 版本：12.8
  + Kubernetes 版本：1.30.11
+ AL2023 (x86\$164)：
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：13.0
  + Kubernetes 版本：1.30.11
+ Package 更新包括内核 livepatch 更新和系统库更新。
+ 新增软件包：注释文档 0.0.3

------
#### [ Kubernetes v1.31 ]
+ **亚马逊 Linux 2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + NVIDIA 驱动程序版本：570.195.03
  + CUDA 版本：12.8
  + Kubernetes 版本：1.31.7
+ AL2023 (x86\$164)：
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：13.0
  + Kubernetes 版本：1.31.13
+ AL2023 （手臂）：
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：13.0
  + Kubernetes 版本：1.31.13
  + 内核版本：6.12.46-66.121.amzn2023.aarch64
+ Package 更新包括大量的系统库更新、内核更新和增强库更新。
+ 添加的软件包： apr-util-lmdb，kernel-livepatch-6.1.156-177.286

------
#### [ Kubernetes v1.32 ]
+ **亚马逊 Linux 2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + NVIDIA 驱动程序版本：570.195.03
  + CUDA 版本：12.8
  + Kubernetes 版本：1.32.3
  + AWS IAM 身份验证器版本：v0.6.29
+ AL2023 (x86\$164)：
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：13.0
  + Kubernetes 版本：1.32.9
+ AL2023 （手臂）：
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：13.0
  + Kubernetes 版本：1.32.9
  + 内核版本：6.12.46-66.121.amzn2023.aarch64
+ Package 更新包括内核 livepatch 更新和系统库更新。
+ 新增软件包：注释文档 0.0.3

------
#### [ Kubernetes v1.33 ]
+ AL2023 (x86\$164)：
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：13.0
  + Kubernetes 版本：1.33.5
  + 内核版本：6.1.155-176.282.amzn2023.x86\$164
+ AL2023 （手臂）：
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：13.0
  + Kubernetes 版本：1.33.5
  + 内核版本：6.12.46-66.121.amzn2023.aarch64
+ Package 更新包括大量的系统库更新、内核更新和增强库更新。
+ 新增软件包： apr-util-lmdb，kernel-livepatch 更新

------

**注意**  
[runc 版本已升级到 1.3.2 安全公告](https://aws.amazon.com/security/security-bulletins/rss/aws-2025-024/)

## SageMaker HyperPod AMI 在亚马逊 EKS 上发布：2025 年 10 月 29 日
<a name="sagemaker-hyperpod-release-ami-eks-20251029"></a>

**AMI 常规更新**
+ 发布了适用于亚马逊 EKS 的 SageMaker HyperPod AMI 版本 1.28、1.29、1.30、1.31、1.32 和 1.33 的更新。
+ [DLAMI 基本发行说明可在此处获得。](https://docs.aws.amazon.com//dlami/latest/devguide/aws-deep-learning-ami-baseoss-aml2-2025-10-14.html)

**SageMaker HyperPod 适用于 Amazon 的 DLAMI EKS 支持**

此版本包含以下更新：

------
#### [ Kubernetes v1.28 ]
+ **亚马逊 Linux 2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + NVIDIA 驱动程序版本：570.195.03
  + CUDA 版本：12.8
  + Kubernetes 版本：1.28.15
+ AL2023 (x86\$164)：
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：13.0
  + Kubernetes 版本：1.28.15
+ Package 更新包括 boto3、botocore、pip、regex、psutil 和 nvidia 容器工具包组件。
+ 新增软件包：注释文档 0.0.3

------
#### [ Kubernetes v1.29 ]
+ **亚马逊 Linux 2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + NVIDIA 驱动程序版本：570.195.03
  + CUDA 版本：12.8
  + Kubernetes 版本：1.29.15
+ AL2023 (x86\$164)：
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：13.0
  + Kubernetes 版本：1.29.15
+ Package 更新包括内核更新、glibc 更新和各种系统库。
+ 新增软件包：注释文档 0.0.3

------
#### [ Kubernetes v1.30 ]
+ **亚马逊 Linux 2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + NVIDIA 驱动程序版本：570.195.03
  + CUDA 版本：12.8
  + Kubernetes 版本：1.30.11
+ AL2023 (x86\$164)：
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：13.0
  + Kubernetes 版本：1.30.11
+ Package 更新包括内核 livepatch 更新和系统库更新。
+ 新增软件包：注释文档 0.0.3

------
#### [ Kubernetes v1.31 ]
+ **亚马逊 Linux 2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + NVIDIA 驱动程序版本：570.195.03
  + CUDA 版本：12.8
  + Kubernetes 版本：1.31.7
+ AL2023 (x86\$164)：
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：13.0
  + Kubernetes 版本：1.31.13
+ AL2023 （手臂）：
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：13.0
  + Kubernetes 版本：1.31.13
  + 内核版本：6.12.46-66.121.amzn2023.aarch64
+ Package 更新包括大量的系统库更新、内核更新和增强库更新。
+ 添加的软件包： apr-util-lmdb，kernel-livepatch-6.1.156-177.286

------
#### [ Kubernetes v1.32 ]
+ **亚马逊 Linux 2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ AL2 (x86\$164)：
  + NVIDIA 驱动程序版本：570.195.03
  + CUDA 版本：12.8
  + Kubernetes 版本：1.32.3
+ AL2023 (x86\$164)：
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：13.0
  + Kubernetes 版本：1.32.9
+ AL2023 （手臂）：
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：13.0
  + Kubernetes 版本：1.32.9
  + 内核版本：6.12.46-66.121.amzn2023.aarch64
+ Package 更新包括内核 livepatch 更新和系统库更新。
+ 新增软件包：注释文档 0.0.3

------
#### [ Kubernetes v1.33 ]
+ AL2023 (x86\$164)：
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：13.0
  + Kubernetes 版本：1.33.5
  + 内核版本：6.1.155-176.282.amzn2023.x86\$164
+ AL2023 （手臂）：
  + NVIDIA 驱动程序版本：580.95.05
  + CUDA 版本：13.0
  + Kubernetes 版本：1.33.5
  + 内核版本：6.12.46-66.121.amzn2023.aarch64
+ Package 更新包括大量的系统库更新、内核更新和增强库更新。
+ 新增软件包： apr-util-lmdb，kernel-livepatch 更新

------

## SageMaker HyperPod AMI 在亚马逊 EKS 上发布：2025 年 10 月 22 日
<a name="sagemaker-hyperpod-release-ami-eks-20251022"></a>

**AL2x86**

**注意**  
亚马逊 Linux 2 现已弃用。Kubernetes AMI 的基础是。 AL2023

[DLAMI 基本发行说明可在此处获得。](https://docs.aws.amazon.com//dlami/latest/devguide/aws-deep-learning-ami-baseoss-aml2-2025-10-14.html)
+ EKS 版本 1.28-1.32
+ 此版本包含 Nvidia [十月安全公告中针对受影响的 NVIDI](https://nvidia.custhelp.com/app/answers/detail/a_id/5703) A 驱动程序包的 CVE 补丁。
+ NVIDIA SMI

  ```
  NVIDIA-SMI 570.195.03             
  Driver Version: 570.195.03     
  CUDA Version: 12.8
  ```
+ 主要版本  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/sagemaker-hyperpod-release-ami-eks.html)
+ 已添加软件包：此版本中未添加任何软件包。
+ 更新的软件包  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/sagemaker-hyperpod-release-ami-eks.html)
+ 已删除的软件包：此版本中未删除任何软件包。

**AL2023x86**

[DLAMI 基本发行说明可在此处获得。](https://docs.aws.amazon.com//dlami/latest/devguide/aws-deep-learning-ami-gpubaseoss-al2023-2025-10-14.html)
+ EKS 版本 1.28-1.32。EKS 1.33 版本没有发布。
+ 此版本包含 Nvidia [十月安全公告中针对受影响的 NVIDI](https://nvidia.custhelp.com/app/answers/detail/a_id/5703) A 驱动程序包的 CVE 补丁。
+ NVIDIA SMI

  ```
  NVIDIA-SMI 580.95.05             
  Driver Version: 580.95.05  
  CUDA Version: 13.0
  ```
+ 主要版本  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/sagemaker-hyperpod-release-ami-eks.html)
+ 已添加软件包：此版本中未添加任何软件包。
+ 更新的软件包  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/sagemaker-hyperpod-release-ami-eks.html)
+ 已删除的软件包：此版本中未删除任何软件包。

**AL2023 ARM64**

[DLAMI 基本发行说明可在此处获得。](https://docs.aws.amazon.com//dlami/latest/devguide/aws-deep-learning-ami-gpubaseossarm64-al2023-2025-10-14.html)
+ EKS 版本 1.3-1.33。
+ 此版本包含 Nvidia [十月安全公告中针对受影响的 NVIDI](https://nvidia.custhelp.com/app/answers/detail/a_id/5703) A 驱动程序包的 CVE 补丁。
+ NVIDIA SMI

  ```
  NVIDIA-SMI 580.95.05        
  Driver Version: 580.95.05    
  CUDA Version: 13.0
  ```
+ 主要版本  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/sagemaker-hyperpod-release-ami-eks.html)
+ 已添加软件包：此版本中未添加任何软件包。
+ 更新的软件包  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/sagemaker-hyperpod-release-ami-eks.html)
+ 已删除的软件包：此版本中未删除任何软件包。

## SageMaker HyperPod AMI 在亚马逊 EKS 上发布：2025 年 9 月 29 日
<a name="sagemaker-hyperpod-release-ami-eks-20250929"></a>

**AMI 常规更新**
+ 发布了适用于亚马逊 EKS 1.33 的新 SageMaker HyperPod AMI。有关更多信息，请参阅亚马逊 EKS 的 SageMaker HyperPod AMI 版本：2025 年 9 月 29 日。
**重要**  
在此版本中，动态资源分配测试版 Kubernetes API 默认处于启用状态。  
此 API 改进了调度和监控需要资源的工作负载，例如 GPUs。
此 API 是由开源 Kubernetes 社区开发的，在未来的 Kubernetes 版本中可能会发生变化。在使用 API 之前，请查看 [Kubernetes 文档](https://kubernetes.io/docs/concepts/scheduling-eviction/dynamic-resource-allocation/)并了解它如何影响您的工作负载。
HyperPod 没有发布适用于 Kubernetes 1.33 的 HyperPod 亚马逊 Linux 2 AMI。 AWS 建议您迁移到 AL2023。有关更多信息，请参阅[从 Amazon Linux 2 升级到 AL2023](https://docs.aws.amazon.com/eks/latest/userguide/al2023.html)。

有关更多信息，请参阅 [Kubernetes](https://kubernetes.io/blog/2025/04/23/kubernetes-v1-33-release/) v1.33。

**SageMaker HyperPod 适用于 Amazon 的 DLAMI EKS 支持**

此版本包含以下更新：

------
#### [ Kubernetes v1.28 ]
+ **亚马逊 Linux 2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ NVIDIA SMI：
  + NVIDIA 驱动程序版本：570.172.08
  + CUDA 版本：12.8
+ 软件包：
  + 语言和核心库：
    + GCC：11.5.0-5.amzn2023.0.5
    + GCC 14：14.2.1-7.amzn2023.0.1
    + Java：17.0.16\$18-1.amzn2023.1
    + Perl：5.32.1-477.amzn2023.0.7
    + Python：3.9.23-1.amzn2023.0.3
    + Go：3.2.0-37.amzn2023
    + Rust：1.89.0-1.amzn2023.0.2
  + 核心库：
    + GlibC：2.34-196.amzn2023.0.1
    + OpenSSL：3.2.2-1.amzn2023.0.1
    + Zlib：1.2.11-33.amzn2023.0.5
    + XZ Utils：5.2.5-9.amzn2023.0.2
    + util-Linux：2.37.4-1.amzn2023.0.4
  + 神经元：
    + aws-neuronx-dkms: 2.23.9.0-dkms
    + aws-neuronx-tools: 2.25.145.0-1
  + EFA:
    + efa 驱动程序：2.17.2-1.amzn2023
    + efa 配置：1.18-1.amzn2023
    + efa nv peermem：1.2.2-1.amzn2023
    + efa 简介：1.7-1.amzn2023
  + 内核：
    + 内核：6.1.148-173.267.amzn2023
    + 内核开发：6.1.148-173.267.amzn2023
    + 内核标头：6.1.148-173.267.amzn2023
    + 内核工具：6.1.148-173.267.amzn2023
    + 额外内核模块：6.1.148-173.267.amzn2023
    + 内核直播补丁：1.0-0.amzn2023
  + 英伟达：
    + nvidia 容器工具包：1.17.8-1
    + nvidia 容器工具包基础：1.17.8-1
    + libnvidia-container：1.17.8-1（带工具）
    + nvidia Fabric Manager：570.172.08-1
    + libnvidia-nscq：570.172.08-1

------
#### [ Kubernetes v1.29 ]
+ **亚马逊 Linux 2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ NVIDIA SMI：
  + NVIDIA 驱动程序版本：570.172.08
  + CUDA 版本：12.8
+ 软件包：
  + 语言和核心库：
    + GCC：11.5.0-5.amzn2023.0.5
    + GCC 14：14.2.1-7.amzn2023.0.1
    + Java：17.0.16\$18-1.amzn2023.1
    + Perl：5.32.1-477.amzn2023.0.7
    + Python：3.9.23-1.amzn2023.0.3
    + Go：3.2.0-37.amzn2023
    + Rust：1.89.0-1.amzn2023.0.2
  + 核心库：
    + GlibC：2.34-196.amzn2023.0.1
    + OpenSSL：3.2.2-1.amzn2023.0.1
    + Zlib：1.2.11-33.amzn2023.0.5
    + XZ Utils：5.2.5-9.amzn2023.0.2
    + util-Linux：2.37.4-1.amzn2023.0.4
  + 神经元：
    + aws-neuronx-dkms: 2.23.9.0-dkms
    + aws-neuronx-tools: 2.25.145.0-1
  + EFA:
    + efa 驱动程序：2.17.2-1.amzn2023
    + efa 配置：1.18-1.amzn2023
    + efa nv peermem：1.2.2-1.amzn2023
    + efa 简介：1.7-1.amzn2023
  + 内核：
    + 内核：6.1.148-173.267.amzn2023
    + 内核开发：6.1.148-173.267.amzn2023
    + 内核标头：6.1.148-173.267.amzn2023
    + 内核工具：6.1.148-173.267.amzn2023
    + 额外内核模块：6.1.148-173.267.amzn2023
    + 内核直播补丁：1.0-0.amzn2023
  + 英伟达：
    + nvidia 容器工具包：1.17.8-1
    + nvidia 容器工具包基础：1.17.8-1
    + libnvidia-container：1.17.8-1（带工具）
    + nvidia Fabric Manager：570.172.08-1
    + libnvidia-nscq：570.172.08-1

------
#### [ Kubernetes v1.30 ]
+ **亚马逊 Linux 2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ NVIDIA SMI：
  + NVIDIA 驱动程序版本：570.172.08
  + CUDA 版本：12.8
+ 软件包：
  + 语言和核心库：
    + GCC：11.5.0-5.amzn2023.0.5
    + GCC 14：14.2.1-7.amzn2023.0.1
    + Java：17.0.16\$18-1.amzn2023.1
    + Perl：5.32.1-477.amzn2023.0.7
    + Python：3.9.23-1.amzn2023.0.3
    + Go：3.2.0-37.amzn2023
    + Rust：1.89.0-1.amzn2023.0.2
  + 核心库：
    + GlibC：2.34-196.amzn2023.0.1
    + OpenSSL：3.2.2-1.amzn2023.0.1
    + Zlib：1.2.11-33.amzn2023.0.5
    + XZ Utils：5.2.5-9.amzn2023.0.2
    + util-Linux：2.37.4-1.amzn2023.0.4
  + 神经元：
    + aws-neuronx-dkms: 2.23.9.0-dkms
    + aws-neuronx-tools: 2.25.145.0-1
  + EFA:
    + efa 驱动程序：2.17.2-1.amzn2023
    + efa 配置：1.18-1.amzn2023
    + efa nv peermem：1.2.2-1.amzn2023
    + efa 简介：1.7-1.amzn2023
  + 内核：
    + 内核：6.1.148-173.267.amzn2023
    + 内核开发：6.1.148-173.267.amzn2023
    + 内核标头：6.1.148-173.267.amzn2023
    + 内核工具：6.1.148-173.267.amzn2023
    + 额外内核模块：6.1.148-173.267.amzn2023
    + 内核直播补丁：1.0-0.amzn2023
  + 英伟达：
    + nvidia 容器工具包：1.17.8-1
    + nvidia 容器工具包基础：1.17.8-1
    + libnvidia-container：1.17.8-1（带工具）
    + nvidia Fabric Manager：570.172.08-1
    + libnvidia-nscq：570.172.08-1

------
#### [ Kubernetes v1.31 ]
+ **亚马逊 Linux 2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ NVIDIA SMI：
  + NVIDIA 驱动程序版本：570.172.08
  + CUDA 版本：12.8
+ 软件包：
  + 语言和核心库：
    + GCC：11.5.0-5.amzn2023.0.5
    + GCC 14：14.2.1-7.amzn2023.0.1
    + Java：17.0.16\$18-1.amzn2023.1
    + Perl：5.32.1-477.amzn2023.0.7
    + Python：3.9.23-1.amzn2023.0.3
    + Go：3.2.0-37.amzn2023
    + Rust：1.89.0-1.amzn2023.0.2
  + 核心库：
    + GlibC：2.34-196.amzn2023.0.1
    + OpenSSL：3.2.2-1.amzn2023.0.1
    + Zlib：1.2.11-33.amzn2023.0.5
    + XZ Utils：5.2.5-9.amzn2023.0.2
    + util-Linux：2.37.4-1.amzn2023.0.4
  + 神经元：
    + aws-neuronx-dkms: 2.23.9.0-dkms
    + aws-neuronx-tools: 2.25.145.0-1
  + EFA:
    + efa 驱动程序：2.17.2-1.amzn2023
    + efa 配置：1.18-1.amzn2023
    + efa nv peermem：1.2.2-1.amzn2023
    + efa 简介：1.7-1.amzn2023
  + 内核：
    + 内核：6.1.148-173.267.amzn2023
    + 内核开发：6.1.148-173.267.amzn2023
    + 内核标头：6.1.148-173.267.amzn2023
    + 内核工具：6.1.148-173.267.amzn2023
    + 额外内核模块：6.1.148-173.267.amzn2023
    + 内核直播补丁：1.0-0.amzn2023
  + 英伟达：
    + nvidia 容器工具包：1.17.8-1
    + nvidia 容器工具包基础：1.17.8-1
    + libnvidia-container：1.17.8-1（带工具）
    + nvidia Fabric Manager：570.172.08-1
    + libnvidia-nscq：570.172.08-1

------
#### [ Kubernetes v1.32 ]
+ **亚马逊 Linux 2 现已弃用。Kubernetes AMI 的基础是。 AL2023**
+ NVIDIA SMI：
  + NVIDIA 驱动程序版本：570.172.08
  + CUDA 版本：12.8
+ 软件包：
  + 语言和核心库：
    + GCC：11.5.0-5.amzn2023.0.5
    + GCC 14：14.2.1-7.amzn2023.0.1
    + Java：17.0.16\$18-1.amzn2023.1
    + Perl：5.32.1-477.amzn2023.0.7
    + Python：3.9.23-1.amzn2023.0.3
    + Go：3.2.0-37.amzn2023
    + Rust：1.89.0-1.amzn2023.0.2
  + 核心库：
    + GlibC：2.34-196.amzn2023.0.1
    + OpenSSL：3.2.2-1.amzn2023.0.1
    + Zlib：1.2.11-33.amzn2023.0.5
    + XZ Utils：5.2.5-9.amzn2023.0.2
    + util-Linux：2.37.4-1.amzn2023.0.4
  + 神经元：
    + aws-neuronx-dkms: 2.23.9.0-dkms
    + aws-neuronx-tools: 2.25.145.0-1
  + EFA:
    + efa 驱动程序：2.17.2-1.amzn2023
    + efa 配置：1.18-1.amzn2023
    + efa nv peermem：1.2.2-1.amzn2023
    + efa 简介：1.7-1.amzn2023
  + 内核：
    + 内核：6.1.148-173.267.amzn2023
    + 内核开发：6.1.148-173.267.amzn2023
    + 内核标头：6.1.148-173.267.amzn2023
    + 内核工具：6.1.148-173.267.amzn2023
    + 额外内核模块：6.1.148-173.267.amzn2023
    + 内核直播补丁：1.0-0.amzn2023
  + 英伟达：
    + nvidia 容器工具包：1.17.8-1
    + nvidia 容器工具包基础：1.17.8-1
    + libnvidia-container：1.17.8-1（带工具）
    + nvidia Fabric Manager：570.172.08-1
    + libnvidia-nscq：570.172.08-1

------
#### [ Kubernetes v1.33 ]

下表包含有关此 AMI 版本中的组件和相应版本的信息。


| 组件 | AL2023\$1x86 | AL2023\$1arm64 | 
| --- | --- | --- | 
| EKS | v1.33.4 | v1.33.4 | 
| amazon-ssm-agent | 3.3.2299.0-1.amzn2023 | 3.3.2299.0-1.amzn2023 | 
| aws-neuronx-dkms | 2.23.9.0-dkms | 不适用 | 
| containerd | 1.7.27-1.eks.amzn2023.0.4 | 1.7.27-1.eks.amzn2023.0.4 | 
| efa | 2.17.2-1.amzn2023 | 2.17.2-1.amzn2023 | 
| ena | 2.14.1g | 2.14.1g | 
| kernel | 6.12.40-64.114.114.amzn2023 | 不适用 | 
| kernel6.12 | 不适用 | 6.12.40-64.114.114.amzn2023 | 
| kmod-nvidia-latest-dkms | 570.172.08-1.amzn2023 | 570.172.08-1.el9 | 
| nvidia-container-toolkit | 1.17.8-1 | 1.17.8-1 | 
| runc | 1.2.6-1.amzn2023.0.1 | 1.2.6-1.amzn2023.0.1 | 

------

## SageMaker HyperPod AMI 在亚马逊 EKS 上发布：2025 年 8 月 25 日
<a name="sagemaker-hyperpod-release-ami-eks-20250825"></a>

**SageMaker HyperPod 适用于 Amazon 的 DLAMI EKS 支持**

此版本包含以下更新：

------
#### [ Kubernetes v1.28 ]

**NVIDIA SMI：**
+ Nvidia 驱动程序版本：570.172.08
+ CUDA 版本：12.8

**已添加的软件包：**
+ kernel-livepatch-5.10.240-238.955.x86\$164 1.0-0.amzn2 amzn2extra-kernel-5.10

**更新后的软件包：**
+ gdk-pixbuf2.x86\$164：2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2
+ kernel.x86\$164：5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2
+ kernel-devel.x86\$164：5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2
+ kernel-headers.x86\$164：5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2
+ kernel-tools.x86\$164：5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2
+ libgs.x86\$164：9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12
+ microcode\$1ctl.x86\$164：2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25
+ pam.x86\$164：1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

**已移除的软件包：**
+ kernel-livepatch-5.10.239-236.958.x86\$164 1.0-0.amzn2 amzn2extra-kernel-5.10

**存储库已更改：**
+ libnvidia-container-tools.x86\$164：cuda-rhel8-x86\$164 → nvidia-container-toolkit
+ libnvidia-container1.x86\$164：cuda-rhel8-x86\$164 → nvidia-container-toolkit
+ nvidia-container-toolkit.x86\$164：cuda-rhel8-x86\$164 → nvidia-container-toolkit
+ nvidia-container-toolkit-base.x86\$164：cuda-rhel8-x86\$164 → nvidia-container-toolkit

------
#### [ Kubernetes v1.29 ]

**NVIDIA SMI：**
+ Nvidia 驱动程序版本：570.172.08
+ CUDA 版本：12.8

**已添加的软件包：**
+ kernel-livepatch-5.10.240-238.955.x86\$164 1.0-0.amzn2 amzn2extra-kernel-5.10

**更新后的软件包：**
+ gdk-pixbuf2.x86\$164：2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2
+ kernel.x86\$164：5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2
+ kernel-devel.x86\$164：5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2
+ kernel-headers.x86\$164：5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2
+ kernel-tools.x86\$164：5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2
+ libgs.x86\$164：9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12
+ microcode\$1ctl.x86\$164：2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25
+ pam.x86\$164：1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

**已移除的软件包：**
+ kernel-livepatch-5.10.239-236.958.x86\$164 1.0-0.amzn2 amzn2extra-kernel-5.10

**存储库已更改：**
+ libnvidia-container-tools.x86\$164：cuda-rhel8-x86\$164 → nvidia-container-toolkit
+ libnvidia-container1.x86\$164：cuda-rhel8-x86\$164 → nvidia-container-toolkit
+ nvidia-container-toolkit.x86\$164：cuda-rhel8-x86\$164 → nvidia-container-toolkit
+ nvidia-container-toolkit-base.x86\$164：cuda-rhel8-x86\$164 → nvidia-container-toolkit

------
#### [ Kubernetes v1.30 ]

**NVIDIA SMI：**
+ Nvidia 驱动程序版本：570.172.08
+ CUDA 版本：12.8

**已添加的软件包：**
+ kernel-livepatch-5.10.240-238.955.x86\$164 1.0-0.amzn2 amzn2extra-kernel-5.10

**更新后的软件包：**
+ aws-neuronx-dkms.noarch：2.22.0-dkms → 2.23.9.0-dkms
+ efa.x86\$164：2.15.3-1.amzn2 → 2.17.2-1.amzn2
+ efa-nv-peermem.x86\$164：1.2.1-1.amzn2 → 1.2.2-1.amzn2
+ gdk-pixbuf2.x86\$164：2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2
+ ibacm.x86\$164：57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2
+ infiniband-diags.x86\$164：57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2
+ kernel.x86\$164：5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2
+ kernel-devel.x86\$164：5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2
+ kernel-headers.x86\$164：5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2
+ kernel-tools.x86\$164：5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2
+ libfabric-aws.x86\$164：2.1.0amzn3.0-1.amzn2 → 2.1.0amzn5.0-1.amzn2
+ libfabric-aws-devel.x86\$164：2.1.0amzn3.0-1.amzn2 → 2.1.0amzn5.0-1.amzn2
+ libgs.x86\$164：9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12
+ libibumad.x86\$164：57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2
+ libibverbs.x86\$164：57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2
+ libibverbs-core.x86\$164：57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2
+ libibverbs-utils.x86\$164：57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2
+ libnccl-ofi.x86\$164：1.15.0-1.amzn2 → 1.16.2-1.amzn2
+ librdmacm.x86\$164：57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2
+ librdmacm-utils.x86\$164：57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2
+ microcode\$1ctl.x86\$164：2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25
+ pam.x86\$164：1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4
+ rdma-core.x86\$164：57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2
+ rdma-core-devel.x86\$164：57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

**已移除的软件包：**
+ kernel-livepatch-5.10.239-236.958.x86\$164 1.0-0.amzn2 amzn2extra-kernel-5.10

**存储库已更改：**
+ libnvidia-container-tools.x86\$164：cuda-rhel8-x86\$164 → nvidia-container-toolkit
+ libnvidia-container1.x86\$164：cuda-rhel8-x86\$164 → nvidia-container-toolkit
+ nvidia-container-toolkit.x86\$164：cuda-rhel8-x86\$164 → nvidia-container-toolkit
+ nvidia-container-toolkit-base.x86\$164：cuda-rhel8-x86\$164 → nvidia-container-toolkit

------
#### [ Kubernetes v1.31 ]

**NVIDIA SMI：**
+ Nvidia 驱动程序版本：570.172.08
+ CUDA 版本：12.8

**已添加的软件包：**
+ kernel-livepatch-5.10.240-238.955.x86\$164 1.0-0.amzn2 amzn2extra-kernel-5.10

**更新后的软件包：**
+ gdk-pixbuf2.x86\$164：2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2
+ kernel.x86\$164：5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2
+ kernel-devel.x86\$164：5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2
+ kernel-headers.x86\$164：5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2
+ kernel-tools.x86\$164：5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2
+ libgs.x86\$164：9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12
+ microcode\$1ctl.x86\$164：2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25
+ pam.x86\$164：1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

**已移除的软件包：**
+ kernel-livepatch-5.10.239-236.958.x86\$164 1.0-0.amzn2 amzn2extra-kernel-5.10

**存储库已更改：**
+ libnvidia-container-tools.x86\$164：cuda-rhel8-x86\$164 → nvidia-container-toolkit
+ libnvidia-container1.x86\$164：cuda-rhel8-x86\$164 → nvidia-container-toolkit
+ nvidia-container-toolkit.x86\$164：cuda-rhel8-x86\$164 → nvidia-container-toolkit
+ nvidia-container-toolkit-base.x86\$164：cuda-rhel8-x86\$164 → nvidia-container-toolkit

------
#### [ Kubernetes v1.32 ]

**NVIDIA SMI：**
+ Nvidia 驱动程序版本：570.172.08
+ CUDA 版本：12.8

**已添加的软件包：**
+ kernel-livepatch-5.10.240-238.955.x86\$164 1.0-0.amzn2 amzn2extra-kernel-5.10

**更新后的软件包：**
+ aws-neuronx-dkms.noarch：2.22.0-dkms → 2.23.9.0-dkms
+ efa.x86\$164：2.15.3-1.amzn2 → 2.17.2-1.amzn2
+ efa-nv-peermem.x86\$164：1.2.1-1.amzn2 → 1.2.2-1.amzn2
+ gdk-pixbuf2.x86\$164：2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2
+ ibacm.x86\$164：57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2
+ infiniband-diags.x86\$164：57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2
+ kernel.x86\$164：5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2
+ kernel-devel.x86\$164：5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2
+ kernel-headers.x86\$164：5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2
+ kernel-tools.x86\$164：5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2
+ libfabric-aws.x86\$164：2.1.0amzn3.0-1.amzn2 → 2.1.0amzn5.0-1.amzn2
+ libfabric-aws-devel.x86\$164：2.1.0amzn3.0-1.amzn2 → 2.1.0amzn5.0-1.amzn2
+ libgs.x86\$164：9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12
+ libibumad.x86\$164：57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2
+ libibverbs.x86\$164：57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2
+ libibverbs-core.x86\$164：57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2
+ libibverbs-utils.x86\$164：57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2
+ libnccl-ofi.x86\$164：1.15.0-1.amzn2 → 1.16.2-1.amzn2
+ librdmacm.x86\$164：57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2
+ librdmacm-utils.x86\$164：57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2
+ microcode\$1ctl.x86\$164：2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25
+ pam.x86\$164：1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4
+ rdma-core.x86\$164：57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2
+ rdma-core-devel.x86\$164：57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

**已移除的软件包：**
+ kernel-livepatch-5.10.239-236.958.x86\$164 1.0-0.amzn2 amzn2extra-kernel-5.10

**存储库已更改：**
+ libnvidia-container-tools.x86\$164：cuda-rhel8-x86\$164 → nvidia-container-toolkit
+ libnvidia-container1.x86\$164：cuda-rhel8-x86\$164 → nvidia-container-toolkit
+ nvidia-container-toolkit.x86\$164：cuda-rhel8-x86\$164 → nvidia-container-toolkit
+ nvidia-container-toolkit-base.x86\$164：cuda-rhel8-x86\$164 → nvidia-container-toolkit

------

## SageMaker HyperPod AMI 在亚马逊 EKS 上发布：2025 年 8 月 12 日
<a name="sagemaker-hyperpod-release-ami-eks-20250812"></a>

**AMI 包括以下内容：**
+ 支持的 AWS 服务：亚马逊 EC2
+ 操作系统：亚马逊 Linux 2023
+ 计算架构： ARM64
+ 已为以下软件包安装了最新的可用版本：
  + Linux 内核：6.12
  + FSx Lustre
  + Docker
  + AWS CLI v2 在 `/usr/bin/aws`
  + NVIDIA DCGM
  + Nvidia Container Toolkit：
    + 版本命令：`nvidia-container-cli -V`
  + Nvidia-docker2：
    + 版本命令：`nvidia-docker version`
  + nvidia-imex：v570.172.08-1
+ NVIDIA 驱动程序：570.158.01
+ NVIDIA CUDA 12.4、12.5、12.6、12.8 堆栈：
  + CUDA、NCCL 和 cudDN 安装目录：`/usr/local/cuda-xx.x/`
    + 示例：`/usr/local/cuda-12.8/`、`/usr/local/cuda-12.8/`
  + 已编译的 NCCL 版本：
    + 对于 12.4 的 CUDA 目录，编译了 NCCL 版本 2.22.3\$1 .4 CUDA12
    + 对于 12.5 的 CUDA 目录，编译了 NCCL 版本 2.22.3\$1 .5 CUDA12
    + 对于 12.6 的 CUDA 目录，编译了 NCCL 版本 2.24.3\$1 .6 CUDA12
    + 对于 12.8 的 CUDA 目录，编译了 NCCL 版本 2.27.5\$1 .8 CUDA12
  + 默认 CUDA：12.8
    + PATH `/usr/local/cuda` 指向 CUDA 12.8
    + 更新以下环境变量：
      + `LD_LIBRARY_PATH`拥有 `/usr/local/cuda-12.8/lib:/usr/local/cuda-12.8/lib64:/usr/local/cuda-12.8:/usr/local/cuda-12.8/targets/sbsa-linux/lib:/usr/local/cuda-12.8/nvvm/lib64:/usr/local/cuda-12.8/extras/CUPTI/lib64`
      + `PATH`拥有 `/usr/local/cuda-12.8/bin/:/usr/local/cuda-12.8/include/`
      + 对于任何不同的 CUDA 版本，请`LD_LIBRARY_PATH`相应更新。
+ EFA 安装程序：1.42.0
+ 英伟达 GDRCopy：2.5.1
+ AWS OFI NCCL 插件附带 EFA 安装程序
  + 路径`/opt/amazon/ofi-nccl/lib`和`/opt/amazon/ofi-nccl/efa`已添加到`LD_LIBRARY_PATH`。
+ AWS CLI v2 在 `/usr/local/bin/aws`
+ EBS 卷类型：gp3
+ Python：`/usr/bin/python3.9`

## SageMaker HyperPod AMI 在亚马逊 EKS 上发布：2025 年 8 月 6 日
<a name="sagemaker-hyperpod-release-ami-eks-20250806"></a>

**SageMaker HyperPod 适用于 Amazon 的 DLAMI EKS 支持**

 AMIs 包括以下更新：

------
#### [ K8s v1.28 ]
+ **Neuron 软件包：**
  + **aws-neuronx-collectives: 2.27.34.0\$1ec8cd** 5e8b-1
  + **aws-neuronx-dkms: 2.23.9.** 0-dkms
  + **aws-neuronx-runtime-lib: 2.27.23.0\$18d** eec4dbf-1
  + **aws-neuronx-k8 个插件：2.27.7.0** -1
  + **aws-neuronx-k8 调度程序：2.27.7.0** -1
  + **aws-neuronx-tools: 2.25.145.** 0-1

------
#### [ K8s v1.29 ]
+ **Neuron 软件包：**
  + **aws-neuronx-collectives: 2.27.34.0\$1ec8cd** 5e8b-1
  + **aws-neuronx-dkms: 2.23.9.** 0-dkms
  + **aws-neuronx-runtime-lib: 2.27.23.0\$18d** eec4dbf-1
  + **aws-neuronx-k8 个插件：2.27.7.0** -1
  + **aws-neuronx-k8 调度程序：2.27.7.0** -1
  + **aws-neuronx-tools: 2.25.145.** 0-1

------
#### [ K8s v1.30 ]
+ **Neuron 软件包：**
  + **aws-neuronx-collectives: 2.27.34.0\$1ec8cd** 5e8b-1
  + **aws-neuronx-dkms: 2.23.9.** 0-dkms
  + **aws-neuronx-runtime-lib: 2.27.23.0\$18d** eec4dbf-1
  + **aws-neuronx-k8 个插件：2.27.7.0** -1
  + **aws-neuronx-k8 调度程序：2.27.7.0** -1
  + **aws-neuronx-tools: 2.25.145.** 0-1

------
#### [ K8s v1.31 ]
+ **Neuron 软件包：**
  + **aws-neuronx-collectives: 2.27.34.0\$1ec8cd** 5e8b-1
  + **aws-neuronx-dkms: 2.23.9.** 0-dkms
  + **aws-neuronx-runtime-lib: 2.27.23.0\$18d** eec4dbf-1
  + **aws-neuronx-k8 个插件：2.27.7.0** -1
  + **aws-neuronx-k8 调度程序：2.27.7.0** -1
  + **aws-neuronx-tools: 2.25.145.** 0-1

------
#### [ K8s v1.32 ]
+ **Neuron 软件包：**
  + **aws-neuronx-collectives: 2.27.34.0\$1ec8cd** 5e8b-1
  + **aws-neuronx-dkms: 2.23.9.** 0-dkms
  + **aws-neuronx-runtime-lib: 2.27.23.0\$18d** eec4dbf-1
  + **aws-neuronx-k8 个插件：2.27.7.0** -1
  + **aws-neuronx-k8 调度程序：2.27.7.0** -1
  + **aws-neuronx-tools: 2.25.145.** 0-1

------

**重要**  
Deep Learning Base OSS Nvidia Driver AMI（Amazon Linux 2）版本 70.3
深度学习基础版专有 Nvidia 驱动程序 AMI（Amazon Linux 2）版本 68.4
最新的 CUDA 12.8 支持
已将 Nvidia 驱动程序从 570.158.01 升级到 570.172.08 以修复 Nvidia 7 月版安全公告中提及的 CVE

## SageMaker HyperPod AMI 在亚马逊 EKS 上发布：2025 年 7 月 31 日
<a name="sagemaker-hyperpod-release-ami-eks-20250731"></a>

亚马逊 SageMaker HyperPod 现在支持适用于亚马逊 EKS 集群的新 AMI，该集群可将基本操作系统更新到亚马逊 Linux 2023。此版本对 Amazon Linux 2 (AL2) 进行了多项改进。 HyperPod AMIs 定期发布新版本，我们建议您在最新、最安全的版本上运行所有 HyperPod 集群， AMIs 以解决漏洞并逐步淘汰过时的软件和库。

### 关键升级
<a name="sagemaker-hyperpod-release-ami-eks-20250731-specs"></a>
+ **操作系统**：亚马逊 Linux 2023（从亚马逊 Linux 2 更新，或者 AL2）
+ P@@ **ackage Manager**：DNF 是默认的包管理工具，取代了中使用的 YUM AL2
+ **网络服务**：`systemd-networkd`管理网络接口，取代中`dhclient`使用的 ISC AL2
+ **Linux 内核**：版本 6.1，根据中使用的内核进行了更新 AL2
+ **Glibc**：版本 2.34，已从中的版本更新 AL2
+ **GCC**：版本 11.5.0，已从中的版本更新 AL2
+ **NFS**：版本 1:2.6 .1，从 1:1.3 .4 版本更新 AL2
+ **NVIDIA 驱动程序**：版本 570.172.08，该驱动程序的更新版本
+ **Python**：版本 3.9，取代了中使用的 Python 2.7 AL2
+ **NVME**：版本 1.11.1，驱动程序的更新版本 NVMe 

### 升级之前
<a name="sagemaker-hyperpod-release-ami-eks-20250731-prereqs"></a>

在升级前，您需要了解几个重要事项。与相比 AL2023，已添加、升级或删除了多个软件包 AL2。我们强烈建议您在升级集群 AL2023 之前使用测试应用程序。有关中所有软件包变更的完整列表 AL2023，请参阅 [Amazon Linux 2023 中的软件包变更](https://docs.aws.amazon.com/linux/al2023/release-notes/compare-packages.html)。

以下是 AL2 和之间的一些重大变化 AL2023：
+ **Python 3.10**：除操作系统外，最重大的更新是 Python 版本升级。升级后，集群默认使用 Python 3.10。虽然某些 Python 3.8 分布式训练工作负载可能与 Python 3.10 兼容，但我们强烈建议您单独测试特定的工作负载。如果迁移到 Python 3.10 确实存在困难，但您仍希望升级集群以获取其他新功能，则您可以在运行任何工作负载之前，结合使用 `yum install python-xx.x` 命令与[生命周期脚本](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod-lifecycle-best-practices-slurm.html)来安装旧版本的 Python。请务必测试现有生命周期脚本与应用程序代码的兼容性。
+ **NVIDIA 运行时强制执行**： AL2023严格执行 NVIDIA 容器运行时要求，导致带有硬编码 NVIDIA 环境变量（例如`NVIDIA_VISIBLE_DEVICES: "all"`）的容器在仅限 CPU 的节点上出现故障（而在没有 GPU 驱动程序时会 AL2 忽略这些设置）。您可以通过在容器组（pod）规范中设置 `NVIDIA_VISIBLE_DEVICES: "void"` 或使用仅含 CPU 的映像来覆盖强制执行。
+ **cgroup v2**： AL2023 具有下一代统一控制组层次结构（cgroup v2）。cgroup v2 用于容器运行时，也由使用。`systemd`虽然 AL2023 仍然包含可以让系统使用 cgroup v1 运行的代码，但这不是推荐的配置。
+ **亚马逊 VPC CNI 和`eksctl`版本**： AL2023 还要求您的亚马逊 VPC CNI 版本为 1.16.2 或更高版本，您的`eksctl`版本必须为 0.176.0 或更高版本。
+ 启用 **EFA for Lustre**：您现在可以在 Lustre 上 FSx 使用 EFA，这使您能够实现与本地 AI/ML 或 HPC（高性能计算）集群相当的应用程序性能，同时受益于云计算的可扩展性、灵活性和弹性。 FSx 

此外，升级到 AL2023 需要最低版本的 Health Mon `1.0.643.0_1.0.192.0` itoring Agent。完成以下过程可更新运行状况监控代理：

1. 如果您使用 GitHub存储库中的 HyperPod 生命周期脚本 [awsome-distributed-training](https://github.com/aws-samples/awsome-distributed-training))，请确保提取最新版本。早期版本与不兼容 AL2023。新的生命周期脚本可确保`containerd`使用额外挂载的存储空间来提取容器映像 AL2023。

1. 获取最新版本的 [HyperPod CLI git 存储库](https://github.com/aws/sagemaker-hyperpod-cli/tree/main)。

1. 使用以下命令更新依赖项：`helm dependencies update helm_chart/HyperPodHelmChart`

1. 如[自述文件](https://github.com/aws/sagemaker-hyperpod-cli/tree/main/helm_chart#step-four-whenever-you-want-to-upgrade-the-installation-of-helm-charts)中的步骤 4 所述 HyperPodHelmChart，运行以下命令以升级集群上运行的依赖项版本：`helm upgrade dependencies helm_chart/HyperPodHelmChart -namespace kube-system`

### 已在升级后的 EKS 集群上完成测试的工作负载
<a name="sagemaker-hyperpod-release-ami-eks-20250731-tested"></a>

以下是已针对此次升级完成测试的部分使用案例：
+ **向后兼容**：涉及的热门分布式训练作业 PyTorch 应在新的 AMI 上向后兼容。然而，由于您的工作负载可能依赖特定的 Python 或 Linux 库，我们建议您先在小型节点或部分节点上进行测试，然后再升级大型集群。
+ **加速器测试**：已经测试了使用 NVIDIA 加速器（用于 P 和 G 实例系列）和 Ne AWS uron 加速器（用于 Trn 实例）的不同实例类型的作业。

### 如何升级 AMI 及关联的工作负载
<a name="sagemaker-hyperpod-release-ami-eks-20250731-upgrade"></a>

您可以使用下列方法之一来升级到新 AMI：
+ 使用 [create-cluster](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html) API 以使用最新 AMI 创建新集群。
+ 使用 [update-cluster-software](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateClusterSoftware.html)API 升级您的现有集群。请注意，此选项会重新运行所有生命周期脚本。

在更新过程中，集群将不可用。我们建议为此次停机时间做好规划，并在升级完成后，从现有检查点重新启动训练工作负载。作为最佳实践，我们建议您先在小型集群上执行测试，然后再升级大型集群。

如果更新命令失败，请先确定失败原因。对于生命周期脚本失败，请对脚本进行必要的更正并重试。对于任何其他无法解决的问题，请联系 [AWS 支持](https://aws.amazon.com/premiumsupport/)。

### 问题排查
<a name="sagemaker-hyperpod-release-ami-eks-20250731-troubleshooting"></a>

使用以下部分来帮助解决您在升级到时遇到的任何问题 AL2023。

**如何修复仅含 CPU 的集群节点上出现的诸如 `"nvml error: driver not loaded: unknown"` 之类的错误？**

如果在 CPU AL2 Amazon EKS 节点上运行的容器现在出现故障 AL2023，则您的容器映像可能包含硬编码的 NVIDIA 环境变量。可使用以下命令检查硬编码的环境变量：

```
docker inspect image:tag | grep -i nvidia
```

AL2023 严格执行这些要求，而对仅限 AL2 CPU 的节点则更为宽松。一种解决方案是通过在 Amazon EKS Pod 规范中设置某些 NVIDIA 环境变量来覆盖 AL2023 强制执行，如以下示例所示：

```
yaml
containers:
- name: your-container
image: your-image:tag
env:
- name: NVIDIA_VISIBLE_DEVICES
value: "void"
- name: NVIDIA_DRIVER_CAPABILITIES
value: ""
```

另一种替代方案是使用仅含 CPU 的容器映像（例如 `pytorch/pytorch:latest-cpu`），或构建不包含 NVIDIA 依赖项的自定义映像。

## SageMaker HyperPod AMI 在亚马逊 EKS 上发布：2025 年 7 月 15 日
<a name="sagemaker-hyperpod-release-ami-eks-20250715"></a>

**SageMaker HyperPod 适用于 Amazon 的 DLAMI EKS 支持**

 AMIs 包括以下更新：

------
#### [ K8s v1.28 ]
+ **最新的 NVIDIA 驱动程序：**550.163.01
+ **默认 CUDA：**12.4
+ **EFA 安装程序：**1.38.0
+ **Neuron 软件包：**
  + **aws-neuronx-dkms.noarch**：2.22.2.0-dkms
  + **aws-neuronx-oci-hook.x86\$164**：2.4.0-1
  + **aws-neuronx-tools.x86** \$164：2.18.3.0-1
  + **aws-neuron-dkms.noarch**：2.3.26.0-dkms
  + **aws-neuron-k8-plugin.x86\$164**：1.9.3.0-1
  + aws-neuron-k8-s@@ **cheduler.x86\$164**：1.9.3.0-1
  + **aws-neuron-runtime.x86** \$164：1.6.24.0-1
  + **aws-neuron-runtime-base.x86** \$164：1.6.21.0-1
  + **aws-neuron-tools.x86\$164**：2.1.4.0-1
  + **aws-neuronx-collectives.x86\$164：2.26.** 43.0\$147cc904ea-1
  + **aws-neuronx-gpsimd-customop.x86\$164**：0.2.3.0-1
  + **aws-neuronx-gpsimd-customop-lib.x86\$164：0.16.2.0** -1
  + **aws-neuronx-gpsimd-tools.x86\$164：0.16.1.0\$10a6506a47-1**
  + **aws-neuronx-k8-plugin.x86\$164**：2.26.26.0-1
  + aws-neuronx-k8-s@@ **cheduler.x86\$164**：2.26.26.0-1
  + **aws-neuronx-runtime-lib.x86\$164：2.26.** 42.0\$12ff3b5c7d-1
  + **aws-neuronx-tools.x86** \$164：2.24.54.0-1
  + **tensorflow-model-server-neuron.x86** \$164：2.8.0.2.3.0.0-0
  + **tensorflow-model-server-neuronx.x86\$164：2.10.1.2.12.2.** 0-0

------
#### [ K8s v1.29 ]
+ **Nvidia 驱动程序版本：**550.163.01
+ **CUDA 版本：**12.4
+ **EFA 安装程序：**1.38.0
+ **Neuron 软件包：**
  + **aws-neuronx-dkms.noarch**：2.22.2.0-dkms
  + **aws-neuronx-oci-hook.x86\$164**：2.4.0-1
  + **aws-neuronx-tools.x86** \$164：2.18.3.0-1
  + **aws-neuron-dkms.noarch**：2.3.26.0-dkms
  + **aws-neuron-k8-plugin.x86\$164**：1.9.3.0-1
  + aws-neuron-k8-s@@ **cheduler.x86\$164**：1.9.3.0-1
  + **aws-neuron-runtime.x86** \$164：1.6.24.0-1
  + **aws-neuron-runtime-base.x86** \$164：1.6.21.0-1
  + **aws-neuron-tools.x86\$164**：2.1.4.0-1
  + **aws-neuronx-collectives.x86\$164：2.26.** 43.0\$147cc904ea-1
  + **aws-neuronx-gpsimd-customop.x86\$164**：0.2.3.0-1
  + **aws-neuronx-gpsimd-customop-lib.x86\$164：0.16.2.0** -1
  + **aws-neuronx-gpsimd-tools.x86\$164：0.16.1.0\$10a6506a47-1**
  + **aws-neuronx-k8-plugin.x86\$164**：2.26.26.0-1
  + aws-neuronx-k8-s@@ **cheduler.x86\$164**：2.26.26.0-1
  + **aws-neuronx-runtime-lib.x86\$164：2.26.** 42.0\$12ff3b5c7d-1
  + **aws-neuronx-tools.x86** \$164：2.24.54.0-1
  + **tensorflow-model-server-neuron.x86** \$164：2.8.0.2.3.0.0-0
  + **tensorflow-model-server-neuronx.x86\$164：2.10.1.2.12.2.** 0-0

------
#### [ K8s v1.30 ]
+ **Nvidia 驱动程序版本：**550.163.01
+ **CUDA 版本：**12.4
+ **EFA 安装程序版本：**1.38.0
+ **Neuron 软件包：**
  + **aws-neuronx-dkms.noarch**：2.22.2.0-dkms
  + **aws-neuronx-oci-hook.x86\$164**：2.4.0-1
  + **aws-neuronx-tools.x86** \$164：2.18.3.0-1
  + **aws-neuron-dkms.noarch**：2.3.26.0-dkms
  + **aws-neuron-k8-plugin.x86\$164**：1.9.3.0-1
  + aws-neuron-k8-s@@ **cheduler.x86\$164**：1.9.3.0-1
  + **aws-neuron-runtime.x86** \$164：1.6.24.0-1
  + **aws-neuron-runtime-base.x86** \$164：1.6.21.0-1
  + **aws-neuron-tools.x86\$164**：2.1.4.0-1
  + **aws-neuronx-collectives.x86\$164：2.26.** 43.0\$147cc904ea-1
  + **aws-neuronx-gpsimd-customop.x86\$164**：0.2.3.0-1
  + **aws-neuronx-gpsimd-customop-lib.x86\$164：0.16.2.0** -1
  + **aws-neuronx-gpsimd-tools.x86\$164：0.16.1.0\$10a6506a47-1**
  + **aws-neuronx-k8-plugin.x86\$164**：2.26.26.0-1
  + aws-neuronx-k8-s@@ **cheduler.x86\$164**：2.26.26.0-1
  + **aws-neuronx-runtime-lib.x86\$164：2.26.** 42.0\$12ff3b5c7d-1
  + **aws-neuronx-tools.x86** \$164：2.24.54.0-1
  + **tensorflow-model-server-neuron.x86** \$164：2.8.0.2.3.0.0-0
  + **tensorflow-model-server-neuronx.x86\$164：2.10.1.2.12.2.** 0-0

------
#### [ K8s v1.31 ]
+ **Nvidia 驱动程序版本：**550.163.01
+ **CUDA 版本：**12.4
+ **EFA 安装程序版本：**1.38.0
+ **Neuron 软件包：**
  + **aws-neuronx-dkms.noarch**：2.22.2.0-dkms
  + **aws-neuronx-oci-hook.x86\$164**：2.4.0-1
  + **aws-neuronx-tools.x86** \$164：2.18.3.0-1
  + **aws-neuron-dkms.noarch**：2.3.26.0-dkms
  + **aws-neuron-k8-plugin.x86\$164**：1.9.3.0-1
  + aws-neuron-k8-s@@ **cheduler.x86\$164**：1.9.3.0-1
  + **aws-neuron-runtime.x86** \$164：1.6.24.0-1
  + **aws-neuron-runtime-base.x86** \$164：1.6.21.0-1
  + **aws-neuron-tools.x86\$164**：2.1.4.0-1
  + **aws-neuronx-collectives.x86\$164：2.26.** 43.0\$147cc904ea-1
  + **aws-neuronx-gpsimd-customop.x86\$164**：0.2.3.0-1
  + **aws-neuronx-gpsimd-customop-lib.x86\$164：0.16.2.0** -1
  + **aws-neuronx-gpsimd-tools.x86\$164：0.16.1.0\$10a6506a47-1**
  + **aws-neuronx-k8-plugin.x86\$164**：2.26.26.0-1
  + aws-neuronx-k8-s@@ **cheduler.x86\$164**：2.26.26.0-1
  + **aws-neuronx-runtime-lib.x86\$164：2.26.** 42.0\$12ff3b5c7d-1
  + **aws-neuronx-tools.x86** \$164：2.24.54.0-1
  + **tensorflow-model-server-neuron.x86** \$164：2.8.0.2.3.0.0-0
  + **tensorflow-model-server-neuronx.x86\$164：2.10.1.2.12.2.** 0-0

------
#### [ K8s v1.32 ]
+ **Nvidia 驱动程序版本：**550.163.01
+ **CUDA 版本：**12.4
+ **EFA 安装程序版本：**1.38.0
+ **Neuron 软件包：**
  + **aws-neuronx-dkms.noarch**：2.22.2.0-dkms
  + **aws-neuronx-oci-hook.x86\$164**：2.4.0-1
  + **aws-neuronx-tools.x86** \$164：2.18.3.0-1
  + **aws-neuron-dkms.noarch**：2.3.26.0-dkms
  + **aws-neuron-k8-plugin.x86\$164**：1.9.3.0-1
  + aws-neuron-k8-s@@ **cheduler.x86\$164**：1.9.3.0-1
  + **aws-neuron-runtime.x86** \$164：1.6.24.0-1
  + **aws-neuron-runtime-base.x86** \$164：1.6.21.0-1
  + **aws-neuron-tools.x86\$164**：2.1.4.0-1
  + **aws-neuronx-collectives.x86\$164：2.26.** 43.0\$147cc904ea-1
  + **aws-neuronx-gpsimd-customop.x86\$164**：0.2.3.0-1
  + **aws-neuronx-gpsimd-customop-lib.x86\$164：0.16.2.0** -1
  + **aws-neuronx-gpsimd-tools.x86\$164：0.16.1.0\$10a6506a47-1**
  + **aws-neuronx-k8-plugin.x86\$164**：2.26.26.0-1
  + aws-neuronx-k8-s@@ **cheduler.x86\$164**：2.26.26.0-1
  + **aws-neuronx-runtime-lib.x86\$164：2.26.** 42.0\$12ff3b5c7d-1
  + **aws-neuronx-tools.x86** \$164：2.24.54.0-1
  + **tensorflow-model-server-neuron.x86** \$164：2.8.0.2.3.0.0-0
  + **tensorflow-model-server-neuronx.x86\$164：2.10.1.2.12.2.** 0-0

------

## SageMaker HyperPod AMI 在亚马逊 EKS 上发布：2025 年 6 月 9 日
<a name="sagemaker-hyperpod-release-ami-eks-20250609"></a>

**SageMaker HyperPod 适用于 Amazon 的 DLAMI EKS 支持**

------
#### [ Neuron SDK Updates ]
+ **aws-neuronx-dkms.noarch：**2.21.37.0（从 2.20.74.0 开始）

------

## SageMaker HyperPod AMI 在亚马逊 EKS 上发布：2025 年 5 月 22 日
<a name="sagemaker-hyperpod-release-ami-eks-20250522"></a>

**AMI 常规更新**

**SageMaker HyperPod 适用于 Amazon 的 DLAMI EKS 支持**

------
#### [ Deep Learning Base AMI AL2 ]
+ **最新的 NVIDIA 驱动程序：**550.163.01
+ **CUDA 堆栈更新：**
  + **默认 CUDA：**12.1
  + **NCCL 版本：**2.22.3
+ **EFA 安装程序：**1.38.0
+ **AWS OFI NCC** L：1.13.2
+ **Linux 内核：**5.10
+ **GDRCopy:** 2.4

**重要**  
**NVIDIA 容器工具包 1.17.4 更新：**现已禁止挂载 CUDA 兼容性库
**从 EFA 版本 1.37 更新到版本 1.38：**  
AWS OFI NCCL 插件现在位于 /-nccl opt/amazon/ofi
之前的位置 /opt//aws-ofi-nccl已被弃用

------
#### [ Neuron SDK Updates ]
+ **aws-neuronx-dkms.noarch：**2.20.74.0（从 2.20.28.0 开始）
+ **aws-neuronx-collectives.x86\$164：2.25.65.0\$19858ac9a1-1（来自 2.24.59.0\$18** 38c7fc8b-1）
+ **aws-neuronx-runtime-lib.x86\$164：2.25.57.0\$1166c7a468-1（来自 2.24.53.0\$1f** 239092cc-1）
+ **aws-neuronx-tools.x86\$164：2.23.9.0（从 2.22.6** 1.0 开始）
+ **aws-neuronx-gpsimd-customop-lib.x86\$164：0.15.12.0**（从 0.14.12.0 开始）
+ **aws-neuronx-gpsimd-tools.x86\$164：0.15.1.0\$15d31b6a3f（来自 0.14.6.0\$1241eb6** 9f4）
+ **aws-neuronx-k8-plugin.x86\$164：2.25.24.0（从 2.** 24.23.0 开始）
+ **aws-neuronx-k8-scheduler.x86\$164：2.25.24.0（从 2.** 24.23.0 开始）

**支持说明：**
+ 根据框架支持策略，AMI 组件（包括 CUDA 版本）可能会被移除或更改。
+ 为确保兼容性，已固定内核版本。除非需要安装安全补丁，否则用户应避免进行更新
+ 对于配备多个网卡的 EC2 实例，请参考 EFA 配置指南以进行正确设置

------

## SageMaker HyperPod AMI 在亚马逊 EKS 上发布：2025 年 5 月 7 日
<a name="sagemaker-hyperpod-release-ami-eks-20250507"></a>

------
#### [ Installed the latest version of AWS Neuron SDK ]
+ **tensorflow-model-server-neuron.x86** \$164 2.8.0.2.3.0.0-0 神经元

------

## SageMaker HyperPod AMI 在亚马逊 EKS 上发布：2025 年 4 月 28 日
<a name="sagemaker-hyperpod-release-ami-eks-20250428"></a>

**对 K8s 的改进**
+ 已将 NVIDIA 驱动程序从版本 550.144.03 升级至版本 550.163.01。此次升级旨在解决 [2025 年 4 月 NVIDIA GPU 显示屏安全公告](https://nvidia.custhelp.com/app/answers/detail/a_id/5630)中存在的常见漏洞和漏洞 (CVEs)。

**SageMaker HyperPod 适用于 Amazon 的 DLAMI EKS 支持**

------
#### [ Installed the latest version of AWS Neuron SDK ]
+ aws-neuronx-dkms.noarc@@ **h：2.20.28.0**-dkms
+ **aws-neuronx-oci-hook.x86\$164**：2.4.0-1
+ **aws-neuronx-tools.x86** \$164：2.18.3.0-1
+ **aws-neuron-dkms.noarch**：2.3.26.0-dkms
+ **aws-neuron-k8-plugin.x86\$164**：1.9.3.0-1
+ aws-neuron-k8-s@@ **cheduler.x86\$164**：1.9.3.0-1
+ **aws-neuron-runtime.x86** \$164：1.6.24.0-1
+ **aws-neuron-runtime-base.x86** \$164：1.6.21.0-1
+ **aws-neuron-tools.x86\$164**：2.1.4.0-1
+ **aws-neuronx-collectives.x86\$164：2.24.59.0\$1838c7fc8** b-1
+ **aws-neuronx-gpsimd-customop.x86\$164**：0.2.3.0-1
+ **aws-neuronx-gpsimd-customop-lib.x86\$164：0.14.12.0** -1
+ **aws-neuronx-gpsimd-tools.x86\$164：0.14.6.0\$1241eb69f4-1**
+ **aws-neuronx-k8-plugin.x86\$164**：2.24.23.0-1
+ aws-neuronx-k8-s@@ **cheduler.x86\$164**：2.24.23.0-1
+ **aws-neuronx-runtime-lib.x86\$164：2.24.** 53.0\$1f239092cc-1
+ **aws-neuronx-tools.x86\$164：2.22.6** 1.0-1
+ **tensorflow-model-server-neuronx.x86\$164：2.10.1.2.12.2.** 0-0

------

## SageMaker HyperPod AMI 在亚马逊 EKS 上发布：2025 年 4 月 18 日
<a name="sagemaker-hyperpod-release-ami-eks-20250418"></a>

**AMI 常规更新**
+ 适用于亚马逊 EKS 的新 SageMaker HyperPod AMI 1.32.1。

**SageMaker HyperPod 适用于 Amazon 的 DLAMI EKS 支持**

 AMIs 包括以下内容：

------
#### [ Deep Learning EKS AMI 1.32.1 ]
+ **Amazon EKS 组件**
  + Kubernetes 版本：1.32.1
  + Containerd 版本：1.7.27
  + Runc 版本：1.1.14
  + AWS IAM 身份验证器：0.6.29
+ **Amazon SSM Agent：**3.3.1611.0 
+ **Linux 内核：**5.10.235
+ **OSS Nvidia 驱动程序：**550.163.01
+ **NVIDIA CUDA：**12.4
+ **EFA 安装程序：**1.38.0
+ **GDRCopy: 2.4.** 1-1
+ **Nvidia 容器工具包：**1.17.6
+ **AWS OFI NCC** L：1.13.2
+ **aws-neuronx-tools: 2.18** .3.0
+ **aws-neuronx-runtime-lib:** 2.24.53.0
+ **aws-neuronx-oci-hook: 2.4.4.** 0-1
+ **aws-neuronx-dkms: 2.20** .28.0
+ **aws-neuronx-collectives:** 2.24.59.0

------

## SageMaker HyperPod AMI 在亚马逊 EKS 上发布：2025 年 2 月 18 日
<a name="sagemaker-hyperpod-release-ami-eks-20250218"></a>

**对 K8s 的改进**
+ 已将 Nvidia 容器工具包从版本 1.17.3 升级到版本 1.17.4。
+ 修复了客户在重启后无法连接到节点的问题。
+ 已将 Elastic Fabric Adapter（EFA）版本从 1.37.0 升级至 1.38.0。
+ EFA 现在包含 AWS OFI NCCL 插件，该插件位于`/opt/amazon/ofi-nccl`目录中，而不是原始路径中。`/opt/aws-ofi-nccl/`如果您需要更新 `LD_LIBRARY_PATH` 环境变量，请务必修改路径以指向 OFI NCCL 插件的新 `/opt/amazon/ofi-nccl` 位置。
+ 从这些 DLAMIs软件包中移除了 emacs 软件包。您可以从 GNU emac 安装 emacs。

**SageMaker HyperPod 适用于 Amazon 的 DLAMI EKS 支持**

------
#### [ Installed the latest version of neuron SDK ]
+ **aws-neuronx-dkms.noarch：**2.19.64.0-dkms @neuron
+ **aws-neuronx-oci-hook.x86\$164**：2.4.0-1 @neuron
+ **aws-neuronx-tools.x86\$164**：2.18.3.0-1 @neuron
+ **aws-neuronx-collectives.x86\$164：2.23.135.0\$13** e70920f2-1 神经元
+ **aws-neuronx-gpsimd-customop.x86\$164**：0.2.3.0-1 神经元
+ **aws-neuronx-gpsimd-customop-lib.x86\$164**
+ **aws-neuronx-gpsimd-tools.x86\$164：0.13.2.0\$194** ba34927-1 神经元
+ aws-neuronx-k8-p@@ **lugin.x86\$164**：2.23.45.0-1 神经元
+ aws-neuronx-k8-s@@ **cheduler.x86\$164**：2.23.45.0-1 神经元
+ **aws-neuronx-runtime-lib.x86\$164：2.23.112.0\$19** b5179492-1 神经元
+ **aws-neuronx-tools.x86\$164**：2.20.204.0-1 神经元
+ **tensorflow-model-server-neuronx.x86\$164**

------

## SageMaker HyperPod AMI 在亚马逊 EKS 上发布：2025 年 1 月 22 日
<a name="sagemaker-hyperpod-release-ami-eks-20250122"></a>

**AMI 常规更新**
+ 适用于亚马逊 EKS 的新 SageMaker HyperPod AMI 1.31.2。

**SageMaker HyperPod 适用于 Amazon 的 DLAMI EKS 支持**

 AMIs 包括以下内容：

------
#### [ Deep Learning EKS AMI 1.31 ]
+ **Amazon EKS 组件**
  + Kubernetes 版本：1.31.2
  + Containerd 版本：1.7.23
  + Runc 版本：1.1.14
  + AWS IAM 身份验证器：0.6.26
+ **Amazon SSM Agent：**3.3.987
+ **Linux 内核：**5.10.230
+ **OSS Nvidia 驱动程序：**550.127.05
+ **NVIDIA CUDA：**12.4
+ **EFA 安装程序：**1.37.0
+ **GDRCopy: 2.4.** 1-1
+ **Nvidia 容器工具包：**1.17.3
+ **AWS OFI NCC** L：1.13.0
+ **aws-neuronx-tools: 2.18** .3
+ **aws-neuronx-runtime-lib: 2.23.112** .0
+ **aws-neuronx-oci-hook: 2.4.4.** 0-1
+ **aws-neuronx-dkms: 2.18.20** .0
+ **aws-neuronx-collectives: 2.23.13** 3.0

------

## SageMaker HyperPod 亚马逊 EKS 的 AMI 发布：2024 年 12 月 21 日
<a name="sagemaker-hyperpod-release-ami-eks-20241221"></a>

**SageMaker HyperPod 适用于 Amazon 的 DLAMI EKS 支持**

 AMIs 包括以下内容：

------
#### [ K8s v1.28 ]
+ **Amazon EKS 组件**
  + Kubernetes 版本：1.28.15
  + Containerd 版本：1.7.23
  + Runc 版本：1.1.14
  + AWS IAM 身份验证器：0.6.26
+ **Amazon SSM Agent：**3.3.987
+ **Linux 内核：**5.10.228
+ **OSS NVIDIA 驱动程序：**550.127.05
+ **NVIDIA CUDA：**12.4
+ **EFA 安装程序：**1.37.0
+ **GDRCopy:** 2.4
+ **NVIDIA 容器工具包：**1.17.3
+ **AWS OFI NCC** L：1.13.0
+ **aws-neuronx-tools: 2.18** .3.0-1
+ **aws-neuronx-runtime-lib: 2.23.112** .0
+ **aws-neuronx-oci-hook: 2.4.4.** 0-1
+ **aws-neuronx-dkms: 2.18.20** .0
+ **aws-neuronx-collectives: 2.23.13** 5.0

------
#### [ K8s v1.29 ]
+ **Amazon EKS 组件**
  + Kubernetes 版本：1.29.10
  + Containerd 版本：1.7.23
  + Runc 版本：1.1.14
  + AWS IAM 身份验证器：0.6.26
+ **Amazon SSM Agent：**3.3.987
+ **Linux 内核：**5.15.0
+ **OSS Nvidia 驱动程序：**550.127.05
+ **NVIDIA CUDA：**12.4
+ **EFA 安装程序：**1.37.0
+ **GDRCopy:** 2.4
+ **Nvidia 容器工具包：**1.17.3
+ **AWS OFI NCC** L：1.13.0
+ **aws-neuronx-tools: 2.18** .3.0-1
+ **aws-neuronx-runtime-lib: 2.23.112** .0
+ **aws-neuronx-oci-hook: 2.4.4.** 0-1
+ **aws-neuronx-dkms: 2.18.20** .0
+ **aws-neuronx-collectives: 2.23.13** 5.0

------
#### [ K8s v1.30 ]
+ **Amazon EKS 组件**
  + Kubernetes 版本：1.30.6
  + Containerd 版本：1.7.23
  + Runc 版本：1.1.14
  + AWS IAM 身份验证器：0.6.26
+ **Amazon SSM Agent：**3.3.987.0
+ **Linux 内核：**5.10.228
+ **OSS Nvidia 驱动程序：**550.127.05
+ **NVIDIA CUDA：**12.4
+ **EFA 安装程序：**1.37.0
+ **GDRCopy:** 2.4
+ **Nvidia 容器工具包：**1.17.3
+ **AWS OFI NCC** L：1.13.0
+ **aws-neuronx-tools: 2.18** .3.0-1
+ **aws-neuronx-runtime-lib: 2.23.112** .0
+ **aws-neuronx-oci-hook: 2.4.4.** 0-1
+ **aws-neuronx-dkms: 2.18.20** .0
+ **aws-neuronx-collectives: 2.23.13** 5.0

------

## SageMaker HyperPod 亚马逊 EKS 的 AMI 发布：2024 年 12 月 13 日
<a name="sagemaker-hyperpod-release-ami-eks-20241213"></a>

**SageMaker HyperPod 适用于亚马逊 EKS 的 DLAMI 升级**
+ 已将 SSM Agent 更新至版本 `3.3.1311.0`。

## SageMaker HyperPod 亚马逊 EKS 的 AMI 发布：2024 年 11 月 24 日
<a name="sagemaker-hyperpod-release-ami-eks-20241124"></a>

**AMI 常规更新**
+ 已在 `MEL`（墨尔本）区域发布。
+ 将 SageMaker HyperPod 基础 DLAMI 更新至以下版本：
  + Kubernetes：2024-11-01。

## SageMaker HyperPod 亚马逊 EKS 的 AMI 发布：2024 年 11 月 15 日
<a name="sagemaker-hyperpod-release-ami-eks-20241115"></a>

**SageMaker HyperPod 适用于 Amazon 的 DLAMI EKS 支持**

 AMIs 包括以下内容：

------
#### [ Deep Learning EKS AMI 1.28 ]
+ **Amazon EKS 组件**
  + Kubernetes 版本：1.28.15
  + Containerd 版本：1.7.23
  + Runc 版本：1.1.14
  + AWS IAM 身份验证器：0.6.26
+ **Amazon SSM Agent：**3.3.987
+ **Linux 内核：**5.10.228
+ **OSS NVIDIA 驱动程序：**550.127.05
+ **NVIDIA CUDA：**12.4
+ **EFA 安装程序：**1.34.0
+ **GDRCopy:** 2.4
+ **NVIDIA 容器工具包：**1.17.3
+ **AWS OFI NCC** L：1.11.0
+ **aws-neuronx-tools: 2.18** .3.0-1
+ **aws-neuronx-runtime-lib: 2.22.19** .0
+ **aws-neuronx-oci-hook: 2.4.4.** 0-1
+ **aws-neuronx-dkms: 2.18.20** .0
+ **aws-neuronx-collectives:** 2.22.33.0

------
#### [ Deep Learning EKS AMI 1.29 ]
+ **Amazon EKS 组件**
  + Kubernetes 版本：1.29.10
  + Containerd 版本：1.7.23
  + Runc 版本：1.1.14
  + AWS IAM 身份验证器：0.6.26
+ **Amazon SSM Agent：**3.3.987
+ **Linux 内核：**5.10.228
+ **OSS Nvidia 驱动程序：**550.127.05
+ **NVIDIA CUDA：**12.4
+ **EFA 安装程序：**1.34.0
+ **GDRCopy:** 2.4
+ **Nvidia 容器工具包：**1.17.3
+ **AWS OFI NCC** L：1.11.0
+ **aws-neuronx-tools: 2.18** .3.0-1
+ **aws-neuronx-runtime-lib: 2.22.19** .0
+ **aws-neuronx-oci-hook: 2.4.4.** 0-1
+ **aws-neuronx-dkms: 2.18.20** .0
+ **aws-neuronx-collectives:** 2.22.33.0

------
#### [ Deep Learning EKS AMI 1.30 ]
+ **Amazon EKS 组件**
  + Kubernetes 版本：1.30.6
  + Containerd 版本：1.7.23
  + Runc 版本：1.1.14
  + AWS IAM 身份验证器：0.6.26
+ **Amazon SSM Agent：**3.3.987
+ **Linux 内核：**5.10.228
+ **OSS Nvidia 驱动程序：**550.127.05
+ **NVIDIA CUDA：**12.4
+ **EFA 安装程序：**1.34.0
+ **GDRCopy:** 2.4
+ **Nvidia 容器工具包：**1.17.3
+ **AWS OFI NCC** L：1.11.0
+ **aws-neuronx-tools: 2.18** .3.0-1
+ **aws-neuronx-runtime-lib: 2.22.19** .0
+ **aws-neuronx-oci-hook: 2.4.4.** 0-1
+ **aws-neuronx-dkms: 2.18.20** .0
+ **aws-neuronx-collectives:** 2.22.33.0

------

## SageMaker HyperPod 亚马逊 EKS 的 AMI 发布：2024 年 11 月 11 日
<a name="sagemaker-hyperpod-release-ami-eks-20241111"></a>

**AMI 常规更新**
+ 使用亚马逊 SageMaker HyperPod EKS 版本 1.28.13、1.29.8、1.30.4 更新了 DLAMI。

## SageMaker HyperPod 亚马逊 EKS 的 AMI 发布：2024 年 10 月 21 日
<a name="sagemaker-hyperpod-release-ami-eks-20241021"></a>

**AMI 常规更新**
+ 将 SageMaker HyperPod 基础 DLAMI 更新至以下版本：
  + Amazon EKS：1.28.11、1.29.6、1.30.2。

## SageMaker HyperPod 亚马逊 EKS 的 AMI 发布：2024 年 9 月 10 日
<a name="sagemaker-hyperpod-release-ami-eks-20240910"></a>

**SageMaker HyperPod 适用于 Amazon 的 DLAMI EKS 支持**

 AMIs 包括以下内容：

------
#### [ Deep Learning EKS AMI 1.28 ]
+ **Amazon EKS 组件**
  + Kubernetes 版本：1.28.11
  + Containerd 版本：1.7.20
  + Runc 版本：1.1.11
  + AWS IAM 身份验证器：0.6.21
+ **Amazon SSM Agent：**3.3.380
+ **Linux 内核：**5.10.223
+ **OSS NVIDIA 驱动程序：**535.183.01
+ **NVIDIA CUDA：**12.2
+ **EFA 安装程序：**1.32.0
+ **GDRCopy:** 2.4
+ **NVIDIA 容器工具包：**1.16.1
+ **AWS OFI NCCL：1.9.1**
+ **aws-neuronx-tools: 2.18** .3.0-1
+ **aws-neuronx-runtime-lib:** 2.21.41.0
+ **aws-neuronx-oci-hook: 2.4.4.** 0-1
+ **aws-neuronx-dkms: 2.17.17** .0
+ **aws-neuronx-collectives:** 2.21.46.0

------
#### [ Deep Learning EKS AMI 1.29 ]
+ **Amazon EKS 组件**
  + Kubernetes 版本：1.29.6
  + Containerd 版本：1.7.20
  + Runc 版本：1.1.11
  + AWS IAM 身份验证器：0.6.21
+ **Amazon SSM Agent：**3.3.380
+ **Linux 内核：**5.10.223
+ **OSS Nvidia 驱动程序：**535.183.01
+ **NVIDIA CUDA：**12.2
+ **EFA 安装程序：**1.32.0
+ **GDRCopy:** 2.4
+ **Nvidia 容器工具包：**1.16.1
+ **AWS OFI NCCL：1.9.1**
+ **aws-neuronx-tools: 2.18** .3.0-1
+ **aws-neuronx-runtime-lib:** 2.21.41.0
+ **aws-neuronx-oci-hook: 2.4.4.** 0-1
+ **aws-neuronx-dkms: 2.17.17** .0
+ **aws-neuronx-collectives:** 2.21.46.0

------
#### [ Deep Learning EKS AMI 1.30 ]
+ **Amazon EKS 组件**
  + Kubernetes 版本：1.30.2
  + Containerd 版本：1.7.20
  + Runc 版本：1.1.11
  + AWS IAM 身份验证器：0.6.21
+ **Amazon SSM Agent：**3.3.380
+ **Linux 内核：**5.10.223
+ **OSS Nvidia 驱动程序：**535.183.01
+ **NVIDIA CUDA：**12.2
+ **EFA 安装程序：**1.32.0
+ **GDRCopy:** 2.4
+ **Nvidia 容器工具包：**1.16.1
+ **AWS OFI NCCL：1.9.1**
+ **aws-neuronx-tools: 2.18** .3.0-1
+ **aws-neuronx-runtime-lib:** 2.21.41.0
+ **aws-neuronx-oci-hook: 2.4.4.** 0-1
+ **aws-neuronx-dkms: 2.17.17** .0
+ **aws-neuronx-collectives:** 2.21.46.0

------

# 公有 AMI 版本
<a name="sagemaker-hyperpod-release-public-ami"></a>

以下发行说明跟踪了适用于亚马逊 EKS 编排的亚马逊 SageMaker HyperPod 公共 AMI 版本的最新更新。每份发行说明都包含在 SageMaker HyperPod DLAMIs Amazon EKS 支持中预安装或预配置的软件包的摘要列表。每个 DLAMI 都建立 AL2023 在特定的 Kubernetes 版本之上，并支持该版本。有关 Amazon SageMaker HyperPod 功能版本的信息，请参阅[亚马逊 SageMaker HyperPod 发行说明](sagemaker-hyperpod-release-notes.md)。

此页面会定期更新，以提供全面的 AMI 生命周期管理信息，包括安全漏洞、弃用公告和修补建议。作为维护安全和 up-to-date基础设施承诺的一部分， SageMaker 人工智能使用自动扫描工作流程持续监控所有 HyperPod 公众 AMIs 的关键漏洞。发现关键安全问题后，系统 AMIs 地弃用适当的迁移指导。定期更新包括常见漏洞和暴露 (CVE) 补救状态、合规调查结果和建议的措施，以确保您可以维护安全的 HyperPod 环境，同时最大限度地减少 AMI 过渡期间的运营中断。

## SageMaker HyperPod 公开 AMI 发布：2025 年 8 月 4 日
<a name="sagemaker-hyperpod-release-public-ami-2025-08-04"></a>

亚马逊 SageMaker HyperPod 现在支持 Amazon EK AMIs S 集群的新公共集群。 AMIs 包括以下内容：

------
#### [ K8s v1.32 ]

AMI 名称： HyperPod EKS 1.32 x86\$164 AMI 亚马逊 Linux 2 2025080407
+ **Amazon EKS 组件**
  + Kubernetes 版本：1.32.3
  + Containerd 版本：1.7.23
  + Runc 版本：1.2.6
  + AWS IAM 身份验证器：0.6.29
+ **Amazon SSM Agent：**3.3.2299.0
+ **Linux 内核：**5.10.238-234.956.amzn2.x86\$164
+ **OSS NVIDIA 驱动程序：**550.163.01
+ **NVIDIA CUDA：**12.2
+ **EFA 安装程序：**1.38.0
+ **GDRCopy: 2.4.** 1
+ **NVIDIA 容器工具包：**1.17.8
+ **AWS OFI NCC** L：1.13.0-aws
+ **Neuron 软件包：**
  + **aws-neuronx-dkms.noarch**：2.22.2.0-dkms
  + **aws-neuronx-oci-hook.x86\$164**：2.4.0-1
  + **aws-neuronx-tools.x86** \$164：2.18.3.0-1
  + **aws-neuron-dkms.noarch**：2.3.26.0-dkms
  + **aws-neuron-k8-plugin.x86\$164**：1.9.3.0-1
  + aws-neuron-k8-s@@ **cheduler.x86\$164**：1.9.3.0-1
  + **aws-neuron-runtime.x86** \$164：1.6.24.0-1
  + **aws-neuron-runtime-base.x86** \$164：1.6.21.0-1
  + **aws-neuron-tools.x86\$164**：2.1.4.0-1
  + **aws-neuronx-collectives.x86\$164：2.27.34.0\$1ec8cd5e8** b-1
  + **aws-neuronx-gpsimd-customop.x86\$164**：0.2.3.0-1
  + **aws-neuronx-gpsimd-customop-lib.x86\$164：0.17.1.0** -1
  + **aws-neuronx-gpsimd-tools.x86\$164：0.17.0.0\$1aacc27699-1**
  + **aws-neuronx-k8-plugin.x86\$164**：2.27.7.0-1
  + aws-neuronx-k8-s@@ **cheduler.x86\$164**：2.27.7.0-1
  + **aws-neuronx-runtime-lib.x86\$164：2.27.23.0\$18deec4dbf-1**
  + **aws-neuronx-tools.x86** \$164：2.25.145.0-1
  + **tensorflow-model-server-neuron.x86** \$164：2.8.0.2.3.0.0-0
  + **tensorflow-model-server-neuronx.x86\$164：2.10.1.2.12.2.** 0-0

------
#### [ K8s v1.30 ]

AMI 名称： HyperPod EKS 1.30 x86\$164 AMI 亚马逊 Linux 2 2025080407
+ **Amazon EKS 组件**
  + Kubernetes 版本：1.30.11
  + Containerd 版本：1.7.\$1
  + Runc 版本：1.2.6
  + AWS IAM 身份验证器：0.6.28
+ **Amazon SSM Agent：**3.3.2299.0
+ **Linux 内核：**5.10.238-234.956.amzn2.x86\$164
+ **OSS NVIDIA 驱动程序：**550.163.01
+ **NVIDIA CUDA：**12.2
+ **EFA 安装程序：**1.38.0
+ **GDRCopy: 2.4.** 1
+ **NVIDIA 容器工具包：**1.17.8
+ **AWS OFI NCC** L：1.13.0-aws
+ **Neuron 软件包：**
  + **aws-neuronx-dkms.noarch**：2.22.2.0-dkms
  + **aws-neuronx-oci-hook.x86\$164**：2.4.0-1
  + **aws-neuronx-tools.x86** \$164：2.18.3.0-1
  + **aws-neuron-dkms.noarch**：2.3.26.0-dkms
  + **aws-neuron-k8-plugin.x86\$164**：1.9.3.0-1
  + aws-neuron-k8-s@@ **cheduler.x86\$164**：1.9.3.0-1
  + **aws-neuron-runtime.x86** \$164：1.6.24.0-1
  + **aws-neuron-runtime-base.x86** \$164：1.6.21.0-1
  + **aws-neuron-tools.x86\$164**：2.1.4.0-1
  + **aws-neuronx-collectives.x86\$164：2.27.34.0\$1ec8cd5e8** b-1
  + **aws-neuronx-gpsimd-customop.x86\$164**：0.2.3.0-1
  + **aws-neuronx-gpsimd-customop-lib.x86\$164：0.17.1.0** -1
  + **aws-neuronx-gpsimd-tools.x86\$164：0.17.0.0\$1aacc27699-1**
  + **aws-neuronx-k8-plugin.x86\$164**：2.27.7.0-1
  + aws-neuronx-k8-s@@ **cheduler.x86\$164**：2.27.7.0-1
  + **aws-neuronx-runtime-lib.x86\$164：2.27.23.0\$18deec4dbf-1**
  + **aws-neuronx-tools.x86** \$164：2.25.145.0-1
  + **tensorflow-model-server-neuron.x86** \$164：2.8.0.2.3.0.0-0
  + **tensorflow-model-server-neuronx.x86\$164：2.10.1.2.12.2.** 0-0

------
#### [ K8s v1.31 ]

AMI 名称： HyperPod EKS 1.31 x86\$164 AMI 亚马逊 Linux 2 2025080407
+ **Amazon EKS 组件**
  + Kubernetes 版本：1.31.7
  + Containerd 版本：1.7.\$1
  + Runc 版本：1.2.6
  + AWS IAM 身份验证器：0.6.28
+ **Amazon SSM Agent：**3.3.2299.0
+ **Linux 内核：**5.10.238-234.956.amzn2.x86\$164
+ **OSS NVIDIA 驱动程序：**550.163.01
+ **NVIDIA CUDA：**12.2
+ **EFA 安装程序：**1.38.0
+ **GDRCopy: 2.4.** 1
+ **NVIDIA 容器工具包：**1.17.8
+ **AWS OFI NCC** L：1.13.0-aws
+ **Neuron 软件包：**
  + **aws-neuronx-dkms.noarch**：2.22.2.0-dkms
  + **aws-neuronx-oci-hook.x86\$164**：2.4.0-1
  + **aws-neuronx-tools.x86** \$164：2.18.3.0-1
  + **aws-neuron-dkms.noarch**：2.3.26.0-dkms
  + **aws-neuron-k8-plugin.x86\$164**：1.9.3.0-1
  + aws-neuron-k8-s@@ **cheduler.x86\$164**：1.9.3.0-1
  + **aws-neuron-runtime.x86** \$164：1.6.24.0-1
  + **aws-neuron-runtime-base.x86** \$164：1.6.21.0-1
  + **aws-neuron-tools.x86\$164**：2.1.4.0-1
  + **aws-neuronx-collectives.x86\$164：2.27.34.0\$1ec8cd5e8** b-1
  + **aws-neuronx-gpsimd-customop.x86\$164**：0.2.3.0-1
  + **aws-neuronx-gpsimd-customop-lib.x86\$164：0.17.1.0** -1
  + **aws-neuronx-gpsimd-tools.x86\$164：0.17.0.0\$1aacc27699-1**
  + **aws-neuronx-k8-plugin.x86\$164**：2.27.7.0-1
  + aws-neuronx-k8-s@@ **cheduler.x86\$164**：2.27.7.0-1
  + **aws-neuronx-runtime-lib.x86\$164：2.27.23.0\$18deec4dbf-1**
  + **aws-neuronx-tools.x86** \$164：2.25.145.0-1
  + **tensorflow-model-server-neuron.x86** \$164：2.8.0.2.3.0.0-0
  + **tensorflow-model-server-neuronx.x86\$164：2.10.1.2.12.2.** 0-0

------
#### [ K8s v1.29 ]

AMI 名称： HyperPod EKS 1.29 x86\$164 AMI 亚马逊 Linux 2 2025080407
+ **Amazon EKS 组件**
  + Kubernetes 版本：1.29.15
  + Containerd 版本：1.7.\$1
  + Runc 版本：1.2.6
  + AWS IAM 身份验证器：0.6.28
+ **Amazon SSM Agent：**3.3.2299.0
+ **Linux 内核：**5.10.238-234.956.amzn2.x86\$164
+ **OSS NVIDIA 驱动程序：**550.163.01
+ **NVIDIA CUDA：**12.2
+ **EFA 安装程序：**1.38.0
+ **GDRCopy: 2.4.** 1
+ **NVIDIA 容器工具包：**1.17.8
+ **AWS OFI NCC** L：1.13.0-aws
+ **Neuron 软件包：**
  + **aws-neuronx-dkms.noarch**：2.22.2.0-dkms
  + **aws-neuronx-oci-hook.x86\$164**：2.4.0-1
  + **aws-neuronx-tools.x86** \$164：2.18.3.0-1
  + **aws-neuron-dkms.noarch**：2.3.26.0-dkms
  + **aws-neuron-k8-plugin.x86\$164**：1.9.3.0-1
  + aws-neuron-k8-s@@ **cheduler.x86\$164**：1.9.3.0-1
  + **aws-neuron-runtime.x86** \$164：1.6.24.0-1
  + **aws-neuron-runtime-base.x86** \$164：1.6.21.0-1
  + **aws-neuron-tools.x86\$164**：2.1.4.0-1
  + **aws-neuronx-collectives.x86\$164：2.27.34.0\$1ec8cd5e8** b-1
  + **aws-neuronx-gpsimd-customop.x86\$164**：0.2.3.0-1
  + **aws-neuronx-gpsimd-customop-lib.x86\$164：0.17.1.0** -1
  + **aws-neuronx-gpsimd-tools.x86\$164：0.17.0.0\$1aacc27699-1**
  + **aws-neuronx-k8-plugin.x86\$164**：2.27.7.0-1
  + aws-neuronx-k8-s@@ **cheduler.x86\$164**：2.27.7.0-1
  + **aws-neuronx-runtime-lib.x86\$164：2.27.23.0\$18deec4dbf-1**
  + **aws-neuronx-tools.x86** \$164：2.25.145.0-1
  + **tensorflow-model-server-neuron.x86** \$164：2.8.0.2.3.0.0-0
  + **tensorflow-model-server-neuronx.x86\$164：2.10.1.2.12.2.** 0-0

------
#### [ K8s v1.28 ]

AMI 名称： HyperPod EKS 1.28 x86\$164 AMI 亚马逊 Linux 2 2025080407
+ **Amazon EKS 组件**
  + Kubernetes 版本：1.28.15
  + Containerd 版本：1.7.\$1
  + Runc 版本：1.2.6
  + AWS IAM 身份验证器：0.6.28
+ **Amazon SSM Agent：**3.3.2299.0
+ **Linux 内核：**5.10.238-234.956.amzn2.x86\$164
+ **OSS NVIDIA 驱动程序：**550.163.01
+ **NVIDIA CUDA：**12.2
+ **EFA 安装程序：**1.38.0
+ **GDRCopy: 2.4.** 1
+ **NVIDIA 容器工具包：**1.17.8
+ **AWS OFI NCC** L：1.13.0-aws
+ **Neuron 软件包：**
  + **aws-neuronx-dkms.noarch**：2.22.2.0-dkms
  + **aws-neuronx-oci-hook.x86\$164**：2.4.0-1
  + **aws-neuronx-tools.x86** \$164：2.18.3.0-1
  + **aws-neuron-dkms.noarch**：2.3.26.0-dkms
  + **aws-neuron-k8-plugin.x86\$164**：1.9.3.0-1
  + aws-neuron-k8-s@@ **cheduler.x86\$164**：1.9.3.0-1
  + **aws-neuron-runtime.x86** \$164：1.6.24.0-1
  + **aws-neuron-runtime-base.x86** \$164：1.6.21.0-1
  + **aws-neuron-tools.x86\$164**：2.1.4.0-1
  + **aws-neuronx-collectives.x86\$164：2.27.34.0\$1ec8cd5e8** b-1
  + **aws-neuronx-gpsimd-customop.x86\$164**：0.2.3.0-1
  + **aws-neuronx-gpsimd-customop-lib.x86\$164：0.17.1.0** -1
  + **aws-neuronx-gpsimd-tools.x86\$164：0.17.0.0\$1aacc27699-1**
  + **aws-neuronx-k8-plugin.x86\$164**：2.27.7.0-1
  + aws-neuronx-k8-s@@ **cheduler.x86\$164**：2.27.7.0-1
  + **aws-neuronx-runtime-lib.x86\$164：2.27.23.0\$18deec4dbf-1**
  + **aws-neuronx-tools.x86** \$164：2.25.145.0-1
  + **tensorflow-model-server-neuron.x86** \$164：2.8.0.2.3.0.0-0
  + **tensorflow-model-server-neuronx.x86\$164：2.10.1.2.12.2.** 0-0

------