本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
用于 SageMaker HyperPod 集群的自定义 Amazon 系统映像 (AMI)
使用亚马逊提供并公开的基本亚马逊系统映像 (AMI) SageMaker HyperPod,您可以构建自定义 AMI。利用自定义 AMI,您可以使用预配置的软件堆栈、驱动程序自定义项、专有依赖项和安全代理为 AI 工作负载创建专用环境。此功能无需再使用生命周期配置脚本执行复杂的启动后引导操作。
借助自定义 AMI,您可以标准化不同阶段的环境,缩短启动时间,并完全控制运行时环境,同时利用 SageMaker HyperPod基础架构功能和扩展优势。这可以帮助您保持对人工智能基础架构的控制,同时仍能从优化的基础运行时间中 SageMaker HyperPod受益。
您可以通过添加安全代理、合规性工具和专用库在 SageMaker HyperPod 性能调整的基础映像的基础上进行构建,同时保留所有分布式训练的好处。此功能消除了以往必须在基础设施优化与组织安全策略之间二选一的限制。
自定义 AMI 体验与已建立的企业安全工作流无缝集成。安全团队使用 SageMaker HyperPod公共 AMI 作为基础构建强化映像,AI 平台团队可以在通过 API 创建或更新集群时指定这些自定义 AMI。 SageMaker HyperPod 这些 API 可验证映像兼容性、处理必要的权限并保持向后兼容性,确保现有工作流继续正常运行。具有严格安全协议的组织可不再采用通过生命周期脚本在运行时安装安全代理这一易出错的替代方案。通过与企业安全实践保持一致,而不是强迫组织调整协议以 SageMaker HyperPod适应局限性,自定义 AMI 消除了运行关键 AI 工作负载的注重安全的组织采用的常见障碍。
有关公有 AMI 更新的发行说明,请参阅公有 AMI 版本。要了解如何开始构建自定义 AMI 并在 HyperPod 集群中使用它,请参阅以下主题。