本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
用于使用 Amazon A SageMaker I 进行推理的高级终端节点选项
借助实时推理,您可以使用以下高级推理选项进一步优化性能和成本:
-
Multi-model 端点:如果您的多个模型使用相同的框架,并且可以共享一个容器,请使用此选项。此选项可通过提高端点利用率和减少部署开销来帮助您优化成本。
-
Multi-container 端点:如果您的多个模型使用不同的框架,并且需要各自的容器,请使用此选项。您可以获得 Endpoint Multi-Model s 的许多好处,并且可以部署各种框架和模型。
-
串行推理管道:如果您要在端点后面托管带有预处理和后处理逻辑的模型,请使用此选项。推理管道完全由 SageMaker AI 管理,延迟更低,因为所有容器都托管在相同的 Amazon EC2 实例上。