View a markdown version of this page

Real-time 推断 - 亚马逊 SageMaker AI

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Real-time 推断

Real-time 推理非常适合需要实时、交互式、低延迟的推理工作负载。您可以将模型部署到 SageMaker AI 托管服务,并获得可用于推理的终端节点。这些端点是完全托管的,并支持自动扩缩(请参阅自动缩放 Amazon SageMaker 人工智能模型)。您可以使用增强的指标监控终端节点上的单个实例和容器(请参阅Amazon SageMaker AI 增强了推理终端节点的指标)。