

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 使用 Amazon SageMaker 推理推荐器推荐作业
<a name="inference-recommender-recommendation-jobs"></a>

Amazon SageMaker 推理推荐器可以提出两种类型的推荐：

1. 推理推荐 (`Default` 作业类型）对推荐的实例类型运行一组负载测试。您也可以对无服务器端点进行负载测试。您只需提供模型包 Amazon 资源名称 (ARN) 即可启动此类推荐作业。推理推荐作业将在 45 分钟内完成。

1. 端点推荐（`Advanced` 作业类型）基于自定义负载测试，您可以在其中选择所需的机器学习实例或无服务器端点、提供自定义流量模式，并根据生产要求提供延迟和吞吐量要求。根据设置的作业持续时间和测试的推理配置总数，此作业平均需要 2 小时才能完成。

两种类型的推荐都使用相同的 API 来创建、描述和停止作业。输出是实例配置推荐的列表，其中包含相关的环境变量、成本、吞吐量和延迟指标。推荐作业还提供初始实例计数，可以用它来配置自动扩缩策略。为了区分这两种类型的作业，在通过 SageMaker AI 控制台或 API 创建任务时，请指定`Default`创建初步终端节点建议以及自定义`Advanced`负载测试和端点建议。

**注意**  
您不需要在自己的工作流中执行两种类型的推荐作业。您可以独立完成。

Inference Recommender 还可以为您提供潜在实例的列表，或者针对模型部署的成本、吞吐量和延迟进行优化的前五种实例类型，以及置信度分数。您可以在部署模型时选择这些实例。Inference Recommender 会自动针对您的模型执行基准测试，以便提供潜在实例。由于这些都是初步推荐，因此，我们建议您运行更多的实例推荐作业，以获得更准确的结果。要查看潜在实例，请转到您的 SageMaker AI 模型详细信息页面。有关更多信息，请参阅 [即时获取潜在实例](inference-recommender-prospective.md)。

**Topics**
+ [即时获取潜在实例](inference-recommender-prospective.md)
+ [推理推荐](inference-recommender-instance-recommendation.md)
+ [获取现有端点的推理推荐](inference-recommender-existing-endpoint.md)
+ [停止推理推荐](instance-recommendation-stop.md)
+ [使用 Neo 的编译的推荐](inference-recommender-neo-compilation.md)
+ [推荐结果](inference-recommender-interpret-results.md)
+ [获取自动扩缩策略推荐](inference-recommender-autoscaling.md)
+ [运行自定义负载测试](inference-recommender-load-test.md)
+ [停止您的负载测试](load-test-stop.md)
+ [纠正 Inference Recommender 错误](inference-recommender-troubleshooting.md)