

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# Amazon SageMaker Inference Recommender
<a name="inference-recommender"></a>

Amazon SageMaker Inference Recommender 是 Amazon SageMaker AI 的一項功能。這項功能可透過自動化跨 SageMaker AI ML 執行個體進行負載測試和模型調校，以減少在生產環境中取得機器學習 (ML) 模型所需的時間。您可以使用 Inference Recommender 將模型部署到即時或無伺服器推論端點，以最低的成本提供最佳效能。Inference Recommender 可以協助您為 ML 模型和工作負載選取最合適的執行個體類型和組態。它會考慮執行個體數量、容器參數、模型最佳化、並行上限和記憶體大小等因素。

Amazon SageMaker Inference Recommender 只會針對您執行任務時使用的執行個體收費。

## 運作方式
<a name="inference-recommender-how-it-works"></a>

若要使用 Amazon SageMaker Inference Recommender，您可以[建立 SageMaker AI 模型](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateModel.html)，或將模型與模型成品一起註冊到 SageMaker 模型註冊表。使用 適用於 Python (Boto3) 的 AWS SDK 或 SageMaker AI 主控台，針對不同的 SageMaker AI 端點組態執行基準測試任務。Inference Recommender 任務可幫助您收集效能和資源使用率的指標並以視覺化方式呈現，以協助您決定要選擇的端點類型和組態。

## 如何開始
<a name="inference-recommender-get-started"></a>

如果您是第一次使用 Amazon SageMaker Inference Recommender，建議您完成以下事項：

1. 請仔細閱讀[使用 Amazon SageMaker Inference Recommender 的先決條件](inference-recommender-prerequisites.md)一節，確定您已符合使用 Amazon SageMaker Inference Recommender 的需求。

1. 請仔細閱讀[Amazon SageMaker Inference Recommender 的建議任務](inference-recommender-recommendation-jobs.md)一節，以啟動您的第一個 Inference Recommender 建議任務。

1. 探索入門的 Amazon SageMaker Inference Recommender [Jupyter 筆記本](https://github.com/aws/amazon-sagemaker-examples/blob/master/sagemaker-inference-recommender/inference-recommender.ipynb)範例，或檢閱下一節中的範例筆記本。

## 範例筆記本
<a name="inference-recommender-notebooks"></a>

下列 Jupyter 筆記本範例可協助您處理 Inference Recommender 中多個使用案例的工作流程：
+ 如果您想要一款能夠對 TensorFlow 模型進行基準測試的入門筆記本，請參閱 [SageMaker Inference Recommender TensorFlow](https://github.com/aws/amazon-sagemaker-examples/blob/main/sagemaker-inference-recommender/inference-recommender.ipynb)筆記本。
+ 如果您想要對 HuggingFace 模型進行基準測試，請參閱 [SageMaker Inference Recommender for HuggingFace](https://github.com/aws/amazon-sagemaker-examples/blob/main/sagemaker-inference-recommender/huggingface-inference-recommender/huggingface-inference-recommender.ipynb) 筆記本。
+ 如果您想要對 XgBoost 模型進行基準測試，請參 [SageMaker Inference Recommender XGBoost](https://github.com/aws/amazon-sagemaker-examples/blob/main/sagemaker-inference-recommender/xgboost/xgboost-inference-recommender.ipynb) 筆記本。
+ 如果您想要檢閱 Inference Recommender 任務的 CloudWatch 指標，請參閱 [SageMaker Inference Recommender CloudWatch 指標](https://github.com/aws/amazon-sagemaker-examples/blob/main/sagemaker-inference-recommender/tensorflow-cloudwatch/tf-cloudwatch-inference-recommender.ipynb)筆記本。