

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# Amazon SageMaker Inference Recommender を使用したレコメンデーションジョブ
<a name="inference-recommender-recommendation-jobs"></a>

Amazon SageMaker Inference Recommender は、次の 2 種類のレコメンデーションを作成できます。

1. 推論レコメンデーション (`Default` ジョブタイプ) は、レコメンデーションインスタンスタイプに対して一連のロードテストを実行します。サーバーレスエンドポイントのロードテストを行うこともできます。モデルパッケージの Amazon リソースネーム (ARN) を指定するだけで、このタイプのレコメンデーションジョブを起動できます。推論レコメンデーションジョブは 45 分以内に完了します。

1. エンドポイントのレコメンデーション (`Advanced` ジョブタイプ) は、目的の機械学習インスタンスまたはサーバーレスエンドポイントを選択し、カスタムトラフィックパターンを指定して、本番環境要件に基づいてレイテンシーとスループットの要件を指定するカスタムロードテストに基づいています。このジョブの完了には、設定されたジョブ期間とテストされた推論設定の合計数に応じて、平均 2 時間かかります。

どちらのタイプのレコメンデーションも、同じ API を使用し、ジョブの作成、説明、停止を使用します。出力は、関連する環境変数、コスト、スループット、レイテンシーメトリクスに関連するインスタンス設定のレコメンデーションのリストです。レコメンデーションジョブは、オートスケーリングポリシーの設定に使用できる初期インスタンス数も提供します。2 つのタイプのジョブを区別するには、SageMaker AI コンソールまたは API を使用してジョブを作成する際に、`Default` を指定して予備的なエンドポイントレコメンデーションを作成し、カスタムロードテストとエンドポイントのレコメンデーションに `Advanced` を指定します。

**注記**  
両方のタイプのレコメンデーションジョブを独自のワークフローで実行する必要はありません。どちらかから独立して行うことができます。

Inference Recommender では、想定インスタンスのリスト、またはモデルデプロイのコスト、スループット、レイテンシーが最適化された上位 5 つのインスタンスタイプを、信頼度スコアとともに提供することもできます。これらのインスタンスは、モデルをデプロイする際に選択できます。Inference Recommender はモデルに対して自動的にベンチマークを行い、想定インスタンスを提供します。これらは予備的なレコメンデーションであるため、より正確な結果を得るには、さらにインスタンスレコメンデーションジョブを実行することをお勧めします。想定インスタンスを表示するには、SageMaker AI モデルの詳細ページにアクセスしてください。詳細については、「[想定インスタンスを即時に入手する](inference-recommender-prospective.md)」を参照してください。

**Topics**
+ [想定インスタンスを即時に入手する](inference-recommender-prospective.md)
+ [推論レコメンデーション](inference-recommender-instance-recommendation.md)
+ [既存のエンドポイントの推論レコメンデーションを取得する](inference-recommender-existing-endpoint.md)
+ [推論レコメンデーションを停止する](instance-recommendation-stop.md)
+ [Neo でコンパイル済みのレコメンデーション](inference-recommender-neo-compilation.md)
+ [レコメンデーション結果](inference-recommender-interpret-results.md)
+ [自動スケーリングポリシーレコメンデーションを取得する](inference-recommender-autoscaling.md)
+ [カスタムロードテストを実行する](inference-recommender-load-test.md)
+ [ロードテストを停止する](load-test-stop.md)
+ [Inference Recommender エラーのトラブルシューティング](inference-recommender-troubleshooting.md)