

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# エンドポイント
<a name="realtime-endpoints-manage"></a>

モデルをエンドポイントにデプロイしたら、エンドポイントを表示および管理します。SageMaker AI を使用すると、エンドポイントのステータスと詳細を表示したり、メトリクスとログを確認してエンドポイントのパフォーマンスをモニタリングしたり、エンドポイントにデプロイされたモデルの更新したりなどができます。

以下のセクションでは、Amazon SageMaker Studio または AWS マネジメントコンソール でエンドポイントを管理する方法を示します。

次のページでは、Amazon SageMaker AI コンソールまたは SageMaker Studio を使用してエンドポイントをインタラクティブに表示および変更する方法について説明します。

**Topics**
+ [SageMaker Studio でエンドポイントの詳細を表示する](manage-endpoints-studio.md)
+ [SageMaker AI コンソールでエンドポイントの詳細を表示します。](manage-endpoints-console.md)

# SageMaker Studio でエンドポイントの詳細を表示する
<a name="manage-endpoints-studio"></a>

Amazon SageMaker Studio では、SageMaker AI がホストするエンドポイントを表示および管理できます。Studio の詳細については、[Amazon SageMaker Studio](https://docs.aws.amazon.com/sagemaker/latest/dg/studio.html) を参照してください。

SageMaker Studio でエンドポイントのリストを検索するには、次の手順を実行します:

1. Studio アプリケーションを開きます。

1. 左のナビゲーションペインで **[デプロイ]** を選択します。

1. ドロップダウンメニューから**[エンドポイント]** を選択します。

**エンドポイント**ページが開き、SageMaker AI がホストするエンドポイントがすべて表示されます。このページで、エンドポイントとその**ステータス**を確認できます。新しいエンドポイントの作成、既存のエンドポイントの編集、またはエンドポイントの削除を行うこともできます。

特定のエンドポイントの詳細を表示するには、リストからエンドポイントを選択します。エンドポイントの詳細ページに、次のスクリーンショットのような概要が表示されます。

![\[Studio のエンドポイントの詳細の概要を示すエンドポイントのメインページのスクリーンショット。\]](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/images/inference/studio-endpoint-details-page.png)


各エンドポイントの詳細ページに、次の情報タブが含まれます。

# バリアント (またはモデル) の表示
<a name="manage-endpoints-studio-variants"></a>

**[バリアント]** タブ (エンドポイントに複数のモデルがデプロイされている場合は **[モデル]** タブとも呼ばれます) には、エンドポイントに現在デプロイされている[モデルバリアント](https://docs.aws.amazon.com/sagemaker/latest/dg/model-ab-testing.html)またはモデルのリストが表示されます。次のスクリーンショットは、複数の**モデル**がデプロイされたエンドポイントの概要と [モデル] セクションを示しています。

![\[デプロイされた複数のモデルが表示されたエンドポイントのメインページのスクリーンショット。\]](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/images/inference/studio-goldfinch-multi-model-endpoint.png)


各バリアントまたはモデルに設定を追加または編集できます。バリアントを選択し、デフォルトの自動スケーリングポリシーを有効にします。このポリシーは、後で **[自動スケーリング]** タブで編集できます。

# 設定の表示
<a name="manage-endpoints-studio-settings"></a>

**[設定]** タブでは、エンドポイントに関連付けられた AWS IAM ロール、暗号化に使用される AWS KMS キー (該当する場合)、VPC の名前、ネットワーク隔離設定を表示できます。

# テスト推論
<a name="manage-endpoints-studio-test"></a>

**[テスト推論]** タブで、デプロイされたモデルにテスト推論リクエストを送信できます。これは、エンドポイントが期待どおりにリクエストに応答することを検証するのに便利です。

推論をテストするには、以下を実行します。

1. モデルの **[テスト推論]** タブで、次のいずれかのオプションを選択します。

   1. エンドポイントをテストし、Studio インターフェイスを介してレスポンスを受け取る場合は、**[リクエスト本文を入力]** を選択します。

   1. ローカル環境からエンドポイントを呼び出し、プログラムでレスポンスを受け取るために使用する AWS SDK for Python (Boto3) の例をコピーする場合は、**[サンプルコードのコピー (Python)]** を選択します。

1. **[モデル]** で、エンドポイントでテストするモデルを選択します。

1. Studio インターフェイスでテストする方法を選択した場合は、レスポンスの**コンテンツタイプ**をドロップダウンから選択することもできます。

リクエストを設定したら、**[リクエストの送信]** (Studio インターフェイス経由でレスポンスを受け取る) または **[コピー]** を選択して Python の例をコピーできます。

Studio インターフェイスから受け取るレスポンスは、次のスクリーンショットのようになります。

![\[Studio のエンドポイントで推論テストリクエストが成功したスクリーンショット。\]](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/images/inference/endpoint-test-inference.png)


# Auto-scaling
<a name="manage-endpoints-studio-autoscaling"></a>

**[Auto-scaling]** タブでは、エンドポイントでホストされているモデル用に設定された任意の Auto-scaling ポリシーを表示できます。次のスクリーンショットは、**[Auto Scaling]**タブを示しています。

![\[[Auto-scaling] タブのスクリーンショット。アクティブなポリシーが 1 つ表示されている。\]](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/images/inference/studio-endpoint-autoscaling.png)


**[Auto-scaling の編集]** を選択して、任意のポリシーを変更し、デフォルトの Auto-scaling ポリシーをオンまたはオフにすることができます。

リアルタイムエンドポイントの自動スケーリングの詳細については、「[Automatically Scale Amazon SageMaker AI Models](https://docs.aws.amazon.com/sagemaker/latest/dg/endpoint-auto-scaling.html)」を参照してください。エンドポイントの Auto-scaling ポリシーを設定する方法が不明な場合は、[Inference Recommender の自動スケーリングレコメンデーションジョブ](https://docs.aws.amazon.com/sagemaker/latest/dg/inference-recommender-autoscaling.html)を使用して、Auto-scaling ポリシーのレコメンデーションを取得します。

# SageMaker AI コンソールでエンドポイントの詳細を表示します。
<a name="manage-endpoints-console"></a>

SageMaker AI コンソールでエンドポイントを表示するには、次の手順を実行します。

1. SageMaker AI コンソール ([https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/)) に移動します。

1. 左側のナビゲーションペインで **[インターフェイス]** を選択します。

1. ドロップダウンリストから **[エンドポイント]** を選択します。

1. **[エンドポイント]** ページで、エンドポイントを選択します。

エンドポイント詳細ページが開き、エンドポイントの概要と、エンドポイント用に収集されたメトリクスが表示されます。

以下のセクションでは、エンドポイントの詳細ページのタブについて説明します。

# エンドポイントのモニタリング
<a name="manage-endpoints-console-monitoring"></a>

SageMaker AI ホストエンドポイントを作成後、Amazon CloudWatch を使用してエンドポイントをモニタリングすることで、raw データを収集し、リアルタイムに近い読み取り可能なメトリクスに加工できます。これらのメトリクスを使用することにより、履歴情報にアクセスして、エンドポイントのパフォーマンスをより的確に把握できます。詳細については、「*[Amazon CloudWatch ユーザーガイド](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/)*」を参照してください。

エンドポイント詳細ページの **[モニタリング]** タブから、エンドポイントから収集された CloudWatch メトリクスデータを表示できます。

**[モニタリング]** タブには以下のセクションがあります。
+ **[運用指標]**: CPU 使用率やメモリ使用率など、エンドポイントのリソースの使用状況を追跡する指標を表示します。
+ **[呼び出しメトリクス]**: 呼び出しモデルエラーやモデルレイテンシーなど、`InvokeEndpoint` エンドポイントに送信されるリクエストの数、状態、ステータスを追跡するメトリクスを表示します。
+ **[Health メトリクス]**: 呼び出し失敗や通知失敗など、エンドポイントの全体的な状態を追跡するメトリクスを表示します。

各メトリクスの詳細な説明については、「[Monitor SageMaker AI with CloudWatch](https://docs.aws.amazon.com/sagemaker/latest/dg/monitoring-cloudwatch.html)」を参照してください。

次のスクリーンショットは、サーバーレスエンドポイントの **[運用メトリクス]** セクションを示しています。

![\[エンドポイント詳細ページの運用メトリクスセクションにあるメトリクスグラフのスクリーンショット。\]](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/images/hosting-operational-metrics.png)




特定のセクションのメトリクスについて追跡したい**期間**と**統計**、メトリクスデータを表示したい期間の長さを調整できます。**[ウィジェットの追加]** を選択して、各セクションのビューにメトリクスウィジェットを追加したり、ビューから削除したりすることもできます。**[ウィジェットの追加]** ダイアログボックスでは、表示するメトリクスを選択または選択解除できます。

利用できるメトリクスは、エンドポイントのタイプによって異なる場合があります。たとえば、サーバーレスエンドポイントには、リアルタイムエンドポイントでは利用できないメトリクスがいくつかあります。エンドポイントタイプ別のより具体的なメトリクス情報については、次のページを参照してください。
+ [サーバーレスエンドポイントをモニタリングする](https://docs.aws.amazon.com/sagemaker/latest/dg/serverless-endpoints-monitoring.html)
+ [非同期エンドポイントをモニタリングする](https://docs.aws.amazon.com/sagemaker/latest/dg/async-inference-monitor.html)
+ [マルチモデルエンドポイントのデプロイのメトリクス](https://docs.aws.amazon.com/sagemaker/latest/dg/multi-model-endpoint-cloudwatch-metrics.html)
+ [推論パイプラインのログとメトリクス](https://docs.aws.amazon.com/sagemaker/latest/dg/inference-pipeline-logs-metrics.html)

# 設定
<a name="manage-endpoints-console-settings"></a>

**[設定]** タブを選択すると、データキャプチャ設定、エンドポイント設定、タグなど、エンドポイントに関する追加情報を表示できます。

# アラームを作成する。　
<a name="manage-endpoints-console-alarms"></a>

エンドポイント詳細ページの **[アラーム]** タブでは、メトリクスのしきい値を指定する単純な静的しきい値メトリクスアラームを表示および作成できます。メトリクスがしきい値を超えると、アラームは `ALARM` の状態になります。CloudWatch アラームの詳細については、「[Amazon CloudWatch でのアラームの使用](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html)」を参照してください。

**[エンドポイントサマリー]** セクションには、エンドポイントで現在アクティブなアラームの数を示す **[アラーム]** フィールドが表示されます。

どのアラームが `ALARM` の状態にあるかを表示するには、**[アラーム]** タブを選択します。**[アラーム]** タブには、エンドポイントのアラームの全リストと、そのステータスや状態に関する詳細が表示されます。次のスクリーンショットは、エンドポイントに設定されたこのセクションのアラームのリストを示しています。

![\[CloudWatch アラームのリストが表示されているエンドポイント詳細ページの [アラーム] タブのスクリーンショット。\]](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/images/hosting-alarms-tab.png)


アラームのステータスは `In alarm`、`OK`、または収集されているメトリクスデータが十分でない場合の `Insufficient data` です。

エンドポイントの新しいアラームを作成するには、次の操作を行います。

1. **[アラーム]** タブで、**[アラームの作成]** を選択します。

1. **[アラームの作成]** ページが開きます。[**アラーム名**] に、アラームの名前を入力します。

1. (オプション) アラームの説明を入力します。

1. **[メトリクス]** では、アラームに追跡させたい CloudWatch メトリクスを選択します。

1. **[バリアント名]** では、モニタリングするエンドポイントのモデルバリアントを選択します。

1. **[統計]** では、選択したメトリクスで利用できる統計を 1 つ選択します。

1. **[期間]** では、各統計値の計算に使用する期間を選択します。たとえば、平均統計と 5 分間の期間を選択した場合、アラームによって監視される各データポイントは、5 分間隔でのメトリックのデータポイントの平均になります。

1. **[評価期間]** には、アラーム状態を開始するかどうかを評価する際にアラームが考慮するデータポイントの数を入力します。

1. **[条件]** では、アラームのしきい値として使用する条件を選択します。

1. **[しきい値]** には、希望するしきい値を入力します。

1. (オプション) **[通知]** では、**[通知の追加]** を選択して、アラームの状態が変化したときに通知を受け取る Amazon SNS トピックを作成または指定できます。

1. [**アラームの作成**] を選択します。

アラームを作成したら、いつでも **[アラーム]** タブに戻ってステータスを確認できます。このセクションから、アラームを選択して **[編集]** または **[削除]** を選択することもできます。