

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Points de terminaison
<a name="realtime-endpoints-manage"></a>

Après avoir déployé votre modèle sur un point de terminaison, vous souhaiterez peut-être afficher et gérer le point de terminaison. Avec SageMaker AI, vous pouvez consulter l’état et les détails de votre point de terminaison, consulter les journaux et métriques pour surveiller les performances de votre point de terminaison, mettre à jour les modèles déployés sur votre point de terminaison, etc.

Les sections suivantes montrent comment vous pouvez gérer les points de terminaison dans Amazon SageMaker Studio ou dans la AWS Management Console.

La page suivante explique comment afficher et modifier vos points de terminaison de manière interactive à l’aide de la console Amazon SageMaker AI ou de SageMaker Studio.

**Topics**
+ [

# Affichage des détails sur les points de terminaison dans SageMaker Studio
](manage-endpoints-studio.md)
+ [

# Affichage des détails de votre point de terminaison dans la console SageMaker AI
](manage-endpoints-console.md)

# Affichage des détails sur les points de terminaison dans SageMaker Studio
<a name="manage-endpoints-studio"></a>

Dans Amazon SageMaker Studio, vous pouvez afficher et gérer vos points de terminaison de l’hébergement SageMaker AI. Pour en savoir plus sur Studio, consultez [Amazon SageMaker Studio](https://docs.aws.amazon.com/sagemaker/latest/dg/studio.html).

Pour trouver la liste de vos points de terminaison dans SageMaker Studio, procédez comme suit :

1. Ouvrez l’application Studio.

1. Dans le panneau de navigation de gauche, sélectionnez **Déploiements**.

1. Dans le menu déroulant, sélectionnez **Points de terminaison**.

La page **Points de terminaison** s’ouvre et répertorie tous vos points de terminaison de l’hébergement SageMaker AI. Sur cette page, vous pouvez voir les points de terminaison et leur **statut**. Vous pouvez également créer un nouveau point de terminaison, modifier un point de terminaison existant ou supprimer un point de terminaison.

Pour voir les détails d’un point de terminaison spécifique, choisissez-en un dans la liste. Sur la page de détails du point de terminaison, vous obtenez une vue d’ensemble similaire à la capture d’écran suivante.

![\[Capture d’écran de la page principale d’un point de terminaison présentant un résumé des détails du point de terminaison dans Studio.\]](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/images/inference/studio-endpoint-details-page.png)


La page des détails sur chaque point de terminaison contient les onglets d’informations suivants :

# Afficher les variantes (ou les modèles)
<a name="manage-endpoints-studio-variants"></a>

L’onglet **Variantes** (également appelé onglet **Modèles** si plusieurs modèles sont déployés sur votre point de terminaison) affiche la liste des [variantes de modèles](https://docs.aws.amazon.com/sagemaker/latest/dg/model-ab-testing.html) ou des modèles actuellement déployés sur votre point de terminaison. La capture d’écran suivante vous montre à quoi ressemble l’aperçu et la section **Modèles** pour un point de terminaison avec plusieurs modèles déployés.

![\[Capture d’écran de la page principale d’un point de terminaison montrant plusieurs modèles déployés.\]](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/images/inference/studio-goldfinch-multi-model-endpoint.png)


Vous pouvez ajouter ou modifier les paramètres pour chaque variante ou modèle. Vous pouvez également sélectionner une variante et activer une politique d’autoscaling par défaut, que vous pourrez modifier ultérieurement dans l’onglet **Autoscaling**.

# Afficher les paramètres
<a name="manage-endpoints-studio-settings"></a>

Dans l’onglet **Paramètres**, vous pouvez afficher le rôle IAM AWS associé au point de terminaison, la clé AWS KMS utilisée pour le chiffrement (le cas échéant), le nom de votre VPC et les paramètres d’isolement réseau.

# Tester l’inférence
<a name="manage-endpoints-studio-test"></a>

Dans l’onglet **Tester l’inférence**, vous pouvez envoyer une demande d’inférence de test à un modèle déployé. Cela est utile si vous souhaitez vérifier que votre point de terminaison répond aux demandes comme prévu.

Pour tester l’inférence, procédez comme suit :

1. Dans l’onglet **Tester l’inférence** du modèle, choisissez l’une des options suivantes :

   1. Sélectionnez **Entrer le corps de la requête** si vous souhaitez tester le point de terminaison et recevoir une réponse via l’interface Studio.

   1. Sélectionnez **Copier un exemple de code (Python)** si vous souhaitez copier un exemple AWS SDK pour Python (Boto3) que vous pouvez utiliser pour invoquer votre point de terminaison depuis un environnement local et recevoir une réponse par programmation.

1. Dans **Modèle**, sélectionnez le modèle que vous voulez tester sur le point de terminaison.

1. Si vous avez choisi la méthode de test de l’interface Studio, vous pouvez également choisir le **type de contenu** souhaité pour la réponse dans la liste déroulante.

Après avoir configuré votre requête, vous pouvez choisir **Envoyer la requête** (pour recevoir une réponse via l’interface Studio) ou **Copier** pour copier l’exemple Python.

Si vous recevez une réponse via l’interface de Studio, elle ressemblera à la capture d’écran suivante.

![\[Capture d’écran d’une demande d’inférence de test réussie sur un point de terminaison dans Studio.\]](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/images/inference/endpoint-test-inference.png)


# Scalabilité automatique
<a name="manage-endpoints-studio-autoscaling"></a>

Dans l’onglet **Autoscaling**, vous pouvez consulter toutes les politiques d’autoscaling configurées pour les modèles hébergés sur votre point de terminaison. La capture d’écran suivante montre l’onglet **Autoscaling**.

![\[Capture d’écran de l’onglet Autoscaling, montrant une politique active.\]](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/images/inference/studio-endpoint-autoscaling.png)


Vous pouvez choisir **Modifier l’autoscaling** pour modifier l’une des politiques et activer ou désactiver la politique d’autoscaling par défaut.

Pour en savoir plus sur l’autoscaling pour les points de terminaison en temps réel, consultez [Mise à l’échelle automatique des modèles Amazon SageMaker AI](https://docs.aws.amazon.com/sagemaker/latest/dg/endpoint-auto-scaling.html). Si vous ne savez pas comment configurer une politique d’autoscaling pour votre point de terminaison, vous pouvez utiliser une [tâche de recommandations d’autoscaling d’Inference Recommender](https://docs.aws.amazon.com/sagemaker/latest/dg/inference-recommender-autoscaling.html) pour obtenir des recommandations pour une politique d’autoscaling.

# Affichage des détails de votre point de terminaison dans la console SageMaker AI
<a name="manage-endpoints-console"></a>

Pour afficher vos points de terminaison dans la console SageMaker AI, procédez comme suit :

1. Accédez à la console SageMaker AI à l’adresse [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Dans le panneau de navigation de gauche, sélectionnez **Inférence**.

1. Choisissez **Points de terminaison** dans la liste déroulante.

1. Sur la page **Points de terminaison**, choisissez votre point de terminaison.

La page détaillée du point de terminaison devrait s’ouvrir pour afficher un résumé de votre point de terminaison et des métriques collectées pour celui-ci.

Les sections suivantes décrivent les onglets sur la page des détails des points de terminaison.

# Surveillance des points de terminaison
<a name="manage-endpoints-console-monitoring"></a>

Après avoir créé un point de terminaison d’hébergement SageMaker AI, vous pouvez surveiller votre point de terminaison à l’aide d’Amazon CloudWatch, qui collecte et traite les données brutes pour les transformer en métriques lisibles en quasi temps réel. Ces métriques vous permettent d’accéder aux informations d’historique et d’obtenir un meilleur point de vue sur les performances de votre point de terminaison. Pour plus d’informations, consultez le *[Guide de l’utilisateur Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/)*.

Dans l’onglet **Surveillance** de la page détaillée du point de terminaison, vous pouvez consulter les données des métriques CloudWatch collectées depuis votre point de terminaison.

L’onglet **Surveillance** comprend les sections suivantes :
+ **Métriques opérationnelles** : consultez les métriques qui suivent l’utilisation des ressources de votre point de terminaison, telles que Utilisation de la CPU et Utilisation de la mémoire.
+ **Métriques d’invocation** : consultez les métriques qui suivent le nombre, l’état de santé et le statut des demandes `InvokeEndpoint` arrivant sur votre point de terminaison, telles que Erreurs du modèle d’invocation et Latence du modèle.
+ **Métriques de santé** : consultez les métriques qui suivent l’état de santé général de votre point de terminaison, telles que Échecs d’invocation et Échecs de notification.

Pour une description détaillée de chaque métrique, consultez [Surveillance de SageMaker AI avec CloudWatch](https://docs.aws.amazon.com/sagemaker/latest/dg/monitoring-cloudwatch.html).

La capture d’écran suivante illustre la section **Métriques opérationnelles** pour un point de terminaison sans serveur.

![\[Capture d’écran des graphiques de métriques dans la section Métriques opérationnelles de la page détaillée du point de terminaison.\]](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/images/hosting-operational-metrics.png)




Vous pouvez ajuster les paramètres **Période** et **Statistique** que vous souhaitez suivre pour les métriques d’une section donnée, ainsi que la durée pendant laquelle vous souhaitez consulter les données de métriques. Vous pouvez également ajouter et retirer des widgets de métrique de la vue pour chaque section en choisissant **Ajouter un gadget**. Dans la boîte de dialogue **Ajouter un gadget**, vous pouvez sélectionner et désélectionner les métriques que vous souhaitez voir.

Les métriques disponibles peuvent dépendre de votre type de point de terminaison. Par exemple, les points de terminaison sans serveur ont certaines métriques qui ne sont pas disponibles pour les points de terminaison en temps réel. Pour obtenir des informations plus spécifiques sur les métriques par type de point de terminaison, consultez les pages suivantes :
+ [Surveillance d’un point de terminaison sans serveur](https://docs.aws.amazon.com/sagemaker/latest/dg/serverless-endpoints-monitoring.html)
+ [Surveillance d’un point de terminaison asynchrone](https://docs.aws.amazon.com/sagemaker/latest/dg/async-inference-monitor.html)
+ [Métriques CW pour les déploiements de points de terminaison multimodèles](https://docs.aws.amazon.com/sagemaker/latest/dg/multi-model-endpoint-cloudwatch-metrics.html)
+ [Journaux et métriques des pipelines d’inférence](https://docs.aws.amazon.com/sagemaker/latest/dg/inference-pipeline-logs-metrics.html)

# Paramètres
<a name="manage-endpoints-console-settings"></a>

Vous pouvez cliquer sur l’onglet **Paramètres** pour afficher des informations supplémentaires sur votre point de terminaison, telles que les paramètres de capture de données, la configuration du point de terminaison et les balises.

# Création et affichage d’alarmes
<a name="manage-endpoints-console-alarms"></a>

À partir de l’onglet **Alarmes** de la page détaillée de votre point de terminaison, vous pouvez afficher et créer des alarmes de métrique de seuil statique simples, dans lesquelles vous spécifiez une valeur de seuil pour une métrique. Si la métrique dépasse la valeur de seuil, l’alarme passe à l’état `ALARM`. Pour plus d’informations relatives à la configuration des alarmes CloudWatch, consultez [Utilisation des alarmes Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html).

Dans la section **Résumé du point de terminaison**, vous pouvez consulter le champ **Alarmes**, qui indique le nombre d’alarmes actuellement actives sur votre point de terminaison.

Pour voir quelles alarmes sont à l’état `ALARM`, cliquez sur l’onglet **Alarmes**. L’onglet **Alarmes** affiche la liste complète des alarmes de votre point de terminaison, ainsi que des détails sur leur statut et leurs conditions. La capture d’écran suivante illustre la liste des alarmes de cette section qui ont été configurées pour un point de terminaison.

![\[Capture d’écran de l’onglet Alarmes sur la page détaillée du point de terminaison, qui affiche la liste des alarmes CloudWatch.\]](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/images/hosting-alarms-tab.png)


Le statut d’une alarme peut être `In alarm`, `OK` ou `Insufficient data` si les données de métrique collectées ne sont pas suffisantes.

Pour créer une alarme pour votre point de terminaison, procédez comme suit :

1. Dans l’onglet **Alarmes**, choisissez **Créer une alarme**.

1. La page **Créer une alarme** s’ouvre. Pour **Nom de l’alarme**, saisissez un nom pour l’alarme.

1. (Facultatif) Entrez une description de l’alarme.

1. Pour **Métrique**, choisissez la métrique CloudWatch qui sera suivie par l’alarme.

1. Pour **Nom de la variante**, choisissez la variante du modèle de point de terminaison que vous souhaitez surveiller.

1. Pour **Statistique**, choisissez l’une des statistiques disponibles pour la métrique que vous avez sélectionnée.

1. Pour **Période**, choisissez la période à utiliser pour calculer chaque valeur statistique. Par exemple, si vous choisissez la statistique Moyenne et une période de 5 minutes, chaque point de données surveillé par l’alarme est la moyenne des points de données de la métrique à intervalles de 5 minutes.

1. Pour **Périodes d’évaluation**, entrez le nombre de points de données que vous souhaitez que l’alarme prenne en compte lorsqu’elle détermine si elle doit passer ou non à l’état d’alarme.

1. Pour **Condition**, choisissez la condition que vous souhaitez utiliser pour votre seuil d’alarme.

1. Pour **Valeur du seuil**, entrez la valeur souhaitée pour votre seuil.

1. (Facultatif) Pour **Notification**, vous pouvez choisir **Ajouter une notification** pour créer ou spécifier une rubrique Amazon SNS qui reçoit une notification lorsque l’état de votre alarme change.

1. Sélectionnez **Créer une alerte**.

Après avoir créé votre alarme, vous pouvez revenir à l’onglet **Alarmes** pour voir son statut à tout moment. Dans cette section, vous pouvez également sélectionner l’alarme et la **modifier** ou la **supprimer**.