

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Alarmes et journaux pour le suivi des métriques provenant des points de terminaison sans serveur
<a name="serverless-endpoints-monitoring"></a>

Pour contrôler votre point de terminaison sans serveur, vous pouvez utiliser les alarmes Amazon CloudWatch. CloudWatch est un service qui collecte des métriques en temps réel à partir de vos applications et ressources AWS. Une alarme contrôle les métriques au fur et à mesure qu’elles sont collectées et vous donne la possibilité de préspécifier un seuil et les actions à entreprendre si ce seuil est dépassé. Par exemple, votre alarme CloudWatch peut vous envoyer une notification si votre point de terminaison dépasse un seuil d’erreur. En configurant des alarmes CloudWatch, vous gagnez en visibilité sur les performances et les fonctionnalités de votre point de terminaison. Pour plus d’informations sur les alarmes CloudWatch, consultez [Utilisation d’alarmes Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) dans le *Guide de l’utilisateur Amazon CloudWatch*.

## Surveillance avec CloudWatch
<a name="serverless-endpoints-monitoring-metrics"></a>

Voici une liste exhaustive des métriques pour les points de terminaison sans serveur. Toute métrique non répertoriée ci-dessous n’est pas publiée pour les points de terminaison sans serveur. Pour en savoir plus sur les métriques suivantes, consultez [Surveillance d’Amazon SageMaker AI avec Amazon CloudWatch](https://docs.aws.amazon.com/sagemaker/latest/dg/monitoring-cloudwatch.html).

### Métriques de point de terminaison courantes
<a name="serverless-endpoints-monitoring-metrics-common"></a>

Ces métriques CloudWatch sont les mêmes que celles publiées pour les points de terminaison en temps réel.

La métrique `OverheadLatency` suit toute la latence supplémentaire ajoutée par SageMaker AI, y compris le temps de démarrage à froid de lancement de nouvelles ressources de calcul pour votre point de terminaison sans serveur. Comparé aux points de terminaison sans serveur à la demande, la `OverheadLatency` des points de terminaison sans serveur dotés de la simultanéité provisionnée est généralement nettement inférieure.

Les points de terminaison sans serveur peuvent également utiliser les métriques `Invocations4XXErrors`, `Invocations5XXErrors`, `Invocations`, `ModelLatency`, `ModelSetupTime` et `MemoryUtilization`. Pour en savoir plus sur ces mesures, consultez [SageMaker Métriques d'invocation des terminaux AI](monitoring-cloudwatch.md#cloudwatch-metrics-endpoint-invocation).

### Métriques de point de terminaison sans serveur courantes
<a name="serverless-endpoints-monitoring-metrics-serverless"></a>

Ces métriques CloudWatch sont publiées à la fois pour les points de terminaison sans serveur à la demande et pour les points de terminaison sans serveur avec la simultanéité provisionnée.


| Nom de la métrique | Description | Unité/Statistiques | 
| --- | --- | --- | 
| ServerlessConcurrentExecutionsUtilization | Le nombre d’exécutions simultanées divisé par la simultanéité maximum. | Unités : aucuneStatistiques valides : moyenne, maximum, minimum | 

### Métriques d’un point de terminaison sans serveur avec la simultanéité provisionnée
<a name="serverless-endpoints-monitoring-metrics-serverless-pc"></a>

Ces métriques CloudWatch sont publiées pour les points de terminaison sans serveur avec la simultanéité provisionnée.


| Nom de la métrique | Description | Unité/Statistiques | 
| --- | --- | --- | 
| ServerlessProvisionedConcurrencyExecutions | Le nombre d’exécutions simultanées gérées par le point de terminaison. | Unités : nombreStatistiques valides : moyenne, maximum, minimum | 
| ServerlessProvisionedConcurrencyUtilization | Le nombre d’exécutions simultanées divisé par la simultanéité provisionnée allouée. | Unités : aucuneStatistiques valides : moyenne, maximum, minimum | 
| ServerlessProvisionedConcurrencyInvocations | Le nombre de demandes InvokeEndpoint traitées par la simultanéité provisionnée. | Unités : nombreStatistiques valides : moyenne, maximum, minimum | 
| ServerlessProvisionedConcurrencySpilloverInvocations | Le nombre de demandes InvokeEndpoint non traitées par la simultanéité provisionnée, qui sont gérées par u à la demande. | Unités : nombreStatistiques valides : moyenne, maximum, minimum | 

## Journaux
<a name="serverless-endpoints-monitoring-logs"></a>

Si vous souhaitez contrôler les journaux de votre point de terminaison pour le débogage ou l’analyse de la progression, vous pouvez utiliser Amazon CloudWatch Logs. Le groupe de journaux fourni par SageMaker AI que vous pouvez utiliser pour les points de terminaison sans serveur est `/aws/sagemaker/Endpoints/[EndpointName]`. Pour plus d’informations sur l’utilisation de CloudWatch Logs dans SageMaker AI, consultez [CloudWatch Journaux pour Amazon SageMaker AI](logging-cloudwatch.md). Pour en savoir plus sur CloudWatch Logs, consultez [Qu’est-ce qu’Amazon CloudWatch Logs ?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/WhatIsCloudWatchLogs.html) dans le *Guide de l’utilisateur Amazon CloudWatch Logs*.