

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Utilisez CloudWatch des métriques pour surveiller les ressources Amazon Managed Service for Prometheus
<a name="AMP-CW-usage-metrics"></a>

Amazon Managed Service for Prometheus envoie des statistiques d'utilisation à. CloudWatch Ces métriques fournissent une visibilité sur l’utilisation de votre espace de travail. Les métriques vendues se trouvent dans les `AWS/Prometheus` espaces de noms `AWS/Usage` et dans. CloudWatch Ces statistiques sont disponibles CloudWatch gratuitement. Pour plus d’informations sur les métriques, consultez [Métriques d’utilisation d’CloudWatch ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Usage-Metrics.html).


| CloudWatch nom de la métrique | Nom de la ressource | CloudWatch espace de noms | Description | 
| --- | --- | --- | --- | 
| ResourceCount\* | CreateAlertManagerAlertsTPS | `AWS/Usage` | Le nombre maximum d'opérations d'`CreateAlertManagerAlerts`API par seconde, par espace de travail | 
| ResourceCount\* | DeleteAlertManagerSilencesTPS | `AWS/Usage` | Le nombre maximum d'opérations d'`DeleteAlertManagerSilences`API par seconde, par espace de travail | 
| ResourceCount\* | GetAlertManagerSilenceTPS | `AWS/Usage` | Le nombre maximum d'opérations d'`GetAlertManagerSilence`API par seconde, par espace de travail | 
| ResourceCount\* | GetAlertManagerStatusTPS | `AWS/Usage` | Le nombre maximum d'opérations d'`GetAlertManagerStatus`API par seconde, par espace de travail | 
| ResourceCount\* | GetLabelsTPS | `AWS/Usage` | Le nombre maximum d'opérations d'`GetLabels`API par seconde, par espace de travail | 
| ResourceCount\* | GetMetricMetadataTPS | `AWS/Usage` | Le nombre maximum d'opérations d'`GetMetricMetadata`API par seconde, par espace de travail | 
| ResourceCount\* | GetSeriesTPS | `AWS/Usage` | Le nombre maximum d'opérations d'`GetSeries`API par seconde, par espace de travail | 
| ResourceCount | InhibitionRulesInAlertManagerDefinition | `AWS/Usage` | Nombre maximal de règles d’inhibition dans le fichier de définition du gestionnaire d’alertes. | 
| ResourceCount\* | ListAlertManagerAlertGroupInfosTPS | `AWS/Usage` | Le nombre maximum d'opérations d'`ListAlertManagerAlertGroupInfos`API par seconde, par espace de travail | 
| ResourceCount\* | ListAlertManagerAlertGroupsTPS | `AWS/Usage` | Le nombre maximum d'opérations d'`ListAlertManagerAlertGroups`API par seconde, par espace de travail | 
| ResourceCount\* | ListAlertManagerAlertsTPS | `AWS/Usage` | Le nombre maximum d'opérations d'`ListAlertManagerAlerts`API par seconde, par espace de travail | 
| ResourceCount\* | ListAlertManagerReceiversTPS | `AWS/Usage` | Le nombre maximum d'opérations d'`ListAlertManagerReceivers`API par seconde, par espace de travail | 
| ResourceCount\* | ListAlertManagerSilencesTPS | `AWS/Usage` | Le nombre maximum d'opérations d'`ListAlertManagerSilences`API par seconde, par espace de travail | 
| ResourceCount\* | ListAlertsTPS | `AWS/Usage` | Le nombre maximum d'opérations d'`ListAlerts`API par seconde, par espace de travail | 
| ResourceCount\* | ListRulesTPS | `AWS/Usage` | Le nombre maximum d'opérations d'`ListRules`API par seconde, par espace de travail | 
| ResourceCount\* | PutAlertManagerSilencesTPS | `AWS/Usage` | Le nombre maximum d'opérations d'`PutAlertManagerSilences`API par seconde, par espace de travail | 
| ResourceCount | HAReplicaGroupCount | `AWS/Usage` | Nombre de groupes de répliques à haute disponibilité | 
| ResourceCount\* | QueryMetricsTPS | `AWS/Usage` | Opérations de requête par seconde | 
| ResourceCount\* | RemoteWriteTPS | `AWS/Usage` | Opérations d'écriture à distance par seconde | 
| ResourceCount | ActiveAlerts | `AWS/Usage` | Nombre d’alertes actives par espace de travail<br />Unités : nombre<br />Statistiques valides : moyenne, minimale, maximale | 
| ResourceCount | ActiveSeries | `AWS/Usage` | Nombre de séries actives par espace de travail<br />Unités : nombre<br />Statistiques valides : moyenne, minimale, maximale | 
| ResourceCount | AlertAggregationGroupSize | `AWS/Usage` | Taille maximale d’un groupe d’agrégation d’alertes dans le fichier de définition du gestionnaire d’alertes. Chaque combinaison de valeurs d'étiquette `group_by` créerait un groupe d'agrégation. | 
| ResourceCount | AlertManagerDefinitionSizeBytes | `AWS/Usage` | Taille maximale d'un fichier de définition du gestionnaire d'alertes, en octets. | 
| ResourceCount | AllSilences | `AWS/Usage` | Nombre maximum de silences, y compris les silences expirés, actifs et en attente, par espace de travail. | 
| ResourceCount | IngestionRate | `AWS/Usage` | Taux d’ingestion d’échantillons<br />Unités : nombre par seconde<br />Statistiques valides : moyenne, minimale, maximale | 
| ResourceCount | RuleEvaluationInterval | `AWS/Usage` | Intervalle minimal d'évaluation des règles | 
| ResourceCount | RuleGroupNamespaceDefinitionSizeBytes | `AWS/Usage` | Taille maximale d'un fichier de définition d'espace de noms de groupe de règles, en octets. | 
| ResourceCount | TemplatesInAlertManagerDefinition | `AWS/Usage` | Nombre maximal de modèles dans le fichier de définition du gestionnaire d’alertes. | 
| ResourceCount | WorkspaceCount | `AWS/Usage` | Le nombre maximum d'espaces de travail par région, par compte. | 
| ResourceCount | SizeOfAlerts | `AWS/Usage` | Taille totale de toutes les alertes de l'espace de travail, en octets<br />Unités : octets<br />Statistiques valides : moyenne, minimale, maximale | 
| ResourceCount | SuppressedAlerts | `AWS/Usage` | Nombre d’alertes supprimées par espace de travail. Une alerte peut être supprimée par un silence ou une inhibition.<br />Unités : nombre<br />Statistiques valides : moyenne, minimale, maximale | 
| ResourceCount | UnprocessedAlerts | `AWS/Usage` | Nombre d’alertes non traitées par espace de travail. Une alerte n'est pas traitée une fois qu'elle est reçue par AlertManager, mais elle attend la prochaine évaluation du groupe d'agrégation.<br />Unités : nombre<br />Statistiques valides : moyenne, minimale, maximale | 
| ResourceCount | AllAlerts | `AWS/Usage` | Nombre d'alertes par espace de travail, quel que soit l'état<br />Unités : nombre<br />Statistiques valides : moyenne, minimale, maximale | 
| ResourceCount | AllRules | `AWS/Usage` | Nombre de règles par état par espace de travail<br />Unités : nombre<br />Statistiques valides : moyenne, minimale, maximale | 
| ActiveSeriesPerLabelSet |  - | `AWS/Prometheus` | L'utilisation actuelle de la série active pour chaque jeu d'étiquettes défini par l'utilisateur<br />Unités : nombre<br />Statistiques valides : moyenne, minimum, maximum, somme | 
| ActiveSeriesLimitPerLabelSet |  - | `AWS/Prometheus` | La valeur limite de série active actuelle pour chaque jeu d'étiquettes défini par l'utilisateur<br />Unités : nombre<br />Statistiques valides : moyenne, minimum, maximum, somme | 
| AlertManagerAlertsReceived |  - | `AWS/Prometheus` | Nombre total d'alertes réussies reçues par le gestionnaire d'alertes<br />Unités : nombre<br />Statistiques valides : moyenne, minimum, maximum, somme | 
| AlertManagerNotificationsFailed |  - | `AWS/Prometheus` | Nombre de livraisons d’alertes ayant échoué<br />Unités : nombre<br />Statistiques valides : moyenne, minimum, maximum, somme | 
| AlertManagerNotificationsThrottled |  - | `AWS/Prometheus` | Nombre d’alertes bloquées<br />Unités : nombre<br />Statistiques valides : moyenne, minimum, maximum, somme | 
| AnomalyDetectors | WorkspaceId | `AWS/Prometheus` | Nombre total de détecteurs d'anomalies pour un espace de travail donné<br />Unités : nombre<br />Statistiques valides : moyenne, minimale, maximale | 
| AnomalyDetectorEvaluations | WorkspaceId, AnomalyDetectorId | `AWS/Prometheus` | Nombre total d'évaluations de détecteurs d'anomalies<br />Unités : nombre<br />Statistiques valides : moyenne, minimum, maximum, somme | 
| AnomalyDetectorEvaluationFailures | WorkspaceId, AnomalyDetectorId | `AWS/Prometheus` | Nombre de défaillances des détecteurs d'anomalies dans l'intervalle<br />Unités : nombre<br />Statistiques valides : moyenne, minimum, maximum, somme | 
| AnomalyDetectorLastEvaluationDuration | WorkspaceId, AnomalyDetectorId | `AWS/Prometheus` | Durée de la dernière évaluation d'un détecteur d'anomalies<br />Unités : secondes<br />Statistiques valides : moyenne, minimum, maximum, somme | 
| AnomalyDetectorMissedEvaluations | WorkspaceId, AnomalyDetectorId | `AWS/Prometheus` | Nombre d'évaluations de détecteurs d'anomalies manquées dans l'intervalle<br />Unités : nombre<br />Statistiques valides : moyenne, minimum, maximum, somme | 
| DiscardedSamples\*\* |  - | `AWS/Prometheus` | Nombre d’échantillons rejetés par motif<br />Unités : nombre<br />Statistiques valides : moyenne, minimum, maximum, somme | 
| DiscardedSeries\*\* |  - | `AWS/Prometheus` | Nombre de séries contenant un échantillon jeté pour des raisons<br />Unités : nombre<br />Statistiques valides : moyenne, minimum, maximum, somme | 
| DiscardedSamplesPerLabelSet |  - | `AWS/Prometheus` | Le nombre d'échantillons rejetés pour chaque jeu d'étiquettes défini par l'utilisateur<br />Unités : nombre<br />Statistiques valides : moyenne, minimum, maximum, somme | 
| DiscardedSeriesPerLabelSet |  - | `AWS/Prometheus` | Nombre de séries contenant un échantillon jeté pour chaque jeu d'étiquettes défini par l'utilisateur<br />Unités : nombre<br />Statistiques valides : moyenne, minimum, maximum, somme | 
| IngestionRatePerLabelSet |  - | `AWS/Prometheus` | Le taux d'ingestion pour chaque jeu d'étiquettes défini par l'utilisateur<br />Unités : nombre<br />Statistiques valides : moyenne, minimum, maximum, somme | 
| QuerySamplesProcessed |  - | `AWS/Prometheus` | Nombre d'échantillons de requêtes traités<br />Unités : nombre<br />Statistiques valides : moyenne, minimum, maximum, somme | 
| RuleEvaluations |  - | `AWS/Prometheus` | Nombre total d’évaluations de règles<br />Unités : nombre<br />Statistiques valides : moyenne, minimum, maximum, somme | 
| RuleEvaluationFailures |  - | `AWS/Prometheus` | Nombre d’échecs d’évaluation des règles dans l’intervalle<br />Unités : nombre<br />Statistiques valides : moyenne, minimum, maximum, somme | 
| RuleGroupIterationsMissed |  - | `AWS/Prometheus` | Nombre d’itérations de groupes de règles manquées dans l’intervalle.<br />Unités : nombre<br />Statistiques valides : moyenne, minimum, maximum, somme | 
| RuleGroupLastEvaluationDuration |  - | `AWS/Prometheus` | Durée de la dernière évaluation d'un groupe de règles.<br />Unités : secondes<br />Statistiques valides : moyenne, minimum, maximum, somme | 

\* Les métriques TPS sont générées toutes les minutes et sont une moyenne par seconde sur cette minute. Les courtes périodes de rafale ne seront pas capturées dans les métriques TPS.

\*\* Certaines des raisons pour lesquelles les échantillons sont jetés sont les suivantes. Les raisons ci-dessous n'apparaissent pas toutes dans la DiscardedSeries métrique.


|  Raison  |  Signification  | 
| --- | --- | 
| greater\_than\_max\_sample\_age | Jeter les échantillons datant de plus d'une heure. | 
| new-value-for-timestamp | Les échantillons dupliqués sont envoyés avec le même horodatage que l'échantillon précédent, mais avec des valeurs différentes. | 
| per\_labelset\_series\_limit | L'utilisateur a atteint le nombre total de séries actives par limite définie d'étiquettes. | 
| per\_metric\_series\_limit | L'utilisateur a atteint la limite de séries actives par métrique. | 
| per\_user\_series\_limit | L'utilisateur a atteint la limite du nombre total de séries actives. | 
| rate\_limited | Taux d'ingestion limité. | 
| sample-out-of-order | Les échantillons sont envoyés hors commande et ne peuvent pas être traités. | 
| label\_value\_too long | La valeur de l'étiquette est supérieure à la limite de caractères autorisée. | 
| max\_label\_names\_per\_series | L'utilisateur a sélectionné les noms des libellés par métrique. | 
| missing\_metric\_name | Le nom de la métrique n'est pas fourni. | 
| metric\_name\_invalid | Le nom de métrique fourni n'est pas valide. | 
| label\_invalid | Libellé fourni non valide. | 
| duplicate\_label\_names | Des noms d'étiquettes dupliqués ont été fournis. | 

**Note**  
Une métrique inexistante ou manquante est identique à la valeur de cette métrique égale à 0.

**Note**  
`RuleGroupIterationsMissed`, `RuleEvaluations``RuleEvaluationFailures`, et `RuleGroupLastEvaluationDuration` ont la `RuleGroup` dimension de la structure suivante :   
{{RuleGroupNamespace}};{{RuleGroup}}

## Régler une CloudWatch alarme sur les métriques vendues par Prometheus
<a name="AMP-CW-examples"></a>

Vous pouvez surveiller l'utilisation des ressources Prometheus à l'aide d'alarmes. CloudWatch 

**Pour régler une alarme sur le nombre de **ActiveSeries** dans Prometheus**

1. Choisissez l'onglet **Graphed metrics** et faites défiler l'écran vers le bas jusqu'à l'**ActiveSeries**étiquette.

   Dans la vue **Graphed metrics**, seules les métriques actuellement ingérées apparaissent.

1. Sélectionnez l’icône de **notification** dans la colonne **Actions**.

1. Dans **Specify metric and conditions**, entrez la condition de seuil dans le champ **Conditions value** et choisissez **Suivant**.

1. Dans **Configure actions**, sélectionnez une rubrique SNS existante ou créez-en une nouvelle à laquelle envoyer la notification.

1. Dans **Add name and description**, ajoutez le nom de l’alarme et une description facultative.

1. Sélectionnez **Créer une alerte**.