Alarmes ProMQL - Amazon CloudWatch

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Alarmes ProMQL

Une alarme ProMQL surveille les métriques à l'aide d'une requête instantanée Prometheus Query Language (ProMQL). La requête sélectionne les métriques ingérées via le point de terminaison CloudWatch OTLP, et toutes les séries chronologiques correspondantes renvoyées par la requête sont considérées comme des violations. L'alarme évalue la requête à intervalles réguliers et suit chaque série chronologique de violation indépendamment en tant que contributeur.

Pour plus d'informations sur l'ingestion de métriques à l'aide OpenTelemetry de. OpenTelemetry

Comment fonctionnent les alarmes ProMQL

Une alarme ProMQL évalue une requête instantanée ProMQL selon un calendrier récurrent défini par le. EvaluationInterval La requête renvoie uniquement les séries chronologiques qui répondent à la condition. Chaque série chronologique renvoyée est un contributeur, identifié par son ensemble unique d'attributs.

L'alarme utilise des transitions d'état basées sur la durée :

  • Lorsqu'un contributeur est renvoyé par la requête, cela est considéré comme une violation. Si le contributeur continue à violer pendant la durée spécifiée parPendingPeriod, il passe à l'ALARMétat.

  • Lorsqu'un contributeur cesse d'être renvoyé par la requête, il est considéré comme rétabli. Si le contributeur reste absent pendant la durée spécifiée parRecoveryPeriod, il revient à OK l'état.

L'alarme est déclenchée lorsqu'ALARMau moins un contributeur enfreint les règles depuis plus longtemps que la période d'attente. L'alarme revient à OK l'état lorsque tous les contributeurs sont rétablis.

Configuration de l'alarme ProMQL

Une alarme ProMQL est configurée avec les paramètres suivants :

  • PendingPeriodest la durée en secondes qu'un contributeur doit continuellement dépasser avant de passer à ALARM l'état. Cela équivaut à la durée de la règle d'alerte Prometheus. for

  • RecoveryPeriodest la durée en secondes pendant laquelle un contributeur doit arrêter de violer avant de revenir à OK l'état. Cela équivaut à la durée de la règle d'alerte Prometheus. keep_firing_for

  • EvaluationIntervalest la fréquence, en secondes, à laquelle l'alarme évalue la requête ProMQL.

Pour créer une alarme ProMQL, consultez. Création d'une alarme à l'aide d'une requête ProMQL