Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
PromQL-Alarme
Ein PromQL-Alarm überwacht Metriken mithilfe einer Sofortabfrage der Prometheus Query Language (PromQL). Die Abfrage wählt Metriken aus, die über den CloudWatch OTLP-Endpunkt aufgenommen wurden, und alle übereinstimmenden Zeitreihen, die von der Abfrage zurückgegeben werden, gelten als fehlerhaft. Der Alarm wertet die Abfrage in regelmäßigen Intervallen aus und verfolgt jede Zeitreihe, bei der ein Verstoß vorliegt, unabhängig voneinander als Mitverursacher.
Hinweise zur Erfassung von Metriken mithilfe von OpenTelemetry OpenTelemetry
Wie funktionieren PromQL-Alarme
Ein PromQL-Alarm wertet eine PromQL-Sofortabfrage nach einem wiederkehrenden Zeitplan aus, der von der definiert wird. EvaluationInterval Die Abfrage gibt nur die Zeitreihen zurück, die die Bedingung erfüllen. Jede zurückgegebene Zeitreihe ist ein Mitwirkender, der durch ihren eindeutigen Satz von Attributen identifiziert wird.
Der Alarm verwendet Zustandsübergänge, die auf der Dauer basieren:
-
Wenn bei der Abfrage ein Mitwirkender zurückgegeben wird, gilt dies als Verstoß. Wenn der Mitwirkende den Verstoß für die von angegebene Dauer fortsetzt
PendingPeriod, wechselt der Mitwirkende in den Status.ALARM -
Wenn ein Mitwirkender nicht mehr von der Abfrage zurückgegeben wird, wird davon ausgegangen, dass er wiederhergestellt wurde. Bleibt der Mitwirkende für die von angegebene Dauer abwesend
RecoveryPeriod, wechselt der Mitwirkende in den Status zurück.OK
Der ALARM Alarmzustand ist aktiviert, wenn mindestens ein Mitwirkender länger als die Wartezeit gegen die Vorschriften verstößt. Der Alarm kehrt in den OK Zustand zurück, wenn sich alle Mitwirkenden erholt haben.
PromQL-Alarm-Konfiguration
Ein PromQL-Alarm wird mit den folgenden Parametern konfiguriert:
-
PendingPeriodist die Dauer in Sekunden, die ein Mitwirkender kontinuierlich überschreiten muss, bevor der Mitwirkende in den Status wechselt.
ALARMDies entspricht der Dauer der Prometheus-Warnregel.for -
RecoveryPeriodist die Dauer in Sekunden, die ein Mitwirkender beenden muss, bevor der Mitwirkende wieder in den Status wechselt.
OKDies entspricht der Dauer der Prometheus-Warnregel.keep_firing_for -
EvaluationIntervalgibt an, wie oft, in Sekunden, der Alarm die PromQL-Abfrage auswertet.
Informationen zum Erstellen eines PromQL-Alarms finden Sie unter. Erstellen Sie einen Alarm mit einer PromQL-Abfrage