Regeln für die Stummschaltung - Amazon CloudWatch

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Regeln für die Stummschaltung

Bei den Regeln für die Stummschaltung von Alarmen handelt es sich um eine CloudWatch Funktion, mit der Sie Alarmaktionen in vordefinierten Zeitfenstern automatisch stummschalten können. Wenn Sie eine Stummschaltungsregel erstellen, definieren Sie bestimmte Zeiträume und Zielalarme, deren Aktionen stummgeschaltet werden. CloudWatch überwacht und bewertet weiterhin Alarmzustände und verhindert gleichzeitig unerwünschte Benachrichtigungen oder automatische Alarmaktionen bei erwarteten Betriebsereignissen.

Regeln zur Stummschaltung von Alarmen helfen Ihnen bei der Bewältigung kritischer Betriebsszenarien, in denen Alarmaktionen unnötig oder störend wären. So können Sie beispielsweise während der geplanten Wartungsfenster automatische Alarmaktionen verhindern, während Ihre Systeme absichtlich offline sind oder zu erwartende Probleme auftreten, sodass Sie Wartungsarbeiten ohne Unterbrechungen durchführen können. Für den Betrieb außerhalb der Geschäftszeiten, wie z. B. an Wochenenden oder Feiertagen, können Sie unkritische Alarmaktionen stummschalten, wenn keine sofortige Reaktion erforderlich ist. Dadurch werden Alarmgeräusche und unnötige Benachrichtigungen an Ihr Betriebsteam reduziert. In Testumgebungen ermöglichen Stummschaltungsregeln das vorübergehende Stummschalten von Alarmaktionen in Szenarien wie Auslastungstests, in denen ein hoher Ressourcenverbrauch oder hohe Fehlerraten zu erwarten sind und keine sofortige Bearbeitung erforderlich ist. Wenn Ihr Team aktiv Probleme behebt, können Sie mithilfe von Stummschaltungsregeln verhindern, dass doppelte Alarmaktionen ausgelöst werden, sodass Sie sich auf die Lösung konzentrieren können, ohne sich von redundanten Alarmmeldungen ablenken zu lassen.

Regeln zum Stummschalten von Alarmen

Regeln für die Stummschaltung von Alarmen können wie folgt definiert werden: Regeln und Ziele.

  • Regeln — definieren Sie die Zeitfenster, in denen Alarmaktionen stummgeschaltet werden sollen. Regeln bestehen aus drei Attributen:

    • Ausdruck — Definiert, wann die Stummschaltungsperiode beginnt und wie sie sich wiederholt. Sie können zwei Arten von Ausdrücken verwenden:

      • Cron-Ausdrücke — Verwenden Sie die Standard-Cron-Syntax, um wiederkehrende Mute-Fenster zu erstellen. Dieser Ansatz ist ideal für regelmäßige Wartungspläne, z. B. wöchentliche Systemupdates oder tägliche Backup-Operationen. Mithilfe von Cron-Ausdrücken können Sie komplexe wiederkehrende Muster angeben, einschließlich bestimmter Wochentage, Monate oder Uhrzeiten.

        Syntax für den Cron-Ausdruck

        ┌───────────── minute (0 - 59) │ ┌───────────── hour (0 - 23) │ │ ┌───────────── day of the month (1 - 31) │ │ │ ┌───────────── month (1 - 12) (or JAN-DEC) │ │ │ │ ┌───────────── day of the week (0 - 6) (0 or 7 is Sunday, or MON-SUN) │ │ │ │ │ │ │ │ │ │ * * * * *
        • Die Zeichen*,,, - werden in allen Feldern unterstützt.

        • Englische Namen können für die Felder month (JAN-DEC) und day of week (SUN-SAT) verwendet werden

      • AT-Ausdrücke — Verwenden Sie AT-Ausdrücke für einmaliges Stummschalten von Fenstern. Dieser Ansatz eignet sich gut für geplante betriebliche Ereignisse, die einmal zu einem bekannten Zeitpunkt auftreten.

        Syntax: `at(yyyy-MM-ddThh:mm)`
    • Dauer — Gibt an, wie lange die Stummschaltungsregel nach ihrer Aktivierung gültig ist. Die Dauer muss im ISO-8601-Format mit mindestens 1 Minute (PT1M) und maximal 15 Tagen (P15D) angegeben werden.

    • Zeitzone — Gibt die Zeitzone an, in der das Stummschaltfenster gemäß den Ausdrücken angewendet wird, wobei Standardzeitzonenbezeichner wie "“ verwendet werden. America/Los_Angeles" or "Europe/London

  • Ziele — geben Sie die Liste der Alarmnamen an, deren Aktionen während der definierten Zeitfenster stummgeschaltet werden. Sie können sowohl metrische Alarme als auch zusammengesetzte Alarme in Ihre Zielliste aufnehmen.

Sie können optional Start- und Endzeitstempel hinzufügen, um zusätzliche Grenzen für Ihre Mute-Fenster festzulegen. Startzeitstempel stellen sicher, dass Stummschaltungsregeln nicht vor einem bestimmten Datum und einer bestimmten Uhrzeit aktiviert werden, während Endzeitstempel verhindern, dass Regeln nach dem angegebenen Datum und der angegebenen Uhrzeit angewendet werden.

Weitere Informationen zum programmgesteuerten Erstellen von Regeln für die Stummschaltung von Alarmen finden Sie unter. PutAlarmMuteRule

Anmerkung
  • Die gezielten Alarme müssen in derselben Datei AWS-Konto und in derselben Datei vorhanden sein, AWS-Region in der die Stummschaltungsregel erstellt wurde.

  • Eine einzelne Regel zum Stummschalten von Alarmen kann bis zu 100 Alarme anhand der Alarmnamen als Ziel festlegen.

Die CloudWatch Konsole enthält eine spezielle Registerkarte „Regeln für die Stummschaltung von Alarmen“, über die Sie alle Stummschaltungsregeln in Ihrem System zentral verwalten können AWS-Konto. Sie können mithilfe der Attribute für die Stummschaltung, wie z. B. den Regelnamen, nach bestimmten Regeln für die Stummschaltung suchen.

Status der Regel stummschalten

Nach der Erstellung kann sich eine Regel zum Stummschalten von Alarmen in einem der folgenden drei Status befinden:

  • GEPLANT — Die Stummschaltungsregel wird zu einem future Zeitpunkt gemäß dem konfigurierten Zeitfensterausdruck aktiv.

  • AKTIV — Die Stummschaltungsregel ist derzeit gemäß dem konfigurierten Zeitfensterausdruck aktiv und schaltet gezielte Alarmaktionen aktiv stumm.

  • ABGELAUFEN — Die Stummschaltungsregel wird in future nicht SCHEDULED/ACTIVE mehr gelten. Dies tritt bei einmaligen Stummschaltungsregeln auf, nachdem das Stummschaltungsfenster abgelaufen ist, oder bei wiederkehrenden Stummschaltungsregeln, wenn ein Endzeitstempel konfiguriert ist und diese Zeit abgelaufen ist.

Auswirkungen von Stummschaltungsregeln auf Alarme

Wenn während eines aktiven Mute-Fensters der Status eines gezielten Alarms geändert wird und Aktionen konfiguriert sind, wird die Ausführung dieser Aktionen CloudWatch stummgeschaltet. Stummschaltungen werden nur auf Alarmaktionen angewendet, was bedeutet, dass Alarme weiterhin ausgewertet werden und Statusänderungen in der CloudWatch Konsole sichtbar sind, konfigurierte Aktionen wie Amazon Simple Notification Service-Benachrichtigungen, Amazon Elastic Compute Cloud Auto Scaling Scaling-Aktionen oder Amazon EC2 EC2-Aktionen jedoch nicht ausgeführt werden können. CloudWatch wertet Alarmzustände während der gesamten Stummschaltungsperiode weiterhin normal aus, und Sie können diese Informationen im Alarmverlauf einsehen.

Wenn ein Stummschaltfenster endet und der oder die gezielten Alarme sich in einem Alarmzustand (OK/ALARM/INSUFFICIENT_DATA) befinden, werden die Alarmaktionen, die während des Fensters stummgeschaltet waren, CloudWatch automatisch erneut ausgelöst. Dadurch wird sichergestellt, dass Ihre Alarmaktionen bei laufenden Problemen nach Ablauf der geplanten Stummschaltungsperiode ausgeführt werden, wodurch die Integrität Ihres Überwachungssystems gewahrt bleibt.

Anmerkung

Wenn Sie einen Alarm stummschalten:

  • Alle Aktionen, die mit den gezielten Alarmen verknüpft sind, sind stummgeschaltet

  • Aktionen, die allen Alarmzuständen (OK, ALARM und INSUFFICIENT_DATA) zugeordnet sind, sind stummgeschaltet

Informationen zum Anzeigen und Verwalten von stummgeschalteten Alarmen finden Sie unter. Stummgeschaltete Alarme anzeigen und verwalten

Beispielpläne für allgemeine Anwendungsfälle

Die folgenden Beispiele zeigen, wie Zeitfensterausdrücke für allgemeine Anwendungsfälle konfiguriert werden.

Szenario 1: Stummschalten von Alarmaktionen während geplanter Wartungsfenster — Regelmäßige Wartungsaktivitäten, die nach einem vorhersehbaren Zeitplan ausgeführt werden, z. B. System- oder Datenbankaktualisierungen, wenn Dienste absichtlich nicht verfügbar sind oder im eingeschränkten Modus betrieben werden.

  • Cron-Ausdruck 0 2 * * SUN mit Dauer PT4H — Schaltet Alarme jeden Sonntag von 2:00 Uhr bis 6:00 Uhr für wöchentliche Systemwartungen stumm.

  • Cron-Ausdruck 0 1 1 * * mit Dauer PT6H — Schaltet Alarme am ersten Tag eines jeden Monats von 1:00 Uhr bis 7:00 Uhr für die monatliche Datenbankwartung stumm.

Szenario 2: Stummschalten unkritischer Alarme außerhalb der Geschäftszeiten — Verringerung der Alarmmüdigkeit an Wochenenden oder Feiertagen, wenn keine unmittelbare Aufmerksamkeit erforderlich ist.

  • Cron-Ausdruck 0 18 * * FRI mit Dauer P2DT12H — Schaltet Alarme an jedem Wochenende von Freitag 18:00 Uhr bis Montag 6:00 Uhr stumm.

Szenario 3: Stummschalten von Leistungsalarmen bei täglichen Backup-Vorgängen — Tägliche automatisierte Backup-Prozesse, die vorübergehend die Ressourcenauslastung erhöhen und in vorhersehbaren Zeitfenstern leistungsbezogene Alarme auslösen können.

  • Cron-Ausdruck 0 23 * * * mit Dauer PT2H — Schaltet bei nächtlichen Backup-Vorgängen, die vorübergehend die Festplatten- und CPU-Auslastung erhöhen, täglich von 23:00 Uhr bis 1:00 Uhr Alarme stumm. I/O

Szenario 4: Stummschalten doppelter Alarme während aktiver Fehlerbehebungssitzungen — Vorübergehendes Stummschalten von Alarmaktionen, während die Teams aktiv Probleme untersuchen und lösen, wodurch Störgeräusche vermieden und Probleme gezielt gelöst werden können.

  • Bei Ausdruck at(2024-05-10T14:00) mit Dauer PT4H — Schaltet Alarme am 10. Mai 2024 von 14:00 Uhr bis 18:00 Uhr während einer aktiven Incident-Response-Sitzung stumm.

Szenario 5: Stummschalten von Alarmaktionen bei geplanten Unternehmensstillständen — Einmalige verlängerte Wartungsperioden oder unternehmensweite Abschaltungen, bei denen alle Systeme absichtlich für längere Zeiträume offline sind.

  • Bei Auslösung at(2024-12-23T00:00) mit Dauer P7D — Schaltet während der jährlichen Betriebsunterbrechung Alarme für die gesamte Woche vom 23. bis 29. Dezember 2024 stumm.