

# Überwachung
<a name="a-monitoring"></a>

**Topics**
+ [LEIST 7 Wie lassen sich Ressourcen überwachen, um sicherzustellen, dass sie funktionieren?](w2aac19c11b9b5.md)

# LEIST 7 Wie lassen sich Ressourcen überwachen, um sicherzustellen, dass sie funktionieren?
<a name="w2aac19c11b9b5"></a>

 Die Systemleistung kann sich mit der Zeit verschlechtern. Überwachen Sie die Systemleistung, um eine Verschlechterung frühzeitig zu erkennen und ihr entgegenzuwirken, etwa indem Sie interne oder externe Faktoren wie das Betriebssystem oder die Anwendungslast korrigieren. 

**Topics**
+ [PERF07-BP01 Erfassen von Leistungsmetriken](perf_monitor_instances_post_launch_record_metrics.md)
+ [PERF07-BP02 Analysieren Sie Metriken bei Eintreten von Ereignissen oder Vorfällen](perf_monitor_instances_post_launch_review_metrics.md)
+ [PERF07-BP03 Legen Sie wichtige Leistungskennzahlen (KPIs) zum Messen der Workload-Leistung fest](perf_monitor_instances_post_launch_establish_kpi.md)
+ [PERF07-BP04 Generieren alarmbasierter Benachrichtigungen per Überwachungssystem](perf_monitor_instances_post_launch_generate_alarms.md)
+ [PERF07-BP05 Regelmäßiges Überprüfen von Metriken](perf_monitor_instances_post_launch_review_metrics_collected.md)
+ [PERF07-BP06 Proaktives Überwachen und Benachrichtigen](perf_monitor_instances_post_launch_proactive.md)

# PERF07-BP01 Erfassen von Leistungsmetriken
<a name="perf_monitor_instances_post_launch_record_metrics"></a>

 Verwenden Sie einen Überwachungs- und Beobachtungs-Service, um leistungsbezogene Metriken aufzuzeichnen. Metriken umfassen beispielsweise Datenbanktransaktionen, langsame Abfragen, I/O-Latenz, den Durchsatz von HTTP-Anforderungen, Servicelatenz und andere wichtige Daten. 

 Identifizieren Sie die für Ihren Workload relevanten Leistungskennzahlen und erfassen Sie sie. Diese Daten sind von wesentlicher Bedeutung, um festzustellen, welche Komponenten sich auf die Gesamtleistung und Effizienz Ihrer Workload auswirken. 

 Ermitteln Sie anhand des Kundenerlebnisses, auf welche Kennzahlen es ankommt. Identifizieren Sie für jede Kennzahl Ziel, Messverfahren und Priorität. Konfigurieren Sie darauf aufbauend Alarme und Benachrichtigungen, die eine proaktive Behandlung von Leistungsproblemen ermöglichen. 

 **Gängige Antimuster:** 
+  Sie überwachen nur Metriken auf Betriebssystemebene, um Einblicke in Ihre Workload zu erhalten. 
+  Sie legen Ihre Rechenbedürfnisse auf Workload-Anforderungen zu Spitzenzeiten aus. 

 **Vorteile der Einführung dieser bewährten Methode:** Um Leistung und Ressourcenauslastung zu optimieren, benötigen Sie einen Gesamtüberblick über Ihre wichtigsten Leistungsindikatoren. Sie können Dashboards erstellen und Metrikberechnungen für Ihre Daten durchführen, um Einblicke in Betrieb und Nutzung zu erhalten. 

 **Risikostufe, wenn diese bewährte Methode nicht eingeführt wird:** Hoch 

## Implementierungsleitfaden
<a name="implementation-guidance"></a>

 Identifizieren Sie die für Ihre Workload relevanten Leistungsmetriken und erfassen Sie sie. Anhand dieser Daten können Sie feststellen, welche Komponenten sich auf die Gesamtleistung oder Effizienz Ihrer Workload auswirken. 

 Leistungsmetriken identifizieren: Ermitteln Sie anhand der Kundenerfahrungen die wichtigsten Metriken. Identifizieren Sie für jede Kennzahl Ziel, Messverfahren und Priorität. Nutzen Sie diese Datenpunkte, um Alarme und Benachrichtigungen zu konfigurieren, die eine proaktive Behandlung von Leistungsproblemen ermöglichen. 

## Ressourcen
<a name="resources"></a>

 **Ähnliche Dokumente:** 
+  [CloudWatch-Dokumentation](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
+  [Erfassen von Metriken und Protokollen aus Amazon EC2-Instances und On-Premises-Servern mit dem CloudWatch Agent](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html?ref=wellarchitected) 
+  [Veröffentlichen von benutzerdefinierten Metriken](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/publishingMetrics.html?ref=wellarchitected) 
+  [Überwachung, Protokollierung und Leistung von APN-Partnern](https://aws.amazon.com/devops/partner-solutions/#_Monitoring.2C_Logging.2C_and_Performance) 
+  [X-Ray-Dokumentation](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 
+  [Amazon CloudWatch RUM](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-RUM.html) 

 **Ähnliche Videos:** 
+  [Ende des Chaos: Transparenz und Einblick in den Betrieb (MGT301-R1)](https://www.youtube.com/watch?v=nLYGbotqHd0) 
+  [Verwaltung der Anwendungsleistung in AWS](https://www.youtube.com/watch?v=5T4stR-HFas&ref=wellarchitected) 
+  [Erstellen eines Überwachungsplans](https://www.youtube.com/watch?v=OMmiGETJpfU&ref=wellarchitected) 

 **Ähnliche Beispiele:** 
+  [Level 100: Monitoring with CloudWatch Dashboards (Stufe 100: Überwachung mit Cloudwatch-Dashboards)](https://wellarchitectedlabs.com/performance-efficiency/100_labs/100_monitoring_with_cloudwatch_dashboards/) 
+  [Level 100: Monitoring Windows EC2 instance with CloudWatch Dashboards (Stufe 100: Überwachung einer Windows-EC2-Instance mit Cloudwatch-Dashboards)](https://wellarchitectedlabs.com/performance-efficiency/100_labs/100_monitoring_windows_ec2_cloudwatch/) 
+  [Level 100: Monitoring an Amazon Linux EC2 instance with CloudWatch Dashboards (Stufe 100: Überwachung einer Amazon-Linux-EC2-Instance mit Cloudwatch-Dashboards)](https://wellarchitectedlabs.com/performance-efficiency/100_labs/100_monitoring_linux_ec2_cloudwatch/) 

# PERF07-BP02 Analysieren Sie Metriken bei Eintreten von Ereignissen oder Vorfällen
<a name="perf_monitor_instances_post_launch_review_metrics"></a>

 Ziehen Sie während eines Ereignisses oder Vorfalls oder als Reaktion darauf Überwachungs-Dashboards oder Berichte heran, um die Auswirkungen nachzuvollziehen und zu diagnostizieren. Diese Ansichten bieten Einblick in die Bereiche der Workload, die nicht die erwartete Leistung liefern. 

 Berücksichtigen Sie beim Beschreiben kritischer Benutzerszenarien für Ihre Architektur die Leistungsanforderungen. Geben Sie beispielsweise an, wie schnell die einzelnen kritischen Szenarien ausgeführt werden sollen. Implementieren Sie zusätzliche skriptbasierte Benutzerreisen in diese Szenarien, damit Sie genau wissen, wie sich die Leistung dieser Szenarien im Vergleich zu Ihren Anforderungen verhält. 

 **Gängige Antimuster:** 
+  Sie gehen davon aus, dass Leistungsereignisse einmalige Probleme sind und sich nur auf Anomalien beziehen. 
+  Vorhandene Leistungsmetriken werden nur ausgewertet, wenn Sie auf Leistungsereignisse reagieren. 

 **Vorteile der Einführung dieser bewährten Methode:** Um festzustellen, ob Ihre Workload auf erwartetem Niveau ausgeführt wird, müssen Sie auf Leistungsereignisse reagieren, indem Sie zusätzliche Metrikdaten für die Analyse erfassen. Diese Daten werden verwendet, um die Auswirkungen des Performance-Ereignisses zu verstehen und Änderungen zur Verbesserung der Workload-Leistung vorzuschlagen. 

 **Risikostufe, wenn diese bewährte Methode nicht eingeführt wird:** Hoch 

## Implementierungsleitfaden
<a name="implementation-guidance"></a>

 Negativen Erlebnissen Priorität einräumen und kritische Benutzerszenarien beschreiben: Berücksichtigen Sie beim Beschreiben kritischer Benutzerszenarien für Ihre Architektur die Leistungsanforderungen. Geben Sie beispielsweise an, wie schnell die einzelnen kritischen Szenarien ausgeführt werden sollen. Implementieren Sie zusätzliche skriptbasierte Benutzerreisen in diese kritischen Szenarien, damit Sie genau wissen, wie sich deren Leistung im Vergleich zu Ihren Anforderungen verhält. 

## Ressourcen
<a name="resources"></a>

 **Ähnliche Dokumente:** 
+  [CloudWatch-Dokumentation](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
+  [Amazon CloudWatch Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html) 
+  [Überwachung, Protokollierung und Leistung von APN-Partnern](https://aws.amazon.com/devops/partner-solutions/#_Monitoring.2C_Logging.2C_and_Performance) 
+  [X-Ray-Dokumentation](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 

 **Ähnliche Videos:** 
+  [Ende des Chaos: Transparenz und Einblick in den Betrieb (MGT301-R1)](https://www.youtube.com/watch?v=nLYGbotqHd0) 
+  [Optimize applications through Amazon CloudWatch RUM (Optimieren von Anwendungen mithilfe von CW RUM)](https://www.youtube.com/watch?v=NMaeujY9A9Y) 
+  [Demo von Amazon CloudWatch Synthetics](https://www.youtube.com/watch?v=hF3NM9j-u7I) 

 **Ähnliche Beispiele:** 
+  [Messen der Seitenladezeit mit Amazon CloudWatch Synthetics](https://github.com/aws-samples/amazon-cloudwatch-synthetics-page-performance) 
+  [Amazon CloudWatch RUM Web Client](https://github.com/aws-observability/aws-rum-web) 

# PERF07-BP03 Legen Sie wichtige Leistungskennzahlen (KPIs) zum Messen der Workload-Leistung fest
<a name="perf_monitor_instances_post_launch_establish_kpi"></a>

 Identifizieren Sie die KPIs, die die Workload-Leistung quantitativ und qualitativ messen. Mithilfe von KPIs können Sie die Integrität einer Workload im Verhältnis zu einem Geschäftsziel messen. KPIs helfen dabei, Business- und Entwicklungsteams die Messung von Zielen und Strategien abzustimmen und wie diese gemeinsam zu Geschäftsergebnissen beitragen. KPIs sollten erneut aufgegriffen werden, wenn sich Geschäftsziele, Strategien oder Anforderungen von Endbenutzern ändern.   

 Beispielsweise könnte eine Website-Workload die Ladezeit der Seite als Indikator für die Gesamtleitstung heranziehen. Diese Metrik wäre einer von mehreren Datenpunkten, die ein Endbenutzererlebnis messen. Zusätzlich zum Ermitteln der Grenzwerte für Seitenladezeiten sollten Sie das gewünschte Resultat dokumentieren bzw. das Geschäftsrisiko, wenn die Leistung nicht erreicht wird. Die lange Ladezeit einer Seite würde Ihre Endbenutzer direkt betreffen, die Bewertung ihres Benutzererlebnisses verringern und könnte zu einem Verlust von Kunden führen. Kombinieren Sie beim Definieren Ihrer KPI-Grenzwerte die Benchmarks der Branche und die Erwartungen Ihrer Endbenutzer. Beispielsweise, wenn die aktuelle Benchmark der Branche das Laden einer Webseite innerhalb von zwei Sekunden ist, Ihre Endbenutzer aber erwarten, dass eine Webseite innerhalb von einer Minute geladen wird, sollten Sie beim Einrichten des KPI beide Datenpunkte in Betracht ziehen. Ein weiteres Beispiel für eine KPI könnte der Fokus auf das Erfüllen von internen Leistungsanforderungen sein. Ein KPI-Grenzwert kann beim Erstellen von Vertriebsberichten innerhalb eines Tages, nachdem die Produktionsdaten erstellt wurden, eingerichtet werden. Diese Berichte beeinflussen möglicherweise direkt tägliche Entscheidungen und Geschäftsergebnisse.  

 **Gewünschtes Ergebnis:** Das Einführen von KPIs umfasst unterschiedliche Abteilungen und Stakeholder. Ihr Team muss Ihre Workload-KPIs mithilfe von detaillierten Echtzeitdaten und historischen Daten als Referenz evaluieren und Dashboards erstellen, die Metrikberechnungen für Ihre KPI-Daten durchführen, um Einblicke in Betrieb und Auslastung zu erhalten. KPIs sollten dokumentiert werden, sodass die vereinbarten KPIs und Grenzwerte, die Geschäftsziele und -strategien unterstützen, erklärt werden und den Metriken zugeordnet sind, die überwacht werden. Die KPIs identifizieren Leistungsanforderungen, werden absichtlich überprüft und häufig mit allen Teams geteilt und besprochen. Risiken und Kompromisse werden klar erkannt und es ist ersichtlich, wie das Geschäft beeinträchtigt wird, wenn KPI-Grenzwerte nicht erreicht werden. 

 **Gängige Antimuster:** 
+  Sie überwachen nur Metriken auf Systemebene, um Erkenntnisse über Ihre Workload zu gewinnen, und verstehen den geschäftlichen Einfluss dieser Metriken nicht. 
+  Sie gehen davon aus, dass Ihre KPIs bereits als standardmäßige Metrikdaten veröffentlicht und geteilt werden. 
+  Sie definieren KPIs, teilen Sie aber nicht mit allen Teams. 
+  Sie definieren keinen quantitativen, messbaren KPI. 
+  Sie richten KPIs nicht an Geschäftszielen oder -strategien aus. 

 

 **Vorteile der Einführung dieser bewährten Methode:** Das Identifizieren von bestimmten Metriken, die die Workload-Integrität darstellen, helfen Teams dabei, sich an ihren Prioritäten auszurichten und Geschäftsergebnisse erfolgreich zu definieren. Das Teilen dieser Metriken mit allen Abteilungen bietet Sichtbarkeit und die Ausrichtung an Grenzwerten, Erwartungen und Geschäftsauswirkungen. 

 **Risikostufe, wenn diese bewährte Methode nicht eingeführt wird:** Hoch 

## Implementierungsleitfaden
<a name="implementation-guidance"></a>

 Alle Abteilungen und Geschäftsteams, die von der Integrität der Workload betroffen sind, sollten an der Definition der KPIs mitwirken. Eine einzelne Person sollte für die Zusammenarbeit, Zeitpläne, Dokumentation und Informationen in Bezug auf die KPIs eines Unternehmens zuständig sein. Dieser einzelne Eigentümer teilt häufig die Geschäftsziele und -strategien mit und weist Business-Stakeholdern Aufgaben zu, um KPIs in deren jeweiligen Abteilungen zu erstellen. Sobald KPIs definiert wurden, hilft das dem Betriebsteam oft beim Festlegen der Metriken, die in den Erfolg von unterschiedlichen KPIs einfließen und ihn unterstützen. KPIs sind nur dann wirksam, wenn sich alle Teammitglieder, die eine Workload unterstützten, der KPIs bewusst sind. 

 **Implementierungsschritte** 

1.  Identifizieren und dokumentieren Sie Business-Stakeholder. 

1.  Identifizieren Sie Unternehmensziele und -strategien. 

1.  Überprüfen Sie in der Branche gängige KPIs, die zu den Zielen und Strategien Ihres Unternehmens passen. 

1.  Überprüfen Sie die Erwartungen von Endbenutzern an Ihre Workload. 

1.  Definieren und dokumentieren Sie KPIs, die Ihre Unternehmensziele und -strategien unterstützen. 

1.  Identifizieren und dokumentieren Sie Kompromissstrategien zum Erreichen der KPIs. 

1.  Identifizieren und dokumentieren Sie Metriken, die in die KPIs einfließen. 

1.  Identifizieren und dokumentieren Sie KPI-Schwellenwerte für Schweregrad oder Alarmebene. 

1.  Identifizieren und dokumentieren Sie das Risiko und die Auswirkungen, wenn die KPIs nicht erreicht werden. 

1.  Identifizieren Sie die Überprüfungshäufigkeit pro KPI. 

1.  Kommunizieren Sie die KPI-Dokumentation allen Teams, die die Workload unterstützen. 

** Grad des Aufwands für den Implementierungsplan:** Das Definieren und Kommunizieren von KPIs stellt einen *niedrigen* Arbeitsaufwand dar. Dies erfolgt üblicherweise innerhalb von einigen Wochen durch Treffen mit Stakeholdern und dem Überprüfen von Zielen, Strategien und Workload-Metriken.

## Ressourcen
<a name="resources"></a>

 **Ähnliche Dokumente:** 
+ [CloudWatch-Dokumentation ](http://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
+  [Überwachung, Protokollierung und Leistung von APN-Partnern](https://aws.amazon.com/devops/partner-solutions/#_Monitoring.2C_Logging.2C_and_Performance) 
+ [X-Ray-Dokumentation ](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 
+  [Verwendung von Amazon CloudWatch-Dashboards](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html?ref=wellarchitected) 
+  [Quick-KPIs](https://docs.aws.amazon.com/quicksight/latest/user/kpi.html) 

 **Ähnliche Videos:** 
+  [AWS re:Invent 2019: Erweitern Sie den Umfang auf Ihre ersten 10 Millionen Benutzer (ARC211)](https://www.youtube.com/watch?v=kKjm4ehYiMs&ref=wellarchitected) 
+  [Ende des Chaos: Transparenz und Einblick in den Betrieb (MGT301-R1)](https://www.youtube.com/watch?v=nLYGbotqHd0&ref=wellarchitected) 
+  [Erstellen eines Überwachungsplans](https://www.youtube.com/watch?v=OMmiGETJpfU&ref=wellarchitected) 

 

 **Ähnliche Beispiele:** 
+  [Erstellen eines Dashboards mit Quick](https://github.com/aws-samples/amazon-quicksight-sdk-proserve) 

# PERF07-BP04 Generieren alarmbasierter Benachrichtigungen per Überwachungssystem
<a name="perf_monitor_instances_post_launch_generate_alarms"></a>

 Verwenden Sie basierend auf den von Ihnen definierten leistungsbezogenen wichtigen Kennzahlen (KPIs) ein Überwachungssystem, bei dem Alarme automatisch generiert werden, wenn sich die Messwerte außerhalb der erwarteten Grenzen bewegen. 

 Mit Amazon CloudWatch lassen sich Kennzahlen aus sämtlichen Ressourcen Ihrer Architektur erfassen. Sie können auch benutzerdefinierte Kennzahlen erfassen und in Oberflächen-, Geschäfts- oder abgeleiteten Kennzahlen veröffentlichen. Legen Sie mit CloudWatch oder einem Überwachungsservice eines Drittanbieters Alarme fest, die bei Überschreitung bestimmter Schwellenwerte ausgelöst werden – mit einem solchen Alarm wird darauf hingewiesen, dass sich eine Metrik außerhalb des erwarteten Bereichs befindet. 

 **Gängige Antimuster:** 
+  Sie verlassen sich darauf, dass die Mitarbeiter Metriken überwachen und reagieren, wenn ein Problem auftritt. 
+  Sie verlassen sich ausschließlich auf betriebsbereite Runbooks, wenn Serverless-Workflows ausgelöst werden könnten, um dieselbe Aufgabe zu erledigen. 

 **Vorteile der Einführung dieser bewährten Methode:** Sie können Alarme festlegen und Aktionen basierend auf vordefinierten Schwellenwerten oder Algorithmen für Machine Learning automatisieren, die anormales Verhalten in Ihren Metriken identifizieren. Dieselben Alarme können auch Serverless-Workflows auslösen, die Leistungsmerkmale Ihrer Workload ändern können (z. B. Erhöhung der Rechenkapazität, Änderung der Datenbankkonfiguration). 

 **Risikostufe, wenn diese bewährte Methode nicht eingeführt wird:** Mittel 

## Implementierungsleitfaden
<a name="implementation-guidance"></a>

 Überwachen von Metriken: Mithilfe von Amazon CloudWatch lassen sich Kennzahlen aus sämtlichen Ressourcen Ihrer Architektur erfassen. Sie können benutzerdefinierte Metriken erfassen und veröffentlichen, um geschäftliche oder abgeleitete Metriken zu ermitteln. Richten Sie mit CloudWatch oder Überwachungsservices von Drittanbietern Alarme ein, die auf das Überschreiten von Schwellenwerten hinweisen. 

## Ressourcen
<a name="resources"></a>

 **Ähnliche Dokumente:** 
+  [CloudWatch-Dokumentation](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
+  [Überwachung, Protokollierung und Leistung von APN-Partnern](https://aws.amazon.com/devops/partner-solutions/#_Monitoring.2C_Logging.2C_and_Performance) 
+  [X-Ray-Dokumentation](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 
+  [Verwendung von Alarmen und Alarmaktionen in CloudWatch](https://docs.aws.amazon.com/sdk-for-go/v1/developer-guide/cw-example-using-alarm-actions.html) 

 **Ähnliche Videos:** 
+  [AWS re:Invent 2019: Erweitern Sie den Umfang auf Ihre ersten 10 Millionen Benutzer (ARC211)](https://www.youtube.com/watch?v=kKjm4ehYiMs&ref=wellarchitected) 
+  [Ende des Chaos: Transparenz und Einblick in den Betrieb (MGT301-R1)](https://www.youtube.com/watch?v=nLYGbotqHd0&ref=wellarchitected) 
+  [Erstellen eines Überwachungsplans](https://www.youtube.com/watch?v=OMmiGETJpfU&ref=wellarchitected) 
+  [Verwenden von AWS Lambda mit Amazon CloudWatch Events](https://www.youtube.com/watch?v=WDBD3JmpLqs) 

 **Ähnliche Beispiele:** 
+  [Cloudwatch-Protokolle: Konfigurieren von Alarmen](https://github.com/awslabs/cloudwatch-logs-customize-alarms) 

# PERF07-BP05 Regelmäßiges Überprüfen von Metriken
<a name="perf_monitor_instances_post_launch_review_metrics_collected"></a>

 Überprüfen Sie als routinemäßige Wartungsmaßnahme oder als Reaktion auf Ereignisse oder Vorfälle, welche Kennzahlen erfasst werden. Ermitteln Sie anhand dieser Überprüfung, welche Metriken für die Behebung von Problemen wesentlich waren und welche zusätzlichen Kennzahlen hilfreich wären, um Probleme zu identifizieren, zu beheben oder zu verhindern. 

 Bewerten Sie beim Reagieren auf Vorfälle oder Ereignisse diejenigen Kennzahlen, die hilfreich für die Behebung des Problems waren, und überlegen Sie, welche derzeit noch nicht verfolgten Kennzahlen förderlich sein könnten. Verbessern Sie auf diese Weise die Qualität der erfassten Metriken, damit Sie zukünftige Probleme verhindern oder schneller beheben können. 

 **Gängige Antimuster:** 
+  Sie lassen zu, dass Metriken für einen längeren Zeitraum im Alarmstatus bleiben. 
+  Sie erstellen Alarme, die von einem Automatisierungssystem nicht umsetzbar sind. 

 **Vorteile der Einführung dieser bewährten Methode:** Überprüfen Sie kontinuierlich Metriken, die erfasst werden, um sicherzustellen, dass sie Probleme ordnungsgemäß identifizieren, beheben oder verhindern. Metriken können auch veralten, wenn sie für einen längeren Zeitraum im Alarmstatus bleiben. 

 **Risikostufe, wenn diese bewährte Methode nicht eingeführt wird:** Mittel 

## Implementierungsleitfaden
<a name="implementation-guidance"></a>

 Erfassung und Überwachung von Kennzahlen kontinuierlich verbessern: Bewerten Sie beim Reagieren auf Vorfälle oder Ereignisse diejenigen Kennzahlen, die hilfreich für die Behebung des Problems waren, und überlegen Sie, welche derzeit noch nicht verfolgten Kennzahlen förderlich sein könnten. Verbessern Sie auf diese Weise die Qualität der erfassten Metriken, damit Sie zukünftige Probleme verhindern oder schneller beheben können. 

## Ressourcen
<a name="resources"></a>

 **Ähnliche Dokumente:** 
+  [CloudWatch-Dokumentation](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
+  [Erfassen von Metriken und Protokollen aus Amazon EC2-Instances und On-Premises-Servern mit dem CloudWatch Agent](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html?ref=wellarchitected) 
+  [Überwachung, Protokollierung und Leistung von APN-Partnern](https://aws.amazon.com/devops/partner-solutions/#_Monitoring.2C_Logging.2C_and_Performance) 
+  [X-Ray-Dokumentation](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 

 **Ähnliche Videos:** 
+  [Ende des Chaos: Transparenz und Einblick in den Betrieb (MGT301-R1)](https://www.youtube.com/watch?v=nLYGbotqHd0) 
+  [Verwaltung der Anwendungsleistung in AWS](https://www.youtube.com/watch?v=5T4stR-HFas&ref=wellarchitected) 
+  [Erstellen eines Überwachungsplans](https://www.youtube.com/watch?v=OMmiGETJpfU&ref=wellarchitected) 

 **Ähnliche Beispiele:** 
+  [Erstellen eines Dashboards mit Quick](https://github.com/aws-samples/amazon-quicksight-sdk-proserve) 
+  [Level 100: Monitoring with CloudWatch Dashboards (Stufe 100: Überwachung mit Cloudwatch-Dashboards)](https://wellarchitectedlabs.com/performance-efficiency/100_labs/100_monitoring_with_cloudwatch_dashboards/) 

# PERF07-BP06 Proaktives Überwachen und Benachrichtigen
<a name="perf_monitor_instances_post_launch_proactive"></a>

 Verwenden Sie wichtige Leistungskennzahlen (KPIs) in Kombination mit Überwachungs- und Warnsystemen, um eine proaktive Behandlung leistungsbezogener Probleme zu ermöglichen. Verwenden Sie Alarme, um automatisierte Aktionen auszulösen und auf diese Weise Probleme nach Möglichkeit zu beheben. Leiten Sie den Alarm an die Personen weiter, die die richtigen Maßnahmen einleiten können, falls keine automatisierte Reaktion möglich ist. Beispielsweise können Sie ein System nutzen, das erwartete Werte wichtiger Leistungskennzahlen (KPIs) prognostiziert und bei Überschreiten bestimmter Schwellenwerte einen Alarm ausgibt. Denkbar ist auch ein Tool, das Bereitstellungen automatisch anhält oder zurücksetzt, wenn sich KPIs außerhalb der erwarteten Werte befinden. 

 Implementieren Sie Prozesse, die Ihnen Einblick in die Leistung gewähren, während Ihr Workload ausgeführt wird. Entwickeln Sie Dashboards für die Überwachung und legen Sie Leistungsnormen in Form von Grundwerten fest, um zu bestimmen, ob die Workload optimal funktioniert. 

 **Gängige Antimuster:** 
+  Sie geben dem Betriebspersonal nur die Möglichkeit, betriebliche Änderungen an der Workload vorzunehmen. 
+  Sie lassen alle Alarme ohne proaktive Behebung zum Betriebsteam filtern. 

 **Vorteile der Einführung dieser bewährten Methode:** Die proaktive Behebung von Alarmaktionen ermöglicht es dem Support-Personal, sich auf die Elemente zu konzentrieren, die nicht automatisch umsetzbar sind. Auf diese Weise wird sichergestellt, dass das Betriebspersonal nicht von allen Alarmen überfordert wird und sich stattdessen nur auf kritische Alarme konzentrieren kann. 

 **Risikostufe, wenn diese bewährte Methode nicht eingeführt wird:** Niedrig 

## Implementierungsleitfaden
<a name="implementation-guidance"></a>

 Leistung im laufenden Betrieb überwachen: Implementieren Sie Prozesse, die Ihnen Einblick in die Leistung gewähren, während Ihr Workload ausgeführt wird. Erstellen Sie Überwachungs-Dashboards und legen Sie eine Basis für Leistungserwartungen fest. 

## Ressourcen
<a name="resources"></a>

 **Ähnliche Dokumente:** 
+  [CloudWatch-Dokumentation](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
+  [Überwachung, Protokollierung und Leistung von APN-Partnern](https://aws.amazon.com/devops/partner-solutions/#_Monitoring.2C_Logging.2C_and_Performance) 
+  [X-Ray-Dokumentation](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 
+  [Verwendung von Alarmen und Alarmaktionen in CloudWatch](https://docs.aws.amazon.com/sdk-for-go/v1/developer-guide/cw-example-using-alarm-actions.html) 

 **Ähnliche Videos:** 
+  [Ende des Chaos: Transparenz und Einblick in den Betrieb (MGT301-R1)](https://www.youtube.com/watch?v=nLYGbotqHd0) 
+  [Verwaltung der Anwendungsleistung in AWS](https://www.youtube.com/watch?v=5T4stR-HFas&ref=wellarchitected) 
+  [Erstellen eines Überwachungsplans](https://www.youtube.com/watch?v=OMmiGETJpfU&ref=wellarchitected) 
+  [Verwenden von AWS Lambda mit Amazon CloudWatch Events](https://www.youtube.com/watch?v=WDBD3JmpLqs) 

 **Ähnliche Beispiele:** 
+  [Cloudwatch-Protokolle: Konfigurieren von Alarmen](https://github.com/awslabs/cloudwatch-logs-customize-alarms) 