

# OPS 4. Wie implementieren Sie die Beobachtbarkeit in Ihrer Workload?


Implementieren Sie Beobachtbarkeit in Ihre Workload, damit Sie deren Zustand verstehen und datengesteuerte Entscheidungen auf der Grundlage von Geschäftsanforderungen treffen können.

**Topics**
+ [

# OPS04-BP01 Identifizieren Sie die wichtigsten Leistungsindikatoren
](ops_observability_identify_kpis.md)
+ [

# OPS04-BP02 Implementieren Sie Anwendungstelemetrie
](ops_observability_application_telemetry.md)
+ [

# OPS04-BP03 Implementieren Sie Benutzererlebnis-Telemetrie
](ops_observability_customer_telemetry.md)
+ [

# OPS04-BP04 Implementieren einer Abhängigkeitstelemetrie
](ops_observability_dependency_telemetry.md)
+ [

# OPS04-BP05 Implementieren Sie verteiltes Tracing
](ops_observability_dist_trace.md)

# OPS04-BP01 Identifizieren Sie die wichtigsten Leistungsindikatoren
OPS04-BP01 Identifizieren Sie die wichtigsten Leistungsindikatoren

 Die Implementierung von Beobachtbarkeit in Ihrer Workload beginnt damit, ihren Status zu verstehen und datengestützte Entscheidungen auf der Grundlage der geschäftlichen Anforderungen zu treffen. Eine der wirksamsten Methoden, um sicherzustellen, dass die Überwachungstätigkeiten und die Unternehmensziele aufeinander abgestimmt werden, ist die Definition und Überwachung zentraler Leistungsindikatoren (KPIs). 

 **Gewünschtes Ergebnis:** Effiziente Beobachtbarkeitspraktiken, die eng an den Geschäftszielen ausgerichtet sind und sicherstellen, dass die Überwachungsanstrengungen stets greifbaren Geschäftsergebnissen dienen. 

 **Typische Anti-Muster:** 
+  UndefiniertKPIs: Die Arbeit ohne klare Angaben KPIs kann dazu führen, dass zu viel oder zu wenig überwacht wird und wichtige Signale fehlen. 
+  StatischKPIs: Es wird nicht wiederholt oder verfeinertKPIs, wenn sich die Arbeitslast oder die Geschäftsziele ändern. 
+  Fehlausrichtung: Konzentration auf technische Metriken, die nicht direkt mit Geschäftsergebnissen korrelieren oder schwieriger mit realen Problemen zu korrelieren sind. 

 **Vorteile der Nutzung dieser bewährten Methode:** 
+  Einfache Identifizierung von Problemen: In Unternehmen KPIs treten Probleme häufig deutlicher zutage als bei technischen Kennzahlen. Ein Einbruch in einem Unternehmen KPI kann ein Problem effektiver lokalisieren als die Analyse zahlreicher technischer Kennzahlen. 
+  Geschäftsausrichtung: Es wird sichergestellt, dass die Überwachungsaktivitäten die Geschäftsziele direkt unterstützen. 
+  Effizienz: Es erfolgt eine Priorisierung der Ressourcen für die Überwachung und die Konzentration auf wichtige Metriken. 
+  Proaktivität: Probleme werden erkannt und gelöst, bevor sie weitreichende Auswirkungen auf das Geschäft haben. 

 **Risikostufe, wenn diese bewährte Methode nicht eingeführt wird:** Hoch 

## Implementierungsleitfaden
Implementierungsleitfaden

 Um die Arbeitslast effektiv zu definieren: KPIs 

1.  **Beginnen Sie mit den Geschäftsergebnissen:** Bevor Sie sich mit Metriken befassen, sollten Sie sich mit den gewünschten Geschäftsergebnissen vertraut machen. Sind es höhere Umsätze, mehr Benutzerinteraktionen oder schnellere Reaktionszeiten? 

1.  **Stimmen Sie technische Metriken auf Geschäftsziele ab:** Nicht alle technischen Metriken wirken sich direkt auf die Geschäftsergebnisse aus. Identifizieren Sie diejenigen, die dies tun, aber es ist oft einfacher, ein Problem mithilfe eines Unternehmens zu identifizierenKPI. 

1.  **Verwenden Sie [Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html): CloudWatch Employ**, um Kennzahlen zu definieren und zu überwachen, die Ihren entsprechenKPIs. 

1.  **Regelmäßige Überprüfung und AktualisierungKPIs: Sorgen** Sie dafür, dass Ihre Daten KPIs relevant sind, wenn sich Ihre Arbeitslast und Ihr Unternehmen weiterentwickeln. 

1.  **Stakeholder einbeziehen:** Beziehen Sie sowohl technische als auch geschäftliche Teams in die Definition und Überprüfung mit einKPIs. 

 **Aufwand für den Implementierungsplan:** Mittel 

## Ressourcen
Ressourcen

 **Zugehörige bewährte Methoden:** 
+ [OPS04-BP02 Implementieren Sie Anwendungstelemetrie](ops_observability_application_telemetry.md)
+ [OPS04-BP03 Implementieren Sie Benutzererlebnis-Telemetrie](ops_observability_customer_telemetry.md)
+ [OPS04-BP04 Implementieren einer Abhängigkeitstelemetrie](ops_observability_dependency_telemetry.md)
+ [OPS04-BP05 Implementieren Sie verteiltes Tracing](ops_observability_dist_trace.md)

 **Zugehörige Dokumente:** 
+ [AWS Bewährte Verfahren zur Beobachtbarkeit](https://aws-observability.github.io/observability-best-practices/)
+ [ CloudWatch Benutzerleitfaden](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html)
+ [AWS Kurs Observability Skill Builder](https://explore.skillbuilder.aws/learn/course/external/view/elearning/14688/aws-observability)

 **Zugehörige Videos:** 
+ [ Entwicklung einer Beobachtbarkeitsstrategie ](https://www.youtube.com/watch?v=Ub3ATriFapQ)

 **Zugehörige Beispiele:** 
+  [Workshop zur Beobachtbarkeit](https://catalog.workshops.aws/observability/en-US) 

# OPS04-BP02 Implementieren Sie Anwendungstelemetrie
OPS04-BP02 Implementieren Sie die Anwendungstelemetrie

 Anwendungstelemetrie dient als Grundlage für die Beobachtbarkeit Ihres Workloads. Die ausgegebene Telemetrie muss unbedingt umsetzbare Erkenntnisse zum Status Ihrer Anwendung und zum Erreichen sowohl technischer als auch geschäftlicher Ergebnisse liefern. Von der Problembehebung über die Messung der Auswirkungen einer neuen Funktion bis hin zur Sicherstellung der Abstimmung mit den wichtigsten Unternehmensleistungsindikatoren (KPIs) — die Anwendungstelemetrie gibt Aufschluss darüber, wie Sie Ihre Workloads aufbauen, betreiben und weiterentwickeln. 

 Metriken, Protokolle und Traces bilden die drei wichtigsten Säulen der Beobachtbarkeit. Sie dienen als Diagnosetools, die den Status Ihrer Anwendung beschreiben. Im Laufe der Zeit helfen sie bei der Erstellung von Baselines und der Identifizierung von Anomalien. Um jedoch sicherzustellen, dass die Überwachungsaktivitäten und die Geschäftsziele aufeinander abgestimmt sind, ist es von entscheidender Bedeutung, diese zu definieren und zu überwachen. KPIs Unternehmen machen es KPIs oft einfacher, Probleme zu identifizieren als nur technische Kennzahlen. 

 Andere Telemetriearten, wie die Überwachung realer Benutzer (RUM) und synthetische Transaktionen, ergänzen diese primären Datenquellen. RUMbietet Einblicke in Benutzerinteraktionen in Echtzeit, während synthetische Transaktionen potenzielles Benutzerverhalten simulieren und so helfen, Engpässe zu erkennen, bevor echte Benutzer darauf stoßen. 

 **Gewünschtes Ergebnis:** Sie erzielen umsetzbare Erkenntnisse zur Leistung Ihres Workloads. Diese Erkenntnisse ermöglichen es Ihnen, proaktive Entscheidungen zur Leistungsoptimierung zu treffen, eine höhere Workload-Stabilität zu erreichen, CI/CD-Prozesse zu rationalisieren und Ressourcen effektiv zu nutzen. 

 **Typische Anti-Muster:** 
+  **Unvollständige Beobachtbarkeit:** Wenn die Beobachtbarkeit nicht auf jeder Ebene der Workload berücksichtigt wird, führt dies zu blinden Flecken, die wichtige Erkenntnisse über Systemleistung und Verhalten verschleiern können. 
+  **Fragmentierte Datenansicht:** Wenn Daten über mehrere Tools und Systeme verteilt sind, wird es schwierig, einen ganzheitlichen Überblick über den Zustand und die Leistung Ihrer Workloads zu behalten. 
+  **Von Benutzern gemeldete Probleme:** Ein Zeichen dafür, dass eine proaktive Problemerkennung durch Telemetrie und KPI Unternehmensüberwachung fehlt. 

 **Vorteile der Nutzung dieser bewährten Methode:** 
+  **Fundierte Entscheidungsfindung:** Mit Erkenntnissen aus Telemetrie und Unternehmen können Sie KPIs datengestützte Entscheidungen treffen. 
+  **Verbesserte betriebliche Effizienz:** Datengesteuerte Ressourcennutzung führt zu Kosteneffektivität. 
+  **Verbesserte Workload-Stabilität:** Schnellere Erkennung und Lösung von Problemen führt zu einer verbesserten Verfügbarkeit. 
+  **Optimierte CI/CD-Prozesse:** Erkenntnisse aus Telemetriedaten erleichtern die Verfeinerung von Prozessen und sichern die Codebereitstellung. 

 **Risikostufe, wenn diese bewährte Methode nicht eingeführt wird:** Hoch 

## Implementierungsleitfaden
Implementierungsleitfaden

 Verwenden Sie AWS Dienste wie [Amazon CloudWatch](https://aws.amazon.com/cloudwatch/) und, um Anwendungstelemetrie für Ihren Workload zu implementieren. [AWS X-Ray](https://aws.amazon.com/xray/) Amazon CloudWatch bietet eine umfassende Suite von Überwachungstools, mit denen Sie Ihre Ressourcen und Anwendungen in AWS und vor Ort überwachen können. Der Service erfasst, verfolgt und analysiert Metriken, konsolidiert und überwacht Protokolldaten und reagiert auf Änderungen in Ihren Ressourcen, wodurch Sie besser verstehen, wie Ihre Workload funktioniert. Gleichzeitig AWS X-Ray können Sie Ihre Anwendungen verfolgen, analysieren und debuggen, sodass Sie ein tiefes Verständnis des Verhaltens Ihrer Workloads erhalten. Mit Funktionen wie Service Maps, Latenzverteilungen und Trace-Zeitplänen AWS X-Ray bietet es Einblicke in die Leistung Ihres Workloads und die Engpässe, die sich darauf auswirken. 

### Implementierungsschritte
Implementierungsschritte

1.  **Identifizieren, welche Daten erfasst werden sollen:** Ermitteln Sie die wichtigsten Metriken, Protokolle und Traces, die aussagekräftige Erkenntnisse zu Zustand, Leistung und Verhalten Ihres Workloads bieten. 

1.  **Stellen Sie den [CloudWatchAgenten bereit: Der CloudWatch Agent](https://aws.amazon.com/cloudwatch/)** spielt eine wichtige Rolle bei der Beschaffung von System- und Anwendungsmetriken und Protokollen von Ihrem Workload und der zugrunde liegenden Infrastruktur. Der CloudWatch Agent kann auch verwendet werden, um Spuren zu sammeln OpenTelemetry oder zu röntgen und sie an X-Ray zu senden. 

1.  **Implementieren Sie die Anomalieerkennung für Protokolle und Metriken:** Verwenden Sie die Erkennung von [CloudWatch Protokollanomalien und die Erkennung](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/LogsAnomalyDetection.html) von [CloudWatchMetrikanomalien](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html), um ungewöhnliche Aktivitäten im Betrieb Ihrer Anwendung automatisch zu identifizieren. Diese Tools verwenden Machine-Learning-Algorithmen, um Anomalien zu erkennen und sie zu melden. Dadurch werden Ihre Überwachungsfunktionen verbessert und die Reaktionszeit bei potenziellen Störungen oder Sicherheitsbedrohungen verkürzt. Richten Sie diese Features ein, um den Zustand und die Sicherheit von Anwendungen proaktiv zu verwalten. 

1.  **Schützen Sie sensible Protokolldaten:** Verwenden Sie den [Datenschutz von Amazon CloudWatch Logs](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/mask-sensitive-log-data.html), um vertrauliche Informationen in Ihren Protokollen zu maskieren. Dieses Feature trägt zur Wahrung von Datenschutz und Compliance bei, indem sensible Daten automatisch erkannt und maskiert werden, bevor auf sie zugegriffen wird. Implementieren Sie Datenmaskierung, um sensible Daten wie personenbezogene Daten sicher zu handhaben und zu schützen (PII). 

1.  **Definieren und überwachen Sie Ihr GeschäftKPIs:** Legen Sie [benutzerdefinierte Kennzahlen](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/publishingMetrics.html) fest, die auf Ihre [Geschäftsergebnisse](https://aws-observability.github.io/observability-best-practices/guides/operational/business/monitoring-for-business-outcomes/) abgestimmt sind. 

1.  **Instrumentieren Sie Ihre Anwendung mit AWS X-Ray:** Neben der Bereitstellung des CloudWatch Agenten ist es wichtig, dass [Ihre Anwendung](https://docs.aws.amazon.com/xray/latest/devguide/xray-instrumenting-your-app.html) so konfiguriert ist, dass sie Trace-Daten aussendet. Dieser Prozess kann weitere Erkenntnisse zum Verhalten und zur Leistung Ihrer Workload liefern. 

1.  **Standardisierung der Datenerfassung in Ihrer gesamten Anwendung:** Standardisieren Sie die Datenerfassungspraktiken für Ihre gesamte Anwendung. Einheitlichkeit hilft bei der Korrelation und Analyse von Daten und liefert einen umfassenden Überblick über das Verhalten Ihrer Anwendung. 

1.  **Implementieren Sie kontenübergreifende Beobachtbarkeit:** Verbessern Sie die Effizienz der Überwachung über mehrere Konten hinweg AWS-Konten mit der [ CloudWatch kontenübergreifenden Observability von Amazon](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Unified-Cross-Account.html). Mit dieser Funktion können Sie Metriken, Protokolle und Alarme von verschiedenen Konten in einer einzigen Ansicht konsolidieren, was die Verwaltung vereinfacht und die Reaktionszeiten bei identifizierten Problemen in der gesamten Unternehmensumgebung verbessert. AWS 

1.  Daten **analysieren und entsprechend handeln: Sobald die Datenerfassung** und Normalisierung abgeschlossen sind, können Sie [Amazon CloudWatch](https://aws.amazon.com/cloudwatch/features/) für die Analyse von Kennzahlen und Protokollen sowie für die Trace-Analyse verwenden. [AWS X-Ray](https://aws.amazon.com/xray/features/) Eine solche Analyse kann wichtige Erkenntnisse über den Zustand, die Leistung und das Verhalten Ihrer Workload liefern und so Ihren Entscheidungsprozess beeinflussen. 

 **Aufwand für den Implementierungsplan:** Hoch 

## Ressourcen
Ressourcen

 **Zugehörige bewährte Methoden:** 
+  [OPS04-BP01 Arbeitslast definieren KPIs](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_identify_kpis.html) 
+  [OPS04-BP03 Implementieren Sie Telemetrie für Benutzeraktivitäten](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_customer_telemetry.html) 
+  [OPS04-BP04 Implementieren Sie Abhängigkeitstelemetrie](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_dependency_telemetry.html) 
+  [OPS04-BP05 Implementieren Sie die Rückverfolgbarkeit von Transaktionen](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_dist_trace.html) 

 **Zugehörige Dokumente:** 
+  [Bewährte Methoden zur Beobachtbarkeit für AWS](https://aws-observability.github.io/observability-best-practices/) 
+  [CloudWatch-Benutzerhandbuch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
+  [AWS X-Ray Entwicklerhandbuch](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 
+  [Instrumentieren verteilter Systeme für Einblicke in die Betriebsabläufe](https://aws.amazon.com/builders-library/instrumenting-distributed-systems-for-operational-visibility) 
+  [Skill Builder-Kurs zur Beobachtbarkeit in AWS](https://explore.skillbuilder.aws/learn/course/external/view/elearning/14688/aws-observability) 
+  [Was ist neu bei Amazon CloudWatch](https://aws.amazon.com/about-aws/whats-new/management-and-governance/?whats-new-content.sort-by=item.additionalFields.postDateTime&whats-new-content.sort-order=desc&awsf.whats-new-products=general-products%23amazon-cloudwatch) 
+  [Was ist neu bei AWS X-Ray](https://aws.amazon.com/about-aws/whats-new/developer-tools/?whats-new-content.sort-by=item.additionalFields.postDateTime&whats-new-content.sort-order=desc&awsf.whats-new-products=general-products%23aws-x-ray) 

 **Zugehörige Videos:** 
+  [AWS re:Invent 2022 — Bewährte Methoden zur Beobachtbarkeit bei Amazon](https://youtu.be/zZPzXEBW4P8) 
+  [AWS re:Invent 2022 — Entwicklung einer Strategie zur Beobachtung](https://youtu.be/Ub3ATriFapQ) 

 **Zugehörige Beispiele:** 
+  [Workshop zur Beobachtbarkeit](https://catalog.workshops.aws/observability) 
+  [AWS Lösungsbibliothek: Anwendungsüberwachung mit Amazon CloudWatch](https://aws.amazon.com/solutions/implementations/application-monitoring-with-cloudwatch) 

# OPS04-BP03 Implementieren Sie Benutzererlebnis-Telemetrie
OPS04-BP03 Implementieren Sie Telemetrie für die Benutzererfahrung

 Ein entscheidender Erfolgsfaktor besteht darin, tiefe Einblicke in die Erfahrung Ihrer Kunden und deren Interaktionen mit Ihrer Anwendung zu gewinnen. Echte Benutzerüberwachung (RUM) und synthetische Transaktionen dienen zu diesem Zweck als leistungsstarke Tools. RUMliefert Daten über echte Benutzerinteraktionen und ermöglicht so eine ungefilterte Perspektive der Nutzerzufriedenheit. Synthetische Transaktionen simulieren Benutzerinteraktionen und helfen so dabei, potenzielle Probleme zu erkennen, noch bevor sie sich auf echte Nutzer auswirken. 

 **Gewünschtes Ergebnis:** Eine ganzheitliche Ansicht des Kundenerlebnisses, die proaktive Erkennung von Problemen und die Optimierung der Benutzerinteraktionen, um nahtlos digitale Erfahrungen zu ermöglichen. 

 **Typische Anti-Muster:** 
+  Anwendungen ohne reale Benutzerüberwachung (RUM): 
  +  Verzögerte Problemerkennung: Ohne diese RUM Option werden Sie möglicherweise erst dann auf Leistungsengpässe oder -probleme aufmerksam, wenn sich Benutzer beschweren. Dieser reaktive Ansatz kann bei Ihren Kunden zu Unzufriedenheit führen. 
  +  Fehlende Einblicke in die Benutzererfahrung: Wenn Sie sie nicht verwendenRUM, verlieren Sie wichtige Daten, die zeigen, wie echte Benutzer mit Ihrer Anwendung interagieren, wodurch Ihre Möglichkeiten zur Optimierung der Benutzererfahrung eingeschränkt werden. 
+  Anwendungen ohne synthetische Transaktionen: 
  +  Fehlende Grenzfälle: Synthetische Transaktionen helfen Ihnen dabei, Pfade und Funktionen zu testen, die von den meisten Benutzern möglicherweise nicht häufig verwendet werden, aber für bestimmte Geschäftsfunktionen von entscheidender Bedeutung sind. Ohne sie könnten mögliche Fehler bei diesen Pfaden und Funktionen unbemerkt bleiben. 
  +  Ausbleibende Überprüfung auf Probleme bei inaktiver Anwendung: Regelmäßige synthetische Tests können Situationen simulieren, in denen echte Benutzer nicht aktiv mit Ihrer Anwendung interagieren, wodurch sichergestellt wird, dass das System immer korrekt funktioniert. 

 **Vorteile der Nutzung dieser bewährten Methode:** 
+  Proaktive Problemerkennung: Identifizieren und beheben Sie potenzielle Probleme, bevor sie sich auf echte Benutzer auswirken. 
+  Optimierte Benutzererfahrung: Kontinuierliches Feedback von RUM hilft dabei, das allgemeine Benutzererlebnis zu verfeinern und zu verbessern. 
+  Erkenntnisse zur Geräte- und Browserleistung: Verstehen Sie, wie gut Ihre Anwendung auf verschiedenen Geräten und Browsern funktioniert, um weitere Optimierungen zu ermöglichen. 
+  Validierte Geschäftsabläufe: Regelmäßige synthetische Transaktionen stellen sicher, dass Kernfunktionen und kritische Pfade stets betriebsbereit und effizient bleiben. 
+  Verbesserte Anwendungsleistung: Nutzen Sie Erkenntnisse aus echten Benutzerdaten, um die Reaktionsfähigkeit und Zuverlässigkeit Ihrer Anwendungen zu verbessern. 

 **Risikostufe, wenn diese bewährte Methode nicht eingeführt wird:** Hoch 

## Implementierungsleitfaden
Implementierungsleitfaden

 AWS [Bietet Dienste wie [Amazon RUM und Amazon CloudWatch RUM](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-RUM.html) Synthetics an, um synthetische Transaktionen für die Telemetrie von Benutzeraktivitäten zu nutzen. CloudWatch ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html) In Verbindung mit Daten zur Benutzeraktivität bieten Metriken, Protokolle und Traces einen umfassenden Überblick über den Betriebsstatus der Anwendung und die Benutzererfahrung zugleich. 

### Implementierungsschritte
Implementierungsschritte

1.  **Bereitstellen von Amazon CloudWatch RUM:** Integrieren Sie Ihre Anwendung, CloudWatch RUM um echte Benutzerdaten zu sammeln, zu analysieren und zu präsentieren. 

   1.  Verwenden Sie die [CloudWatch RUM JavaScript Bibliothek](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-RUM.html), um sie in Ihre Anwendung zu integrierenRUM. 

   1.  Richten Sie Dashboards ein, um echte Benutzerdaten zu visualisieren und zu überwachen. 

1.  ** CloudWatch Synthetics konfigurieren:** Erstellen Sie Canaries oder skriptbasierte Routinen, die Benutzerinteraktionen mit Ihrer Anwendung simulieren. 

   1.  Definieren Sie kritische Anwendungsworkflows und -pfade. 

   1.  Entwerfen Sie Kanarienvögel mithilfe von [CloudWatch Synthetics-Skripten](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html), um Benutzerinteraktionen für diese Pfade zu simulieren. 

   1.  Planen und überwachen Sie Canaries so, dass sie in bestimmten Intervallen ausgeführt werden, und sorgen Sie so für einheitliche Leistungsprüfungen. 

1.  **Daten analysieren und darauf reagieren:** Nutzen Sie Daten aus RUM und synthetische Transaktionen, um Erkenntnisse zu gewinnen und Korrekturmaßnahmen zu ergreifen, wenn Anomalien entdeckt werden. Verwenden Sie CloudWatch Dashboards und Alarme, um auf dem Laufenden zu bleiben. 

 **Aufwand für den Implementierungsplan:** Mittel 

## Ressourcen
Ressourcen

 **Zugehörige bewährte Methoden:** 
+  [OPS04-BP01 Identifizieren Sie die wichtigsten Leistungsindikatoren](ops_observability_identify_kpis.md) 
+  [OPS04-BP02 Implementieren Sie Anwendungstelemetrie](ops_observability_application_telemetry.md) 
+  [OPS04-BP04 Implementieren einer Abhängigkeitstelemetrie](ops_observability_dependency_telemetry.md) 
+  [OPS04-BP05 Implementieren Sie verteiltes Tracing](ops_observability_dist_trace.md) 

 **Zugehörige Dokumente:** 
+ [ CloudWatch RUMAmazon-Leitfaden](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-RUM.html)
+ [Leitfaden für Amazon CloudWatch Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html)

 **Zugehörige Videos:** 
+ [Optimieren Sie Anwendungen mithilfe von Erkenntnissen für Endbenutzer mit Amazon CloudWatch RUM](https://www.youtube.com/watch?v=NMaeujY9A9Y)
+ [AWS auf Air ft. Echte Benutzerüberwachung für Amazon CloudWatch](https://www.youtube.com/watch?v=r6wFtozsiVE)

 **Zugehörige Beispiele:** 
+ [ Workshop zur Beobachtbarkeit ](https://catalog.workshops.aws/observability/en-US/intro)
+ [Git-Repository für Amazon CloudWatch RUM Web Client](https://github.com/aws-observability/aws-rum-web)
+ [Verwenden von Amazon CloudWatch Synthetics zur Messung der Seitenladezeit](https://github.com/aws-samples/amazon-cloudwatch-synthetics-page-performance)

# OPS04-BP04 Implementieren einer Abhängigkeitstelemetrie
OPS04-BP04 Implementieren einer Abhängigkeitstelemetrie

 Die Abhängigkeitstelemetrie ist für die Überwachung des Status und der Leistung der externen Services und Komponenten, auf die Ihre Workload angewiesen ist, unerlässlich. Sie liefert wertvolle Erkenntnisse zu Erreichbarkeit, Timeouts und anderen kritischen Ereignissen im Zusammenhang mit Abhängigkeiten wie DNS, Datenbanken oder APIs von Drittanbietern. Wenn Sie Ihre Anwendung so instrumentieren, dass sie Metriken, Protokolle und Traces zu diesen Abhängigkeiten ausgibt, gewinnen Sie ein besseres Verständnis von potenziellen Engpässen, Leistungsproblemen oder Ausfällen, die sich auf Ihren Workload auswirken könnten. 

 **Gewünschtes Ergebnis:** Sicherstellen, dass die Abhängigkeiten, auf die Ihre Workload angewiesen ist, erwartungsgemäß funktionieren, sodass Sie Probleme proaktiv angehen und eine optimale Workload-Leistung gewährleisten können. 

 **Typische Anti-Muster:** 
+  **Nichtbeachtung externer Abhängigkeiten:** sich nur auf interne Anwendungsmetriken konzentrieren und dabei Metriken im Zusammenhang mit externen Abhängigkeiten außer Acht lassen. 
+  **Mangelnde proaktive Überwachung:** warten, bis Probleme auftreten, statt den Status und die Leistung von Abhängigkeiten kontinuierlich zu überwachen. 
+  **Isolierte Überwachung:** Einsatz mehrerer, unterschiedlicher Überwachungstools, was zu fragmentierten und inkonsistenten Ansichten bezüglich des Überwachungsstatus führen kann. 

 **Vorteile der Nutzung dieser bewährten Methode:** 
+  **Verbesserte Zuverlässigkeit der Workloads:** sicherstellen, dass externe Abhängigkeiten kontinuierlich verfügbar sind und optimal funktionieren. 
+  **Schnellere Problemerkennung und -lösung:** proaktives Identifizieren und Beheben von Problemen mit Abhängigkeiten, bevor sie sich auf die Workload auswirken. 
+  **Umfassender Überblick:** Erhalt eines ganzheitlichen Überblicks über interne und externe Komponenten, die den Workload-Status beeinflussen. 
+  **Verbesserte Skalierbarkeit der Workloads:** Verständnis der Skalierbarkeitsgrenzen und Leistungsmerkmale externer Abhängigkeiten. 

 **Risikostufe, wenn diese bewährte Methode nicht eingeführt wird:** Hoch 

## Implementierungsleitfaden
Implementierungsleitfaden

 Implementieren Sie die Abhängigkeitstelemetrie, indem Sie zunächst die Services, Infrastrukturen und Prozesse identifizieren, von denen Ihre Workload abhängt. Quantifizieren Sie, wie gute Bedingungen aussehen, wenn diese Abhängigkeiten wie erwartet funktionieren, und bestimmen Sie dann, welche Daten zum Messen dieser Bedingungen benötigt werden. Mit diesen Informationen können Sie Dashboards und Warnmeldungen erstellen, die Ihren Operations-Teams Erkenntnisse zum Status dieser Abhängigkeiten liefern. Verwenden Sie AWS-Tools, um die Auswirkungen zu ermitteln und zu quantifizieren, wenn Abhängigkeiten nicht die gewünschten Resultate zeigen. Überarbeiten Sie Ihre Strategie kontinuierlich, um Änderungen der Prioritäten, Ziele und gewonnenen Erkenntnisse Rechnung zu tragen. 

### Implementierungsschritte
Implementierungsschritte

 So implementieren Sie die Abhängigkeitstelemetrie auf effiziente Weise: 

1.  **Identifizierung externer Abhängigkeiten:** Arbeiten Sie mit Stakeholdern zusammen, um die externen Abhängigkeiten zu ermitteln, von denen Ihr Workload abhängt. Zu externen Abhängigkeiten zählen Services wie externe Datenbanken, APIs von Drittanbietern, Netzwerkverbindungsrouten zu anderen Umgebungen und DNS-Services. Der erste Schritt zu einer effektiven Abhängigkeitstelemetrie besteht darin, auf ganzer Ebene zu verstehen, welche diese Abhängigkeiten sind. 

1.  **Erstellung einer Überwachungsstrategie:** Sobald Sie sich ein klares Bild von Ihren externen Abhängigkeiten verschafft haben, entwerfen Sie eine darauf zugeschnittene Überwachungsstrategie. Dazu müssen Sie die Wichtigkeit jeder Abhängigkeit, ihr erwartetes Verhalten und alle damit verbundenen Service Level Agreements oder -Ziele verstehen. Richten Sie proaktive Warnmeldungen ein, die Sie über Statusänderungen oder Leistungsabweichungen informieren. 

1.  **Verwendung der [Netzwerküberwachung](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Network-Monitoring-Sections.html):** Verwenden Sie die Tools [Internet Monitor](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-InternetMonitor.html) und [Network Monitor](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/what-is-network-monitor.html), die umfassende Einblicke in die globalen Internet- und Netzwerkbedingungen bieten. Diese Tools helfen Ihnen dabei, Ausfälle, Unterbrechungen oder Leistungseinbußen, die sich auf Ihre externen Abhängigkeiten auswirken, zu verstehen und darauf zu reagieren. 

1.  **Bleiben Sie mit [AWS Health](https://aws.amazon.com/premiumsupport/technology/aws-health/) auf dem Laufenden:** AWS Health ist die maßgebliche Informationsquelle für den Zustand Ihrer AWS Cloud-Ressourcen. Ermöglicht AWS Health die Visualisierung und den Erhalt von Benachrichtigungen über aktuelle Serviceereignisse und bevorstehende Änderungen, z. B. geplante Lebenszyklusereignisse. So können Sie Maßnahmen ergreifen, um die Auswirkungen zu minimieren. 

   1.  [Erstellen Sie angepasste AWS Health-Ereignisbenachrichtigungen](https://docs.aws.amazon.com/health/latest/ug/user-notifications.html) für E-Mail- und Chat-Kanäle über [AWS-Benutzerbenachrichtigungen](https://docs.aws.amazon.com/notifications/latest/userguide/what-is-service.html) und integrieren Sie diese programmgesteuert mit [Ihren Überwachungs- und Warnungstools über Amazon EventBridge](https://docs.aws.amazon.com/health/latest/ug/cloudwatch-events-health.html) oder die [AWS Health-API](https://docs.aws.amazon.com/health/latest/APIReference/Welcome.html). 

   1.  Planen und verfolgen Sie den Fortschritt bei Gesundheitsereignissen, die Maßnahmen erfordern, indem Sie diese in Änderungsmanagement- oder ITSM-Tools (wie [Jira](https://docs.aws.amazon.com/smc/latest/ag/cloud-sys-health.html) oder [ServiceNow](https://docs.aws.amazon.com/smc/latest/ag/sn-aws-health.html)) integrieren, die Sie möglicherweise bereits über Amazon EventBridge oder die AWS Health-API verwenden. 

   1.  Wenn Sie AWS Organizations verwenden, aktivieren Sie die [Organisationsansicht für AWS Health](https://docs.aws.amazon.com/health/latest/ug/aggregate-events.html), um AWS Health-Ereignisse über Konten hinweg zu aggregieren. 

1.  **Instrumentierung Ihrer Anwendung mit [AWS X-Ray](https://aws.amazon.com/xray/):** AWS X-Ray stellt Ihnen Erkenntnisse zur Leistung von Anwendungen und zu den zugrunde liegenden Abhängigkeiten bereit. Verfolgen Sie Anfragen von Anfang bis Ende nach, um Engpässe oder Ausfälle bei den externen Services oder Komponenten zu identifizieren, auf die sich Ihre Anwendung stützt. 

1.  **Verwendung von [Amazon DevOps Guru](https://aws.amazon.com/devops-guru/):** Dieser Machine Learning-gestützte Service identifiziert operative Probleme, prognostiziert das Auftreten kritischer Probleme und empfiehlt spezifische Maßnahmen. Dadurch ist er von unschätzbarem Wert, wenn es darum geht, Erkenntnisse zu Abhängigkeiten zu gewinnen und festzustellen, dass sie nicht die Ursache von operativen Problemen sind. 

1.  **Regelmäßige Überwachung:** Überwachen Sie kontinuierlich alle Metriken und Protokolle, die sich auf externe Abhängigkeiten beziehen. Richten Sie Warnmeldungen ein, die Sie über unerwartetes Verhalten oder Leistungseinbußen informieren. 

1.  **Validierung nach Änderungen:** Überprüfen Sie nach jeder Aktualisierung oder Änderung einer externen Abhängigkeit deren Leistung und Ausrichtung auf die Anforderungen Ihrer Anwendung. 

 **Aufwand für den Implementierungsplan:** Mittel 

## Ressourcen
Ressourcen

 **Zugehörige bewährte Methoden:** 
+  [OPS04-BP01 Definieren von Workload-KPIs](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_identify_kpis.html) 
+  [OPS04-BP02 Implementieren einer Anwendungstelemetrie](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_application_telemetry.html) 
+  [OPS04-BP03 Implementieren von Telemetrie für Benutzeraktivitäten](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_customer_telemetry.html) 
+  [OPS04-BP05 Implementierung einer Transaktionsverfolgung](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_dist_trace.html) 
+  [OP08-BP04 Erstellen umsetzbarer Warnmeldungen](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_workload_observability_create_alerts.html) 

 **Zugehörige Dokumente:** 
+  [Amazon Personal Health Dashboard-Benutzerhandbuch](https://docs.aws.amazon.com/health/latest/ug/what-is-aws-health.html) 
+  [AWS Internet Monitor-Benutzerhandbuch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-InternetMonitor.html) 
+  [AWS X-Ray-Entwicklerhandbuch](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 
+  [AWS DevOps Guru-Benutzerhandbuch](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html) 

 **Zugehörige Videos:** 
+  [Wie sich Internetprobleme auf die Leistung von Apps auswirken](https://www.youtube.com/watch?v=Kuc_SG_aBgQ) 
+  [Einführung in Amazon DevOps Guru](https://www.youtube.com/watch?v=2uA8q-8mTZY) 
+  [Ressourcenlebenszyklus-Ereignisse mit AWS Health in großem Umfang verwalten](https://www.youtube.com/watch?v=VoLLNL5j9NA) 

 **Zugehörige Beispiele:** 
+  [AWS Health Aware](https://github.com/aws-samples/aws-health-aware/) 
+  [Tag-basierte Filterung verwenden, um AWS Health-Überwachung und -Warnmeldungen in großem Umfang zu verwalten](https://aws.amazon.com/blogs/mt/using-tag-based-filtering-to-manage-health-monitoring-and-alerting-at-scale/) 

# OPS04-BP05 Implementieren Sie verteiltes Tracing
OPS04-BP05 Implementieren Sie die verteilte Ablaufverfolgung

 Die verteilte Nachverfolgung bietet eine Möglichkeit, Anfragen zu überwachen und zu visualisieren, während sie verschiedene Komponenten eines verteilten Systems durchlaufen. Durch die Erfassung von Trace-Daten aus mehreren Quellen und deren Analyse in einer zentralen Ansicht können Teams besser verstehen, wie Anfragen ablaufen, wo Engpässe bestehen und worauf Optimierungsbemühungen abzielen sollten. 

 **Gewünschtes Ergebnis:** Sie verschaffen sich einen ganzheitlichen Überblick über die Anfragen, die durch Ihr verteiltes System fließen, und ermöglichen so präzises Debugging, optimierte Leistung und verbesserte Benutzererfahrungen. 

 **Typische Anti-Muster:** 
+  Inkonsistente Instrumentierung: Nicht alle Services in einem verteilten System sind für die Nachverfolgung instrumentiert. 
+  Latenz wird ignoriert: Sie konzentrieren sich nur auf Fehler und berücksichtigen nicht die Latenz oder allmähliche Leistungseinbußen. 

 **Vorteile der Nutzung dieser bewährten Methode:** 
+ Umfassender Systemüberblick: Visualisierung des gesamten Anfragenverlaufs, vom Eingang bis zum Ausgang.
+  Verbessertes Debugging: Schnelle Identifizierung von Fehlern oder Leistungsproblemen. 
+  Verbessertes Benutzererlebnis: Überwachung und Optimierung auf der Grundlage von tatsächlichen Benutzerdaten, um sicherzustellen, dass das System den realen Anforderungen entspricht. 

 **Risikostufe, wenn diese bewährte Methode nicht eingeführt wird:** Hoch 

## Implementierungsleitfaden
Implementierungsleitfaden

 Identifizieren Sie zunächst alle Elemente Ihrer Workload, für die eine Instrumentierung erforderlich ist. Sobald alle Komponenten berücksichtigt sind, können Sie Tools wie AWS X-Ray und OpenTelemetry zum Sammeln von Trace-Daten für die Analyse mit Tools wie X-Ray und Amazon CloudWatch ServiceLens Map nutzen. Nehmen Sie regelmäßig an Besprechungen mit Entwicklern teil und ergänzen Sie diese Diskussionen mit Tools wie Amazon DevOps Guru, X-Ray Analytics und X-Ray Insights, um tiefere Erkenntnisse zu gewinnen. Richten Sie Warnmeldungen anhand von Trace-Daten ein, damit Sie benachrichtigt werden, wenn die im Workload-Überwachungsplan definierten Ergebnisse gefährdet sind. 

### Implementierungsschritte
Implementierungsschritte

 So implementieren Sie die verteilte Nachverfolgung auf effektive Weise: 

1.  **Verwendung von [AWS X-Ray](https://aws.amazon.com/xray/):** Integrieren Sie X-Ray in Ihre Anwendung, um Erkenntnisse zu ihrem Verhalten zu gewinnen, ihre Leistung zu verstehen und Engpässe zu lokalisieren. Nutzen Sie X-Ray Insights für die automatische Trace-Analyse. 

1.  **Instrumentieren Sie Ihre Dienste:** Stellen Sie sicher, dass jeder Service, von einer [AWS Lambda](https://aws.amazon.com/lambda/)Funktion bis zu einer [EC2Instance](https://aws.amazon.com/ec2/), Trace-Daten sendet. Je mehr Dienste Sie instrumentieren, desto klarer ist die end-to-end Sicht. 

1.  **Integrieren Sie [CloudWatch Real User Monitoring](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-RUM.html) und [synthetisches Monitoring](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html):** Integrieren Sie Real User Monitoring (RUM) und synthetisches Monitoring mit X-Ray. Auf diese Weise können reale Benutzererfahrungen erfasst und Benutzerinteraktionen simuliert werden, um potenzielle Probleme zu identifizieren. 

1.  **Verwenden Sie den [CloudWatch Agenten](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html):** Der Agent kann Spuren entweder von X-Ray oder senden OpenTelemetry, wodurch die Tiefe der gewonnenen Erkenntnisse erweitert wird. 

1.  **Verwenden Sie [Amazon DevOps Guru](https://aws.amazon.com/devops-guru/):** DevOps Guru verwendet Daten von X-Ray, CloudWatch, und AWS Config, AWS CloudTrail um umsetzbare Empfehlungen zu geben. 

1.  **Analyse von Traces:** Überprüfen Sie die Trace-Daten regelmäßig, um Muster, Anomalien oder Engpässe zu erkennen, die sich auf die Leistung Ihrer Anwendung auswirken könnten. 

1.  **Warnmeldungen einrichten:** Konfigurieren Sie Alarme [CloudWatch](https://aws.amazon.com/cloudwatch/)für ungewöhnliche Muster oder längere Latenzen, sodass Probleme proaktiv behoben werden können. 

1.  **Kontinuierliche Verbesserung:** Überarbeiten Sie Ihre Tracing-Strategie, wenn Services hinzugefügt oder geändert werden, um alle relevanten Datenpunkte zu erfassen. 

 **Aufwand für den Implementierungsplan:** Mittel 

## Ressourcen
Ressourcen

 **Zugehörige bewährte Methoden:** 
+  [OPS04-BP01 Identifizieren Sie die wichtigsten Leistungsindikatoren](ops_observability_identify_kpis.md) 
+  [OPS04-BP02 Implementieren Sie Anwendungstelemetrie](ops_observability_application_telemetry.md) 
+  [OPS04-BP03 Implementieren Sie Benutzererlebnis-Telemetrie](ops_observability_customer_telemetry.md) 
+  [OPS04-BP04 Implementieren einer Abhängigkeitstelemetrie](ops_observability_dependency_telemetry.md) 

 **Zugehörige Dokumente:** 
+ [AWS X-Ray Leitfaden für Entwickler](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html)
+ [Benutzerhandbuch für CloudWatch Amazon-Agenten](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html)
+ [Amazon DevOps Guru-Benutzerhandbuch](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html)

 **Zugehörige Videos:** 
+ [Nutzen Sie AWS X-Ray Insights](https://www.youtube.com/watch?v=tl8OWHl6jxw)
+ [AWS auf Air ft. Beobachtbarkeit: Amazon CloudWatch ](https://www.youtube.com/watch?v=qBDBnPkZ-KI) und AWS X-Ray

 **Zugehörige Beispiele:** 
+ [Instrumentierung Ihrer Anwendung für AWS X-Ray](https://aws.amazon.com/xray/latest/devguide/xray-instrumenting-your-app.html)