# OPS 4 Wie können Sie Ihren Workload so konzipieren, dass sein jeweiliger Zustand klar ersichtlich ist?
<a name="w2aac19b5b7b5"></a>

 Gestalten Sie Ihren Workload so, dass er die Informationen liefert, die Sie benötigen, um seinen internen Zustand über alle Komponenten (z. B. Metriken, Protokolle und Tracing) hinweg zu verstehen. Auf diese Weise können Sie im Bedarfsfall effektiv reagieren. 

**Topics**
+ [OPS04-BP01 Implementieren einer Anwendungstelemetrie](ops_telemetry_application_telemetry.md)
+ [OPS04-BP02 Implementieren und Konfigurieren der Workload-Telemetrie](ops_telemetry_workload_telemetry.md)
+ [OPS04-BP03 Telemetrie von Benutzeraktivitäten implementieren](ops_telemetry_customer_telemetry.md)
+ [OPS04-BP04 Implementieren einer Abhängigkeitstelemetrie](ops_telemetry_dependency_telemetry.md)
+ [OPS04-BP05 Implementieren einer Nachvollziehbarkeit von Transaktionen](ops_telemetry_dist_trace.md)

# OPS04-BP01 Implementieren einer Anwendungstelemetrie
<a name="ops_telemetry_application_telemetry"></a>

 Anwendungs-Telemetrie ist die Grundlage für Beobachtbarkeit Ihres Workloads. Ihre Anwendung sollte Telemetriedaten ausgeben, die Aufschluss über den Zustand der Anwendung und das Erreichen von Geschäftsergebnissen geben. Von der Fehlerbehebung bis hin zur Messung der Auswirkungen einer neuen Funktion liefert die Anwendungstelemetrie Informationen darüber, wie Sie Ihren Workload aufbauen, betreiben und weiterentwickeln. 

 Anwendungstelemetrie besteht aus Metriken und Protokollen. Bei Metriken handelt es sich um Diagnosedaten, wie Ihr Puls oder Ihre Körpertemperatur. Metriken werden gemeinsam verwendet, um den Zustand Ihrer Anwendung zu beschreiben. Das Sammeln von Metriken im Zeitverlauf kann dazu verwendet werden, Grundlinien zu entwickeln und Anomalien zu erkennen. Protokolle sind Meldungen, die die Anwendung ihren internen Zustand oder auftretende Ereignisse betreffend sendet. Fehlercodes, Transaktionskennungen und Benutzeraktionen sind Beispiele für protokollierte Ereignisse. 

 **Gewünschtes Ergebnis:** 
+  Ihre Anwendung gibt Metriken und Protokolle an, die Aufschluss über ihren Zustand und das Erreichen von Geschäftsergebnissen geben. 
+  Metriken und Protokolle werden zentral für alle Anwendungen im Workload gespeichert. 

 **Gängige Antimuster:** 
+  Ihre Anwendung sendet keine Telemetriedaten. Sie müssen sich darauf verlassen, dass Ihre Kunden Ihnen mitteilen, wenn etwas nicht stimmt. 
+  Ein Kunde hat gemeldet, dass Ihre Anwendung nicht reagiert. Sie verfügen über keine Telemetrie und können nicht bestätigen, dass das Problem existiert, und es auch nicht einschätzen, ohne die Anwendung selbst zu verwenden, um die aktuelle Benutzererfahrung zu verstehen. 

 **Vorteile der Einführung dieser bewährten Methode:** 
+  Sie können den Zustand Ihrer Anwendung, die Benutzererfahrung und das Erreichen von Geschäftsergebnissen nachvollziehen. 
+  Auf Änderungen am Zustand Ihrer Anwendung können Sie schnell reagieren. 
+  Sie können Zustandstrends für Anwendungen entwickeln. 
+  Sie können fundierte Entscheidungen hinsichtlich der Verbesserung Ihrer Anwendung treffen. 
+  Anwendungsprobleme lassen sich schneller erkennen und beheben. 

 **Risikostufe, wenn diese bewährte Methode nicht eingeführt wird:** Hoch 

## Implementierungsleitfaden
<a name="implementation-guidance"></a>

 Die Implementierung von Anwendungstelemetrie besteht aus drei Schritten: Identifizierung eines Speicherorts für Telemetrie, Identifizierung von Telemetrie, die den Zustand der Anwendung beschreibt, und Instrumentierung der Anwendung, um Telemetrie auszugeben. 

 Beispiel: Ein E-Commerce-Unternehmen hat eine auf Microservices basierende Architektur. Im Rahmen des Architekturentwurfs wurde eine Anwendungstelemetrie identifiziert, mit deren Hilfe es den Zustand der einzelnen Microservices nachvollziehen kann. Der Warenkorb-Service hat beispielsweise Telemetriedaten zu Ereignissen wie Hinzufügen zum Warenkorb, Verlassen des Warenkorbs und Dauer des Hinzufügens eines Artikels zum Warenkorb ausgegeben. Alle Microservices würden Fehler, Warnungen und Transaktionsinformationen protokollieren. Telemetrie würde zu Speicher- und Analysezwecken an Amazon CloudWatch gesendet. 

 **Implementierungsschritte** 

 Der erste Schritt besteht darin, einen zentralen Speicherort für die Telemetriedaten der Anwendungen in Ihrem Workload zu ermitteln. Wenn Sie keine bestehende Plattform haben, bietet [Amazon CloudWatch](https://aws.amazon.com/cloudwatch) die Erfassung von Telemetriedaten, Dashboards, Analysen und Fähigkeiten zur Ereigniserzeugung. 

 Stellen Sie sich folgende Fragen, um herauszufinden, welche Telemetrie Sie benötigen: 
+  Ist meine Anwendung in einem guten Zustand? 
+  Erreicht meine Anwendung die gewünschten Geschäftsergebnisse? 

   Ihre Anwendung sollte Protokolle und Metriken ausgeben, die gemeinsam eine Antwort auf diese Fragen bieten. Wenn Sie diese Fragen mit der vorhandenen Anwendungstelemetrie nicht beantworten können, arbeiten Sie mit den Ansprechpersonen aus den Bereichen Business und Technik zusammen, um eine Liste von Telemetriedaten zu erstellen, die dies ermöglichen. Sie können Ihr AWS-Konto-Team um fachkundige technische Beratung bitten, wenn Sie neue Anwendungstelemetrie identifizieren und entwickeln. 

   Sobald die zusätzliche Anwendungstelemetrie identifiziert wurde, arbeiten Sie mit Ihren Ansprechpartnern aus dem technischen Bereich zusammen, um Ihre Anwendung zu instrumentieren. [AWS Distro for OpenTelemetry](https://aws-otel.github.io/) bietet APIs, Bibliotheken und Agenten, die Anwendungstelemetrie bieten. [Dieses Beispiel zeigt, wie man eine JavaScript-Anwendung mit benutzerdefinierten Metriken instrumentiert](https://aws-otel.github.io/docs/getting-started/js-sdk/metric-manual-instr). 

   Kunden, die die Beobachtbarkeits-Services verstehen möchten, die AWS anbietet, können den [Workshop zur Beobachtbarkeit](https://catalog.workshops.aws/observability/en-US) eigenständig durchgehen oder Unterstützung von ihrem AWS-Konto-Team anfordern. Dieser Workshop führt Sie durch die Beobachtbarkeitslösungen von AWS und bietet praktische Beispiele für deren Einsatz. 

   Für umfassendere Einblicke in die Anwendungstelemetrie lesen Sie den Artikel [„Instrumentieren verteilter Systeme für Einblicke in die Betriebsabläufe“](https://aws.amazon.com/builders-library/instrumenting-distributed-systems-for-operational-visibility/) in der Amazon Builder’s Library. Darin wird erklärt, wie Amazon Anwendungen instrumentiert. Er kann als Leitfaden für die Entwicklung eigener Instrumentierungsrichtlinien dienen. 

 **Grad des Aufwands für den Implementierungsplan:** Mittel 

## Ressourcen
<a name="resources"></a>

 **Relevante bewährte Methoden:** 

[OPS04-BP02 Implementieren und Konfigurieren der Workload-Telemetrie](ops_telemetry_workload_telemetry.md) – Anwendungstelemetrie ist ein Bestandteil der Workload-Telemetrie. Sie müssen den Zustand der einzelnen Anwendungen, aus denen der Workload besteht, kennen, um den Zustand des gesamten Workloads zu verstehen. 

[OPS04-BP03 Telemetrie von Benutzeraktivitäten implementieren](ops_telemetry_customer_telemetry.md) – Die Telemetrie der Benutzeraktivität ist häufig eine Teilmenge der Anwendungstelemetrie. Benutzeraktivitäten, wie z. B. das Hinzufügen zum Warenkorb, Clickstreams oder abgeschlossene Transaktionen, geben Aufschluss über das Benutzererlebnis. 

[OPS04-BP04 Implementieren einer Abhängigkeitstelemetrie](ops_telemetry_dependency_telemetry.md) – Abhängigkeitsprüfungen beziehen sich auf die Anwendungstelemetrie und können in Ihre Anwendung instrumentiert werden. Wenn Ihre Anwendung von externen Abhängigkeiten wie DNS oder einer Datenbank abhängig ist, kann Ihre Anwendung Metriken und Protokolle über Erreichbarkeit, Timeouts und andere Ereignisse ausgeben. 

[OPS04-BP05 Implementieren einer Nachvollziehbarkeit von Transaktionen](ops_telemetry_dist_trace.md) – Für die Verfolgung von Transaktionen über einen Workload hinweg muss jede Anwendung Informationen darüber ausgeben, wie sie gemeinsame Ereignisse verarbeitet. Die Art und Weise, wie die einzelnen Anwendungen mit diesen Ereignissen umgehen, wird über ihre Anwendungstelemetrie übermittelt. 

[OPS08-BP02 Definieren von Workload-Metriken](ops_workload_health_design_workload_metrics.md) – Workload-Metriken sind die wesentlichen Zustandsindikatoren für Ihren Workload. Wesentliche Anwendungsmetriken sind Teil der Workload-Metriken. 

 **Zugehörige Dokumente:** 
+  [AWS Builders' Library – Verteilte Systeme instrumentieren, um betriebliche Transparenz zu erzielen](https://aws.amazon.com/builders-library/instrumenting-distributed-systems-for-operational-visibility/) 
+  [AWS Distro for OpenTelemetry](https://aws-otel.github.io/) 
+  [AWS Well-Architected Whitepaper zur betrieblichen Exzellenz – Entwerfen von Telemetrie](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/design-telemetry.html) 
+  [Erstellen von Metriken aus Protokollereignissen mit Filtern](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html) 
+  [Implementieren von Protokollierung und Überwachung mit Amazon CloudWatch](https://docs.aws.amazon.com/prescriptive-guidance/latest/implementing-logging-monitoring-cloudwatch/welcome.html) 
+  [Überwachen des Zustands und der Leistung der Anwendung mit AWS Distro for OpenTelemetry](https://aws.amazon.com/blogs/opensource/monitoring-application-health-and-performance-with-aws-distro-for-opentelemetry/) 
+  [Neu: Wie Sie eine bessere Überwachung Ihrer benutzerdefinierten Anwendungsmetriken mit dem Amazon CloudWatch-Agent erreichen](https://aws.amazon.com/blogs/devops/new-how-to-better-monitor-your-custom-application-metrics-using-amazon-cloudwatch-agent/) 
+  [Beobachtbarkeit bei AWS](https://aws.amazon.com/products/management-and-governance/use-cases/monitoring-and-observability/) 
+  [Szenario: Metriken in CloudWatch veröffentlichen](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/PublishMetrics.html) 
+  [Mit dem Entwickeln beginnen – Effektives Überwachen Ihrer Anwendungen](https://aws.amazon.com/startups/start-building/how-to-monitor-applications/) 
+  [Verwenden von CloudWatch mit einem AWS-SDK](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/sdk-general-information-section.html) 

 **Relevante Videos:** 
+  [AWS re:Invent 2021 – Observability the open-source way (AWS re:Invent 2021 – Beobachtbarkeit nach dem Open-Source-Prinzip)](https://www.youtube.com/watch?v=vAnIhIwE5hY) 
+  [Collect Metrics and Logs from Amazon EC2 instances with the CloudWatch Agent (Erfassen von Metriken und Protokollen aus EC-Instances mit dem CW-Agent)](https://www.youtube.com/watch?v=vAnIhIwE5hY) 
+  [How to Easily Setup Application Monitoring for Your AWS Workloads (So richten Sie die Anwendungsüberwachung mühelos für Ihre AWS-Workloads ein) – AWS Online Tech Talks](https://www.youtube.com/watch?v=LKCth30RqnA) 
+  [Mastering Observability of Your Serverless Applications (Beherrschung der Beobachtbarkeit Ihrer serverlosen Anwendungen) – AWS Online Tech Talks](https://www.youtube.com/watch?v=CtsiXhiAUq8) 
+  [Open Source Observability with AWS (Open-Source-Beobachtbarkeit mit AWS) – AWS Virtual Workshop](https://www.youtube.com/watch?v=vAnIhIwE5hY) 

 **Zugehörige Beispiele:** 
+  [AWS – Protokollierung und Überwachung – Beispielressourcen](https://github.com/aws-samples/logging-monitoring-apg-guide-examples) 
+  [AWS-Lösung: Amazon CloudWatch-Überwachungs-Framework](https://aws.amazon.com/solutions/implementations/amazon-cloudwatch-monitoring-framework/?did=sl_card&trk=sl_card) 
+  [AWS-Lösung: Centralized Logging](https://aws.amazon.com/solutions/implementations/centralized-logging/) 
+  [Workshop zur Beobachtbarkeit](https://catalog.workshops.aws/observability/en-US) 

# OPS04-BP02 Implementieren und Konfigurieren der Workload-Telemetrie
<a name="ops_telemetry_workload_telemetry"></a>

 Entwickeln und konfigurieren Sie Ihren Workload so, dass Sie Informationen über den jeweiligen internen Zustand und den aktuellen Status erhalten (zum Beispiel über die Menge an API-Aufrufen, HTTP-Statuscodes und Skalierungsereignisse). Ermitteln Sie mithilfe dieser Informationen, wann ein Eingreifen erforderlich ist. 

 Verwenden Sie einen Service wie [Amazon CloudWatch,](https://aws.amazon.com/cloudwatch/) um Protokolle und Metriken aus Workload-Komponenten zu aggregieren (z. B. API-Protokolle aus [AWS CloudTrail](https://aws.amazon.com/cloudtrail/), [AWS Lambda-Metriken](https://docs.aws.amazon.com/lambda/latest/dg/lambda-monitoring.html), [Amazon VPC-Flow-Protokolle](https://docs.aws.amazon.com/vpc/latest/userguide/flow-logs.html)und [andere Services](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/aws-services-sending-logs.html)). 

 **Gängige Antimuster:** 
+  Ihre Kunden beschweren sich über eine schlechte Leistung. Ihre Anwendung wurde in der letzten Zeit nicht verändert, daher vermuten Sie ein Problem mit einer Workload-Komponente. Sie verfügen über keine Telemetrie, um zu bestimmen, welche Komponenten zur schlechten Leistung beitragen. 
+  Ihre Anwendung ist nicht erreichbar. Ihnen fehlt die Telemetrie, um festzustellen, ob es sich um ein Netzwerkproblem handelt. 

 **Vorteile der Einführung dieser bewährten Methode:** Wenn Sie verstehen, was in Ihrem Workload geschieht, können Sie bei Bedarf reagieren. 

 **Risikostufe, wenn diese bewährte Methode nicht eingeführt wird:** Hoch 

## Implementierungsleitfaden
<a name="implementation-guidance"></a>
+  Implementieren einer Protokoll- und Metriktelemetrie: Nutzen Sie Ihren Workload, um Informationen über den jeweiligen internen Zustand, den Status und die Erreichung von Geschäftsergebnissen zu erhalten. Ermitteln Sie mithilfe dieser Informationen, wann ein Eingreifen erforderlich ist. 
  +  [Bessere Überwachung Ihrer VMs mit Amazon CloudWatch – AWS Online Tech Talks](https://youtu.be/1Ck_me4azMw) 
  +  [FunktionsweiseAmazon CloudWatch von](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/cloudwatch_architecture.html) 
  +  [Was ist Amazon CloudWatch?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
  +  [Verwenden von Amazon CloudWatch-Metriken](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/working_with_metrics.html) 
  +  [Was ist Amazon CloudWatch Logs?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/WhatIsCloudWatchLogs.html) 
    +  Implementieren und Konfigurieren der Workload-Telemetrie: Entwickeln und konfigurieren Sie Ihren Workload so, dass Sie Informationen über den jeweiligen internen Zustand und den aktuellen Status erhalten (zum Beispiel über die Menge an API-Aufrufen, HTTP-Statuscodes und Skalierungsereignisse). 
      +  [Referenzinformationen zu Metriken und Dimensionen von Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 
      +  [AWS CloudTrail](https://aws.amazon.com/cloudtrail/) 
      +  [Was ist AWS CloudTrail?](https://docs.aws.amazon.com/awscloudtrail/latest/userguide/cloudtrail-user-guide.html) 
      +  [VPC Flow Logs](https://docs.aws.amazon.com/vpc/latest/userguide/flow-logs.html) 

## Ressourcen
<a name="resources"></a>

 **Zugehörige Dokumente:** 
+  [AWS CloudTrail](https://aws.amazon.com/cloudtrail/) 
+  [Amazon CloudWatch-Dokumentation](https://docs.aws.amazon.com/cloudwatch/index.html) 
+  [Referenzinformationen zu Metriken und Dimensionen von Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 
+  [FunktionsweiseAmazon CloudWatch von](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/cloudwatch_architecture.html) 
+  [Verwenden von Amazon CloudWatch-Metriken](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/working_with_metrics.html) 
+  [VPC Flow Logs](https://docs.aws.amazon.com/vpc/latest/userguide/flow-logs.html) 
+  [Was ist AWS CloudTrail?](https://docs.aws.amazon.com/awscloudtrail/latest/userguide/cloudtrail-user-guide.html) 
+  [Was ist Amazon CloudWatch Logs?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/WhatIsCloudWatchLogs.html) 
+  [Was ist Amazon CloudWatch?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 

 **Relevante Videos:** 
+  [Verwaltung der Anwendungsleistung in AWS](https://www.youtube.com/watch?v=5T4stR-HFas) 
+  [Bessere Überwachung Ihrer VMs mit Amazon CloudWatch](https://youtu.be/1Ck_me4azMw) 
+  [Bessere Überwachung Ihrer VMs mit Amazon CloudWatch – AWS Online Tech Talks](https://youtu.be/1Ck_me4azMw) 

# OPS04-BP03 Telemetrie von Benutzeraktivitäten implementieren
<a name="ops_telemetry_customer_telemetry"></a>

 Nutzen Sie Ihren Anwendungscode so, dass Sie Informationen zur Benutzeraktivität erhalten, zum Beispiel über Click-Streams oder gestartete, abgebrochene und abgeschlossene Transaktionen. Verwenden Sie diese Informationen, um zu verstehen, wie die Anwendung verwendet wird oder welche Nutzungsmuster sie aufweist, und um festzustellen, wann ein Eingreifen erforderlich ist. 

 **Gängige Antimuster:** 
+  Ihre Entwickler haben eine neue Funktion ohne Benutzertelemetrie bereitgestellt und die Auslastung ist gestiegen. Sie können nicht feststellen, ob die erhöhte Auslastung durch die neue Funktion oder durch ein Problem mit dem neuen Code bedingt ist. 
+  Ihre Entwickler haben eine neue Funktion ohne Benutzertelemetrie bereitgestellt. Sie können nicht beurteilen, ob Ihre Kunden sie verwenden, ohne sie direkt danach zu fragen. 

 **Vorteile der Einführung dieser bewährten Methode:** Erfahren Sie, wie Ihre Kunden Ihre Anwendung verwenden, um Nutzungsmuster und unerwartete Verhaltensweisen zu identifizieren und die Möglichkeit zu erhalten, bei Bedarf zu reagieren. 

 **Risikostufe, wenn diese bewährte Methode nicht eingeführt wird:** Mittel 

## Implementierungsleitfaden
<a name="implementation-guidance"></a>
+  Telemetrie von Benutzeraktivitäten implementieren: Entwickeln Sie Ihren Anwendungscode so, dass Sie Informationen zur Benutzeraktivität erhalten (zum Beispiel über Click-Streams oder gestartete, abgebrochene und abgeschlossene Transaktionen). Verwenden Sie diese Informationen, um zu verstehen, wie die Anwendung verwendet wird oder welche Nutzungsmuster sie aufweist, und um festzustellen, wann ein Eingreifen erforderlich ist. 

# OPS04-BP04 Implementieren einer Abhängigkeitstelemetrie
<a name="ops_telemetry_dependency_telemetry"></a>

 Entwerfen und konfigurieren Sie Ihren Workload so, dass er Informationen über den Status (z. B. Erreichbarkeit oder Reaktionszeit) der Ressourcen ausgibt, von denen er abhängt. Beispiele für externe Abhängigkeiten können externe Datenbanken, DNS und Netzwerkkonnektivität sein. Ermitteln Sie mithilfe dieser Informationen, wann ein Eingreifen erforderlich ist. 

 **Gängige Antimuster:** 
+  Sie können nicht feststellen, ob der Grund für die Unerreichbarkeit Ihrer Anwendung ein DNS-Problem ist, ohne manuell zu überprüfen, ob der Service Ihres DNS-Anbieters funktioniert. 
+  Ihre Warenkorb-Anwendung kann keine Transaktionen abschließen. Sie können nicht feststellen, ob es an einem Problem bei Ihrem Kreditkarten-Verarbeitungsanbieter liegt, ohne bei ihm nachzufragen. 

 **Vorteile der Einführung dieser bewährten Methode:** Wenn Sie den Zustand Ihrer Abhängigkeiten verstehen, können Sie bei Bedarf reagieren. 

 **Risikostufe, wenn diese bewährte Methode nicht eingeführt wird:** Mittel 

## Implementierungsleitfaden
<a name="implementation-guidance"></a>
+  Implementieren einer Abhängigkeitstelemetrie: Entwickeln und konfigurieren Sie Ihren Workload so, dass Sie Informationen zum Zustand und Status der Systeme erhalten, auf die er angewiesen ist. Einige Beispiele sind: externe Datenbanken, DNS, Netzwerkkonnektivität und externe Kreditkarten-Verarbeitungsservices. 
  +  [Amazon CloudWatch Agent mit AWS Systems Manager-Integration – einheitliche Metrik- und Protokollerfassung für Linux und Windows](https://aws.amazon.com/blogs/aws/new-amazon-cloudwatch-agent-with-aws-systems-manager-integration-unified-metrics-log-collection-for-linux-windows/) 
  +  [Erfassen von Metriken und Protokollen aus Amazon EC2-Instances und lokalen Servern mit dem CloudWatch Agent](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html) 

## Ressourcen
<a name="resources"></a>

 **Zugehörige Dokumente:** 
+  [Amazon CloudWatch Agent mit AWS Systems Manager-Integration – einheitliche Metrik- und Protokollerfassung für Linux und Windows](https://aws.amazon.com/blogs/aws/new-amazon-cloudwatch-agent-with-aws-systems-manager-integration-unified-metrics-log-collection-for-linux-windows/) 
+  [Erfassen von Metriken und Protokollen aus Amazon EC2-Instances und lokalen Servern mit dem CloudWatch Agent](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html) 

   **Zugehörige Beispiele:** 
+  [Well-Architected Labs – Überwachung von Abhängigkeiten](https://wellarchitectedlabs.com/operational-excellence/100_labs/100_dependency_monitoring/) 

# OPS04-BP05 Implementieren einer Nachvollziehbarkeit von Transaktionen
<a name="ops_telemetry_dist_trace"></a>

 Implementieren Sie Ihren Anwendungscode und konfigurieren Sie Ihre Workload-Komponenten so, dass Sie Informationen über den Transaktionsfluss im gesamten Workload erhalten. Verwenden Sie diese Informationen, um zu bestimmen, wann eine Reaktion erforderlich ist, und um Sie bei der Identifizierung der Faktoren zu unterstützen, die zu einem Problem beitragen. 

 In AWS können Sie verteilte Ablaufverfolgungsservices wie [AWS X-Ray](https://aws.amazon.com/xray/)verwenden, um Ablaufverfolgungen zu sammeln und aufzuzeichnen, während Transaktionen durch Ihren Workload geleitet werden, Karten generieren, um zu sehen, wie Transaktionen über Ihren Workload und Ihre Services fließen, Einblicke in die Beziehungen zwischen Komponenten gewinnen und Probleme in Echtzeit identifizieren und analysieren. 

 **Gängige Antimuster:** 
+  Sie haben eine serverlose Microservices-Architektur implementiert, die mehrere Konten umfasst. Ihre Kunden melden vorübergehende Leistungsprobleme. Sie können nicht feststellen, welche Funktion oder Komponente ursächlich ist, da Sie nicht nachvollziehen und bestimmen können, in welchem Anwendungsbereich das Leistungsproblem entsteht und wodurch es verursacht wird. 
+  Sie versuchen, festzustellen, wo sich die Flaschenhälse bei der Leistung in Ihrem Workload befinden, damit sie bei der Entwicklung behoben werden können. Sie können die Beziehung zwischen Ihren Anwendungskomponenten und den Services, mit denen sie interagieren, nicht sehen, um festzustellen, wo sich die Engpässe befinden, da Sie nicht über die Nachvollziehbarkeit verfügen, die es Ihnen ermöglichen würde, die spezifischen Services und Pfade aufzuschlüsseln, die die Anwendungsleistung beeinträchtigen. 

 **Vorteile der Einführung dieser bewährten Methode:** Wenn Sie den Transaktionsfluss in Ihrem gesamten Workload verstehen, können Sie das erwartete Verhalten Ihrer Workload-Transaktionen und Abweichungen vom erwarteten Verhalten in Ihrem gesamten Workload verstehen, sodass Sie bei Bedarf reagieren können. 

 **Risikostufe, wenn diese bewährte Methode nicht eingeführt wird:** Niedrig 

## Implementierungsleitfaden
<a name="implementation-guidance"></a>
+  Implementieren einer Nachvollziehbarkeit von Transaktionen: Entwickeln Sie Ihre Anwendung und Ihren Workload so, dass Informationen über den Transaktionsfluss aller Systemkomponenten übermittelt werden, z. B. Transaktionsstufe, aktive Komponente und Zeit bis zum Abschluss der Aktivität. Mithilfe dieser Informationen können Sie feststellen, was gerade bearbeitet wird, was bereits abgeschlossen wurde und welche Ergebnisse die abgeschlossenen Aktivitäten haben. Dadurch können Sie feststellen, wann ein Eingreifen erforderlich ist. Beispielsweise können ungewöhnlich lange Transaktionsreaktionszeiten innerhalb einer Komponente auf Probleme mit dieser Komponente hinweisen. 
  +  [AWS X-Ray](https://aws.amazon.com/xray/) 
  +  [Was ist AWS X-Ray?](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 

## Ressourcen
<a name="resources"></a>

 **Zugehörige Dokumente:** 
+  [AWS X-Ray](https://aws.amazon.com/xray/) 
+  [Was ist AWS X-Ray?](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html)