

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Überwachung mit Server-Telemetrie-Metriken
<a name="monitoring-gamelift-servers-metrics"></a>

Amazon GameLift Serverskann so konfiguriert werden, dass Telemetriedaten für Spieleserver gesammelt und veröffentlicht werden, die auf verwalteten Amazon EC2 - und Container-Flotten laufen. Diese Metriken werden verfügbar, nachdem Sie den Telemetrie-Collector mit Ihrem Server-Build bereitgestellt haben. Das Metriksystem unterstützt alle SDKs (C\$1\$1, C\$1, Go), alle Plugins (Unreal, Unity) und den Amazon GameLift Servers Game Server Wrapper. Metrikdaten fließen an [Amazon Managed Service for Prometheus](https://docs.aws.amazon.com/prometheus/latest/userguide/what-is-Amazon-Managed-Service-Prometheus.html) und [Amazon Managed Grafana-Dashboards](https://docs.aws.amazon.com/grafana/latest/userguide/what-is-Amazon-Managed-Service-Grafana.html) (zur Visualisierung empfohlen). [Überwachen Sie Amazon GameLift Servers mit Amazon CloudWatch](monitoring-cloudwatch.md)

![\[telemetry_metrics\]](http://docs.aws.amazon.com/de_de/gameliftservers/latest/developerguide/images/telemetry_metrics.png)


## Vorteile von Telemetrie-Metriken
<a name="gamelift-servers-metrics-benefits"></a>

Das Telemetrie-Metriksystem bietet fünf Hauptvorteile:
+ **Game-Engine-spezifische Metriken** — Game Engine-Plug-ins (Unreal, Unity) bieten eine native Integration mit Engine-spezifischen Leistungskennzahlen wie Server-Tick-Zeit, Framerate und Ressourcennutzung auf Engine-Ebene, die für die Optimierung der Spielleistung entscheidend sind.
+ **Unterstützung benutzerdefinierter Metriken** — Definieren und verfolgen Sie Ihre eigenen spielspezifischen Messwerte mithilfe von Server-SDK-Funktionsaufrufen, um benutzerdefinierte Gameplay-Ereignisse, die Leistung der Geschäftslogik und anwendungsspezifische Datenpunkte zu überwachen, die für Ihr Spiel wichtig sind.
+ **Automatisierte Erfassung** — Metriken fließen nach der Bereitstellung des Telemetrie-Collectors automatisch, ohne dass zusätzliche Instrumente erforderlich sind und direkte Integration mit [Amazon Managed Service für Prometheus](https://docs.aws.amazon.com/prometheus/latest/userguide/what-is-Amazon-Managed-Service-Prometheus.html) und Amazon erfolgt. CloudWatch
+ **Überwachung auf mehreren Ebenen** — Metriken auf Flottenebene für Kapazität und Skalierung, Metriken auf Instanzebene für die Ressourcennutzung und Metriken für Spielsitzungen zur Leistungsverfolgung.
+ **Universell kompatibel** — Funktioniert mit allen Amazon GameLift Servers unterstützten Entwicklungsumgebungen, ist in alle Server integriert und bietet native Unterstützung in Game SDKs Engine-Plug-ins.

**Anmerkung**  
Telemetrie-Metriken sind für Amazon GameLift Servers verwaltete Amazon EC2 - oder Containerflotten verfügbar, auf denen Amazon Linux 2023 oder Windows ausgeführt wird.

## Bevor Sie beginnen
<a name="gamelift-servers-metrics-prerequisites"></a>

### Erforderliche Ressourcen AWS
<a name="required-aws-resources"></a>
+ AWS Konto konfiguriert fürAmazon GameLift Servers.
+ Verwaltete Flotte läuft auf:
  + Amazon EC2 mit unterstützten Betriebssystemen, ODER
  + Container mit Amazon Linux 2023
+ Entsprechende IAM-Berechtigungen

### IAM-Anforderungen
<a name="iam-requirements"></a>

Die folgenden IAM-Berechtigungen sind nur erforderlich, wenn Sie den entsprechenden Dienst nutzen möchten:
+ **[Amazon Managed Service für Prometheus](https://docs.aws.amazon.com/prometheus/latest/userguide/what-is-Amazon-Managed-Service-Prometheus.html)** (nur erforderlich, wenn Metriken in Prometheus veröffentlicht werden)
  + `aps:RemoteWrite`-Berechtigung
  + Zugang zu Ihrem Prometheus-Workspace
+ **Amazon CloudWatch** (nur erforderlich, wenn Metriken auf Amazon veröffentlicht werden CloudWatch)
  + `cloudwatch:PutMetricData`-Berechtigung
  + Zugriff auf Metrik-Namespaces
+ **[Amazon Managed Grafana](https://docs.aws.amazon.com/grafana/latest/userguide/what-is-Amazon-Managed-Service-Grafana.html)** (nur erforderlich, wenn Grafana-Dashboards verwendet werden)
  + `grafana:Read`-Berechtigung
  + SSO-Konfiguration für den Zugriff auf das Dashboard

# Implementierung
<a name="gamelift-servers-metrics-setup"></a>

Wählen Sie Ihren Implementierungspfad basierend auf Ihrer Entwicklungsumgebung aus:

## SDK-Implementierung
<a name="sdk-implementation"></a>


| SDK-Typ | SDK-Einrichtung | Benutzerdefinierte Metriken | API-Referenz | 
| --- | --- | --- | --- | 
| Gehe zum SDK | [Vollständiger Einrichtungsleitfaden](https://github.com/amazon-gamelift/amazon-gamelift-servers-go-server-sdk/blob/main/telemetry-metrics/METRICS.md) | [Go Metrics API](https://github.com/amazon-gamelift/amazon-gamelift-servers-go-server-sdk/blob/main/telemetry-metrics/CUSTOM_METRICS.md) | [Go-Aktionen und Datentypen](https://docs.aws.amazon.com/gamelift/latest/developerguide/integration-server-sdk-go-actions.html) | 
| C\$1-SDK | [Vollständiger Einrichtungsleitfaden](https://github.com/amazon-gamelift/amazon-gamelift-servers-csharp-server-sdk/blob/main/telemetry-metrics/METRICS.md) | [C\$1-Metriken-API](https://github.com/amazon-gamelift/amazon-gamelift-servers-csharp-server-sdk/blob/main/telemetry-metrics/CUSTOM_METRICS.md) | [C\$1-Aktionen und Datentypen](https://docs.aws.amazon.com/gamelift/latest/developerguide/integration-server-sdk5-csharp-actions.html) | 
| C\$1\$1-SDK | [Vollständiger Einrichtungsleitfaden](https://github.com/amazon-gamelift/amazon-gamelift-servers-cpp-server-sdk/blob/main/telemetry-metrics/METRICS.md) | [API für C\$1\$1-Metriken](https://github.com/amazon-gamelift/amazon-gamelift-servers-cpp-server-sdk/blob/main/telemetry-metrics/CUSTOM_METRICS.md) | [C\$1\$1-Aktionen und Datentypen](https://docs.aws.amazon.com/gamelift/latest/developerguide/integration-server-sdk5-cpp-actions.html) | 

## Plugin-Implementierung
<a name="plugin-implementation"></a>


| Plug-In | Plugin-Einrichtung | Benutzerdefinierte Metriken | API-Referenz | 
| --- | --- | --- | --- | 
| Unwirklich | [Vollständiger Einrichtungsleitfaden](https://github.com/amazon-gamelift/amazon-gamelift-plugin-unreal/blob/main/TelemetryMetrics/METRICS.md) | [Unreal Metrics API](https://github.com/amazon-gamelift/amazon-gamelift-plugin-unreal/blob/main/TelemetryMetrics/CUSTOM_METRICS.md) | [Unreale Aktionen und Datentypen](https://docs.aws.amazon.com/gamelift/latest/developerguide/integration-server-sdk5-unreal-actions.html) | 
| Einheit | [Vollständiger Einrichtungsleitfaden](https://github.com/amazon-gamelift/amazon-gamelift-plugin-unity/blob/main/TelemetryMetrics/METRICS.md) | [Unity Metrics API](https://github.com/amazon-gamelift/amazon-gamelift-plugin-unity/blob/main/TelemetryMetrics/CUSTOM_METRICS.md) | [C\$1-Aktionen und Datentypen](https://docs.aws.amazon.com/gamelift/latest/developerguide/integration-server-sdk5-csharp-actions.html) | 

## Arbeitsablauf bei der Implementierung
<a name="implementation-workflow"></a>

Jede Implementierung folgt einem zweistufigen Prozess:

1. **Vollständiger Einrichtungsleitfaden (Metrics.md)** — Infrastrukturbereitstellung, AWS Infrastrukturkonfiguration, Flotteneinrichtung und Grafana-Dashboard-Konfiguration.

1. **API-Implementierungsleitfaden (Custom\$1Metrics.md)** — Sprachspezifische SDK-Nutzung, Metriktypen, Erstellung benutzerdefinierter Metriken und erweiterte Konfiguration.

### Verifizierung
<a name="verification"></a>

1. Überprüfen Sie den Metrikfluss, indem Sie Ihren [Amazon Managed Service for Prometheus](https://docs.aws.amazon.com/prometheus/latest/userguide/what-is-Amazon-Managed-Service-Prometheus.html) Workspace oder Ihre CloudWatch Amazon-Konsole auf eingehende Telemetriedaten überprüfen.

1. Überprüfen Sie die Sichtbarkeit des Dashboards in [Amazon Managed Grafana](https://docs.aws.amazon.com/grafana/latest/userguide/what-is-Amazon-Managed-Service-Grafana.html) mithilfe der vorgefertigten Dashboards.

1. Testen Sie benutzerdefinierte Metriken, indem Sie überprüfen, ob sie in Ihren Monitoring-Dashboards angezeigt werden.

**Anmerkung**  
Kehren Sie nach Abschluss der Implementierung zu dieser Seite zurück und gehen Sie zur Seite [Verfügbare Metriken](gamelift-servers-metrics-types.md).

# Verfügbare Metriken
<a name="gamelift-servers-metrics-types"></a>

Metriken lassen sich in drei Kategorien einteilen:
+ Automatisch gesammelte Metriken
+ Vom SDK bereitgestellte Metriken
+ Benutzerdefinierte Metriken

## Automatische Erfassung von Metriken
<a name="metrics-automatic-collection"></a>

Für diese Metriken sind keine Codeänderungen erforderlich:

### Instance-Metriken
<a name="metrics-instance-level"></a>


| Metrik: Typ | Description | Anwendungsfall | 
| --- | --- | --- | 
| CPU | Prozentuale Auslastung pro Instanz | Ressourcenüberwachung | 
| Arbeitsspeicher | Physischer Speicherverbrauch und Prozentsatz | Kapazitätsplanung | 
| Netzwerk-I/O | Gesendete/empfangene Bytes und Pakete | Zustand der Verbindung | 
| Festplatten-IO | Lese-/Schreibvorgänge und Durchsatz | Speicherleistung | 

### Flottenmetriken
<a name="metrics-fleet-level"></a>


| Metrik: Typ | Description | Anwendungsfall | 
| --- | --- | --- | 
| Aktive Instanzen | Anzahl laufender Instanzen | Skalierung der Flotte | 
| Spielsitzungen | Aktive und verfügbare Sitzungen | Kapazitätsverwaltung | 
| Abgestürzte Spielsitzungen | Spielsitzungen, die abgestürzt sind | Fehlerüberwachung | 

## Vom SDK bereitgestellte Metriken
<a name="metrics-sdk-functions"></a>

Erfordert SDK-Funktionsaufrufe in Ihrem Code:

### Metriken zur Serverzeit
<a name="metrics-server-timings"></a>


| Metrik | Description | Implementierung | 
| --- | --- | --- | 
| Server-Delta-Zeit | Zeitunterschied zwischen dem aktuellen Server-Tick und dem vorherigen Server-Tick. Misst die Konsistenz der Tick-Rate des Servers | Rufen Sie an GetDeltaTime () | 
| Server-Tick-Rate | Zeigt an, wie oft der Server pro Sekunde Updates verarbeitet | Automatisch berechnet | 
| Server-Tick-Zeit | Die Zeit, die der Server benötigt, um einen einzelnen Tick oder ein Update zu verarbeiten | Rufen Sie an GetTickTime () | 
| Die Zeit der Serverwelt ist abgelaufen | Die Zeit, die der Server benötigt, um die Spielwelt mit jedem Tick zu aktualisieren | Rufen Sie an GetWorldUpdateTime () | 

**Implementierung:** Für Engine-unabhängige Anwendungen SDKs (C\$1\$1, C\$1, Go) implementieren Sie diese Metriken, indem Sie SDK-Funktionen aus Ihrem Game-Loop mit berechneten Timing-Werten aufrufen. Bei Engine-Plugins (Unreal, Unity) werden diese Metriken automatisch durch die Engine-Integration erfasst.

### Netzwerkmetriken
<a name="metrics-networking"></a>


| Metrik | Description | Implementierung | 
| --- | --- | --- | 
| Verbindungen | Die Gesamtzahl der Netzwerkverbindungen, die der Server hergestellt hat | Automatisch nach InitMetrics () | 
| Netzwerk I/O (Byte) | Die Gesamtzahl der Byte, die vom Server über das Netzwerk gesendet und empfangen wurden | Automatisch nach InitMetrics () | 
| Netzwerk I/O (Pakete) | Die Gesamtzahl der Netzwerkpakete, die vom Server gesendet und empfangen wurden | Automatisch nach InitMetrics () | 
| Verlust von Paketen | Der Prozentsatz der Netzwerkpakete, die während der Übertragung verloren gehen | Automatisch nach InitMetrics () | 

**Implementierung:** Integrieren Sie SDK-Funktionsaufrufen in Ihre Netzwerkbibliothek. Das SDK bietet Anleitungen für verschiedene Netzwerkimplementierungen.

### Metriken verarbeiten
<a name="metrics-process-level"></a>


| Metrik | Description | Implementierung | 
| --- | --- | --- | 
| CPU-Auslastung (%) | Der Prozentsatz der CPU-Ressourcen, die vom Spieleserverprozess genutzt werden | Automatisch nach InitMetrics () | 
| Speichernutzung (Einheiten) | Die Gesamtmenge an Arbeitsspeicher, die von den Serverprozessen verbraucht wird | Automatisch nach InitMetrics () | 
| Physikalische Speicherauslastung (%) | Der Prozentsatz des gesamten physischen Speichers des Servers, der derzeit genutzt wird | Automatisch nach InitMetrics () | 
| Serverstatus | Zustand des Spieleservers | Automatisch nach InitMetrics () | 

**Implementierung:** Diese Metriken werden automatisch vom SDK für jede Spielsitzung erfasst.

#### Organisation des Dashboards pro Prozess
<a name="process-metrics-dashboards"></a>

Prozessspezifische Kennzahlen sind in zwei speziellen Dashboards verfügbar:
+ **Serverleistungs-Dashboard** — Enthält Server-Timings (Deltazeit, Tick-Rate, Tick-Zeit, Welt-Tick-Zeit), Netzwerkmetriken (Verbindungen, I/O Bytes/Pakete, Paketverlust), Speicherauslastung und CPU-Auslastung für einzelne Spielsitzungen.
+ **Dashboard zur Instanzleistung** — Mit den Tabellen „Spielesitzungen mit den meisten Speicherbelastungen“ und „Spielesitzungen mit den meisten CPU-Ausgaben“ können Sie ermitteln, welche Prozesse am meisten zum Ressourcenverbrauch der Instanzen beitragen. Wenn Sie auf die Links zu Spielsitzungen klicken, können Sie detaillierte Messwerte genauer untersuchen.

#### Anwendungsfälle für Metriken pro Prozess
<a name="process-metrics-use-cases"></a>

Die prozessualen per-game-session Metriken unterstützen die folgenden Überwachungsszenarien:
+ **Umfassende Leistungsuntersuchungen** — Wenn die Leistung eines Systems aufgrund bestimmter Prozesse oder Spielsitzungen beeinträchtigt host/instance wurde, können anhand der Statistiken pro Prozess anhand der Tabellen mit den meisten CPUs- und Speicherbelastenden Spielsitzungen ermittelt werden, welcher Prozess das Problem verursacht hat.
+ **Untersuchung von Spielserverabstürzen** — Wenn eine Spielsitzung abstürzt, können Sie anhand dieser Messwerte feststellen, ob der Absturz auf Speichermangel, CPU-Überlastung oder Probleme mit der Netzwerkbandbreite zurückzuführen ist.
+ **Untersuchen Sie von Spielern gemeldete Probleme** — Wenn Spieler Verzögerungen oder Unterbrechungen während des Spiels melden, helfen Metriken pro Prozess dabei, Engpässe bei CPU, Arbeitsspeicher, Netzwerk, Tick-Zeit oder Welt-Update-Zeit zu identifizieren.
+ **Identifizieren Sie Leistungsänderungen in verschiedenen Builds** — Mithilfe der Messwerte Ticktime, Tick-Rate und Weltupdate-Zeit können Entwickler messen, wie sich die Spielleistung zwischen verschiedenen Server-Builds verändert.
+ **Erkennen Sie Verzögerungen und Langsamkeit im Gameplay** — Die Messwerte für Ticktime, Tick-Rate und Weltupdate geben an, wie schnell der Server das Spiel aktualisiert, was sich direkt auf das Kundenerlebnis auswirkt.
+ **Benchmarking** — Identifizieren Sie anhand von Faktoren wie Spielerzahl, Spielmodus und anderen Variablen, wie sich verschiedene Spielszenarien auf die Serverleistung auswirken.

## Organisation des Dashboards
<a name="metrics-dashboard-usage"></a>

Metriken sind in [Amazon Managed Grafana](https://docs.aws.amazon.com/grafana/latest/userguide/what-is-Amazon-Managed-Service-Grafana.html) in speziellen Dashboards für verschiedene Überwachungsszenarien organisiert. Die verfügbaren Dashboards hängen von Ihrem Flottentyp ab:

### EC2 Flotten-Dashboards
<a name="ec2-fleet-dashboards"></a>
+ **EC2 Dashboard mit Flottenübersicht** — Flottenkapazität auf hohem Niveau, Einblicke in die Skalierung, gleichzeitige Spieler (CCU), Instanzen, Spielerkapazität und abgestürzte Spielsitzungen.
+ **Dashboard mit Instanzenübersicht** — Aggregierte Metriken auf Host-Ebene für alle Instances, einschließlich durchschnittlicher CPU-, Arbeitsspeicher-, Netzwerk- und Festplattenauslastung.
+ **Dashboard zur Instanzleistung** — Detaillierte Metriken für einzelne Instances mit den Tabellen „Spielesitzungen mit den meisten Speicherbelastungen“ und „Spielesitzungen mit den meisten CPU-Verbrauch“ zur Identifizierung ressourcenintensiver Prozesse.
+ **Dashboard zur Serverleistung (EC2)** — Timing, Netzwerkleistung, Arbeitsspeicher und CPU-Metriken für einzelne Spielsitzungen auf EC2 Instanzen.

### Dashboards für Containerflotten
<a name="container-fleet-dashboards"></a>
+ **Dashboard „Übersicht über die Containerflotte**“ — Allgemeiner Überblick über die Auslastung der Containerflotten, einschließlich CPU-Reservierung, Speicherauslastung und Status der Containergruppen.
+ **Dashboard zur Container-Performance** — Detaillierte Kennzahlen für einzelne Container im Rahmen bestimmter ECS-Aufgaben, einschließlich CPU-Auslastung, Speicherauslastung, Netzwerk-I/O und Speicherleistung.
+ **Dashboard zur Serverleistung (Container)** — Timing, Netzwerkleistung, Arbeitsspeicher und CPU-Metriken für einzelne Spielsitzungen in Containern.

Ausführliche Informationen und Nutzungsanweisungen zum Dashboard finden Sie unter[Organisation und Nutzung des Dashboards](gamelift-servers-metrics-dashboards.md).

# Funktionsweise
<a name="gamelift-servers-metrics-architecture"></a>

Das Telemetrie-Metriksystem folgt einem einfachen vierstufigen Datenfluss von Ihren Spieleservern zu den Visualisierungs-Dashboards.

**Erfassung:** Ihr Spieleserver, der in das GameLift Server-SDK oder -Plugin integriert ist, sendet automatisch Messwerte an einen lokalen Telemetrie-Collector, der auf derselben Instanz läuft. Das SDK erfasst sowohl automatische Messwerte (Serverlebenszyklus, Ressourcennutzung) als auch benutzerdefinierte Messwerte, die Sie in Ihrem Code definieren.

**Verarbeitung:** Der Telemetrie-Collector aggregiert Metriken von deinem Spieleserver und kombiniert sie mit Leistungsdaten auf Instanzebene (CPU, Arbeitsspeicher, Netzwerk, Festplattennutzung). Auf diese Weise erhalten Sie ein vollständiges Bild sowohl der Leistung Ihres Spiels als auch der zugrunde liegenden Infrastruktur.

**Speicher:** Verarbeitete Metriken werden in ein Metrik-Warehouse Ihrer Wahl exportiert — [Amazon Managed Service for Prometheus](https://docs.aws.amazon.com/prometheus/latest/userguide/what-is-Amazon-Managed-Service-Prometheus.html) für die Hochleistungsspeicherung von Zeitreihen, Amazon CloudWatch für die AWS Serviceintegration oder beides. Die gesamte Datenübertragung ist authentifiziert und verschlüsselt.

**Visualisierung:** [Amazon Managed Grafana](https://docs.aws.amazon.com/grafana/latest/userguide/what-is-Amazon-Managed-Service-Grafana.html) stellt eine Verbindung zu Ihrem Metrik-Warehouse her, um vorgefertigte Dashboards GameLift anzuzeigen. Diese Dashboards bieten Flottenübersichten, Details zur Serverleistung und Ansichten zur Container-Überwachung, mit denen Sie Ihre Spiele-Hosting-Infrastruktur überwachen und Fehler beheben können.

**Anmerkung**  
Aus Sicherheitsgründen erfolgt die gesamte Übertragung von Metriken zwischen deinem Spieleserver und dem Telemetrie-Collector lokal auf der Instance. Nur der Collector kommuniziert mit AWS Diensten unter Verwendung der richtigen Authentifizierung.

# Organisation und Nutzung des Dashboards
<a name="gamelift-servers-metrics-dashboards"></a>

Sehen Sie sich Ihre Kennzahlen auf umfassenden Dashboards in [Amazon Managed Grafana](https://docs.aws.amazon.com/grafana/latest/userguide/what-is-Amazon-Managed-Service-Grafana.html) an. Die verfügbaren Dashboards hängen von Ihrem Flottentyp ab:

## Verfügbarkeit der Dashboards nach Flottenart
<a name="dashboard-fleet-types"></a>

Die folgende Tabelle zeigt, welche Dashboards für die einzelnen Flottenarten verfügbar sind:


| Dashboard | Flottentyp | Description | 
| --- | --- | --- | 
| EC2 Überblick über die Flotte | EC2 Flotte | Zeigt Informationen zu gleichzeitigen Spielern (CCU), Instanzen und Spielerkapazität an | 
| Überblick über die Instanzen | EC2 Flotte | Zeigt die durchschnittliche CPU-, Arbeitsspeicher- und Netzwerkauslastung für alle Flotteninstanzen an | 
| Instance-Leistung | EC2 Flotte | Zeigt detaillierte Metriken (CPU, Arbeitsspeicher, Festplatte, Netzwerk) für eine einzelne Instanz an | 
| Überblick über die Containerflotte | Containerflotte | Zeigt die durchschnittliche Ressourcenauslastung aller Container in einer verwalteten Containerflotte an | 
| Leistung von Containern | Containerflotte | Zeigt detaillierte Metriken einzelner Container innerhalb einer bestimmten ECS-Aufgabe an | 
| Serverleistung | beides | Zeigt die Netzwerk-, Speicher- und Laufzeitleistung eines bestimmten Spielserverprozesses an (separate Versionen für Flotten EC2 und Container-Flotten) | 

**Verwaltete EC2 Flotten:**
+ EC2 Die Flottenübersicht bietet umfassende Einblicke in die Flottenkapazität und Skalierung.
+ Verwenden Sie die Dashboards Instances Overview und Instance Performance für die Überwachung auf Host-Ebene.
+ Metriken, die über den Hostmetrics-Empfänger erfasst wurden, sorgen für Transparenz auf Systemebene.
+ Konzentrieren Sie sich auf die Nutzung und Leistung der EC2 Instanzressourcen.
+ Server Performance (EC2) überwacht die Anwendungsmetriken für Spieleserver unabhängig von der zugrunde liegenden Infrastruktur.

**Verwaltete Containerflotten:**
+ Verwenden Sie die Dashboards „Container Fleet Overview“ und „Container Performance“ für die Überwachung von ECS-Aufgaben und Containern.
+ Mit ECS Container Receiver gesammelte Metriken sorgen für eine transparente Darstellung der Workloads in Containern.
+ Konzentrieren Sie sich auf die Aggregation auf Aufgabenebene und die Isolierung von Container-Ressourcen.
+ Server Performance (Container) überwacht die Anwendungsmetriken von Spieleservern unabhängig von der zugrunde liegenden Infrastruktur.

## EC2 Dashboard mit Flottenübersicht
<a name="fleet-overview-dashboard"></a>

Dieses Dashboard bietet einen umfassenden Überblick über die Auslastung und Kapazität Ihrer Flotte weltweit und nach Standorten. Es enthält Grafiken, die die Anzahl der Stopps, Starts und Abstürze von Spieleservern sowie den Prozentsatz intakter Spieleserver anzeigen. Sie können nach FleetID und Standort filtern.

### Kennzahlen im Überblick über die Flotte
<a name="fleet-overview-metrics"></a>

Die folgende Tabelle zeigt die Kennzahlen, die im Flottenübersicht-Dashboard verfügbar sind:

[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/gameliftservers/latest/developerguide/gamelift-servers-metrics-dashboards.html)

**Anmerkung**  
CCU-Metriken müssen in Ihrem Spieleservercode implementiert werden. Diese Messwerte werden nicht automatisch erfasst und müssen von Ihrer Anwendung implementiert und gemeldet werden.

## Dashboard zur Übersicht der Instanzen
<a name="instances-overview-dashboard"></a>

Dieses Dashboard bietet aggregierte Metriken auf Host-Ebene für alle Instances in Ihrer Flotte. Aktuelle Durchschnittswerte zeigen den Gesamtstatus der Instances. Wenn die Leistung nachlässt, überprüfen Sie die CPU-Auslastung, den Speicherverbrauch, den Netzwerk- und Festplattenverbrauch auf Engpässe. Sie können nach FleetID und Standort filtern.

### Kennzahlen im Überblick über Instanzen
<a name="instances-overview-metrics"></a>

Die folgende Tabelle zeigt die Metriken, die im Dashboard „Instanzenübersicht“ verfügbar sind:

[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/gameliftservers/latest/developerguide/gamelift-servers-metrics-dashboards.html)

**Anmerkung**  
Metriken auf Instance-Ebene werden über den Hostmetrics-Empfänger erfasst und bieten einen Überblick über die Infrastrukturleistung Ihrer Flotte auf Systemebene. Verwenden Sie dieses Dashboard, um allgemeine Trends zum Zustand der Flotte zu ermitteln und einzelne Fälle aufzuschlüsseln, wenn Leistungsprobleme festgestellt wurden.

## Dashboard zur Instanzleistung
<a name="instance-performance-dashboard"></a>

Dieses Dashboard bietet detaillierte Leistungskennzahlen für einzelne Instances. Aktuelle Durchschnittswerte zeigen den allgemeinen Zustand der Instance. Wenn die Leistung nachlässt, überprüfen Sie die CPU-Auslastung, den Speicherverbrauch und den Dateisystemverbrauch auf Engpässe. Es enthält Tabellen mit den meisten speicherintensiven Spielesitzungen und den meisten CPU-intensiven Spielesitzungen, anhand derer ermittelt werden kann, welche Prozesse am meisten zum Ressourcenverbrauch der Instanzen beitragen. Wenn Sie auf die Links zu Spielsitzungen klicken, können Sie detaillierte Messwerte genauer untersuchen. Du kannst nach einer bestimmten Instanz-ID filtern.

### Kennzahlen zur Instanz-Leistung
<a name="instance-performance-metrics"></a>

Die folgende Tabelle zeigt die Metriken, die im Dashboard zur Instanzleistung verfügbar sind:

[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/gameliftservers/latest/developerguide/gamelift-servers-metrics-dashboards.html)

**Anmerkung**  
Die Tabellen mit den meisten Arbeitsspeicher- und CPU-intensiven Spielsitzungen sind wichtig, um Leistungsengpässe und ressourcenintensive Prozesse zu identifizieren, die sich auf die Gesamtleistung der Instance auswirken können. Diese Ranglisten ermöglichen eine schnelle Identifizierung problematischer Spielsitzungen zur weiteren Untersuchung.

## Dashboard zur Übersicht über die Containerflotte
<a name="container-fleet-overview-dashboard"></a>

Dieses Dashboard bietet einen umfassenden Überblick über die Ressourcennutzung und Kapazität Ihrer Containerflotte. Es zeigt die durchschnittliche Ressourcennutzung aller Container in einer verwalteten Containerflotte an, einschließlich CPU-Reservierung, Speicherauslastung und Status der Containergruppen. Sie können nach FleetID und Standort filtern.

### Kennzahlen zur Übersicht über die Containerflotte
<a name="container-fleet-overview-metrics"></a>

Die folgende Tabelle zeigt die Kennzahlen, die im Dashboard „Container Fleet Overview“ verfügbar sind:

[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/gameliftservers/latest/developerguide/gamelift-servers-metrics-dashboards.html)

**Anmerkung**  
Metriken zur Containerflotte werden über ECS Container Receiver erfasst und bieten einen Überblick über die Workloads in Containern, wobei der Schwerpunkt auf der Aggregation auf Aufgabenebene und der Isolierung von Container-Ressourcen liegt.

## Dashboard zur Container-Leistung
<a name="container-performance-dashboard"></a>

Dieses Dashboard bietet detaillierte Leistungskennzahlen für einzelne Container innerhalb bestimmter ECS-Aufgaben. Es zeigt detaillierte Metriken einzelner Container an, darunter CPU-Auslastung, Speicherauslastung, Netzwerk-I/O und Speicherleistung. Sie können nach einer bestimmten Container-ID oder ECS-Task filtern.

### Kennzahlen zur Container-Leistung
<a name="container-performance-metrics"></a>

Die folgende Tabelle zeigt die Metriken, die im Container Performance-Dashboard verfügbar sind:

[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/gameliftservers/latest/developerguide/gamelift-servers-metrics-dashboards.html)

**Anmerkung**  
Container-Leistungskennzahlen bieten einen detaillierten Einblick in den Ressourcenverbrauch einzelner Container und die Leistungsmerkmale innerhalb von ECS-Aufgaben.

## Dashboard zur Serverleistung
<a name="server-performance-dashboard"></a>

Das Serverleistungs-Dashboard zeigt Messwerte zu Serverzeiten, Netzwerkaktivität, Arbeitsspeicher und CPU-Auslastung für einzelne Spielsitzungen. Sie können nach der Game Session ID filtern und Metriken direkt nach Amazon CloudWatch oder [Amazon Managed Grafana](https://docs.aws.amazon.com/grafana/latest/userguide/what-is-Amazon-Managed-Service-Grafana.html) exportieren.

### Metriken zur Serverleistung
<a name="server-performance-metrics"></a>

Die folgende Tabelle zeigt die Messwerte, die im Serverleistungs-Dashboard verfügbar sind:

[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/gameliftservers/latest/developerguide/gamelift-servers-metrics-dashboards.html)

# Allgemeine Überwachungsszenarien
<a name="gamelift-servers-metrics-scenarios"></a>

## Tauchen Sie tief in die Leistungsuntersuchung ein
<a name="scenario-dive-deep-performance"></a>

**Szenario:** A weist host/instance aufgrund bestimmter Prozesse oder Spielsitzungen eine Leistungseinbuße auf

**Schritte der Untersuchung:**
+ Rufen Sie das Dashboard zur Instanzleistung auf.
+ Sehen Sie sich die Tabelle „Spielsitzungen mit den meisten Speicherbelastungen“ an, um herauszufinden, welche Prozesse am meisten zum Speicherverbrauch der Instances beitragen.
+ In der Tabelle mit den meisten CPU-intensiven Spielesitzungen finden Sie heraus, welche Prozesse am meisten zur CPU-Auslastung der Instanzen beitragen.
+ Klicken Sie auf die Links zu Spielsitzungen, um eine genauere Untersuchung detaillierter Messwerte zu erhalten.
+ Analysieren Sie die Serverzeiten (Server Delta Time, Server Tick Rate, Server Tick Time, Server World Tick Time), um Leistungsengpässe zu identifizieren.

## Untersuchung von Spielserverabstürzen
<a name="scenario-game-server-crash"></a>

**Szenario:** Eine Spielsitzung ist abgestürzt und Sie müssen die Ursache ermitteln

**Schritte der Untersuchung:**
+ Greifen Sie auf das Serverleistungs-Dashboard für die abgestürzte Spielsitzung zu.
+ Überprüfe die Speichernutzung (Einheiten) und die physische Speicherauslastung (%), um festzustellen, ob der Absturz auf zu wenig Arbeitsspeicher zurückzuführen ist.
+ Überprüfen Sie die CPU-Auslastung (%), um festzustellen, ob die CPU-Überlastung den Absturz verursacht hat.
+ Analysieren Sie Netzwerk I/O (Byte) und Netzwerk I/O (Pakete), um festzustellen, ob Probleme mit der Netzwerkbandbreite zum Absturz beigetragen haben.
+ Untersuchen Sie den Prozentsatz des Paketverlusts, um Netzwerkprobleme zu identifizieren.

## Untersuchen Sie die vom Spieler gemeldeten Probleme
<a name="scenario-player-reported-issues"></a>

**Szenario:** Spieler melden Verzögerungen oder Unterbrechungen während des Spiels

**Schritte der Untersuchung:**
+ Greifen Sie auf das Serverleistungs-Dashboard für die betroffene Spielsitzung zu.
+ Überprüfe Server Tick Time und Server World Tick Time, um Verzögerungen bei Spielupdates zu erkennen.
+ Überprüfe die Server-Tick-Rate, um eine gleichbleibende Häufigkeit der Server-Updates sicherzustellen.
+ Analysieren Sie die CPU-Auslastung (%), um Verarbeitungsengpässe zu identifizieren.
+ Überprüfen Sie die Kennzahlen zur Speicherauslastung, um speicherbezogene Leistungsprobleme zu identifizieren.
+ Überprüfen Sie I/O Netzwerkmetriken und Paketverlust, um Netzwerkengpässe zu identifizieren.

## Identifizieren Sie Leistungsänderungen in verschiedenen Spielserver-Builds
<a name="scenario-performance-changes-builds"></a>

**Szenario:** Sie möchten messen, wie sich die Spielleistung zwischen verschiedenen Server-Builds verändert

**Schritte der Untersuchung:**
+ Vergleichen Sie die Server Tick Time-Metriken zwischen verschiedenen Builds, um Änderungen der Verarbeitungseffizienz zu messen.
+ Analysieren Sie die Konsistenz der Server-Tick-Rate zwischen Builds, um Leistungseinbußen zu identifizieren.
+ Überprüfen Sie die Server World Tick Time, um die Leistungsänderungen bei Spielwelt-Updates zu messen.
+ Vergleichen Sie die Muster der Speichernutzung zwischen Builds, um Verbesserungen oder Regressionen bei der Speicheroptimierung zu ermitteln.
+ Überwachen Sie Trends bei der CPU-Auslastung, um Veränderungen der Recheneffizienz zu beurteilen.

## Erkenne Verzögerungen und Langsamkeit im Gameplay
<a name="scenario-detect-gameplay-delays"></a>

**Szenario:** Sie müssen die Reaktionsfähigkeit des Servers und die Geschwindigkeit der Spielupdates überwachen

**Schritte der Untersuchung:**
+ Überwachen Sie die Server-Tick-Zeit, um zu messen, wie schnell der Server jeden Aktualisierungszyklus verarbeitet.
+ Verfolge die Server-Tick-Rate, um konsistente Aktualisierungen des Spielstatus pro Sekunde sicherzustellen.
+ Analysieren Sie die Server World Tick Time, um die Aktualisierungsgeschwindigkeit der Spielwelt zu messen, was sich direkt auf das Kundenerlebnis auswirkt.
+ Richten Sie Warnmeldungen für Schwankungen der Server-Deltazeit ein, um eine inkonsistente Serverleistung zu erkennen.

## Benchmarking verschiedener Spielszenarien
<a name="scenario-benchmarking"></a>

**Szenario:** Sie möchten herausfinden, wie sich verschiedene Spielszenarien auf die Serverleistung auswirken

**Schritte der Untersuchung:**
+ Vergleichen Sie die Serverleistungskennzahlen verschiedener Spieler, um die Auswirkungen der Skalierung zu verstehen.
+ Analysieren Sie Leistungsunterschiede zwischen den Spielmodi mithilfe von Server-Tick-Time- und CPU-Nutzungsmetriken.
+ Überwachen Sie die Muster der Speichernutzung in verschiedenen Spielszenarien, um ressourcenintensive Funktionen zu identifizieren.
+ Verfolge I/O Netzwerkmetriken, um die Bandbreitenanforderungen für verschiedene Spielszenarien zu verstehen.
+ Ermitteln Sie anhand des Dashboards zur Instanzleistung, welche Spielszenarien zu den ressourcenintensivsten Spielsitzungen führen.

## Reaktion bei hoher Ressourcenauslastung
<a name="scenario-high-resource-utilization"></a>

**Szenario:** Ungewöhnliche Ressourcenspitzen (CPU > 85%, Arbeitsspeicher > 90%)

**Schritte der Untersuchung:**

### Identifizieren Sie die betroffenen Ressourcen
<a name="identify-affected-resources"></a>
+ Verwenden Sie die DescribeGameSessionDetails API.
+ Filtern Sie bei Bedarf nach Status.
+ Dokumentieren Sie die betroffenen Instanzen.

### Analysieren Sie die Ressourcennutzung
<a name="analyze-resource-usage"></a>
+ Überprüfen Sie das Dashboard mit der Instanzübersicht.
+ Vergleichen Sie die Auslastung zwischen den einzelnen Flotten.
+ Prüfen Sie historische Muster.

### Überwachen Sie die Auswirkungen auf den Spielserver
<a name="monitor-game-server-impact"></a>
+ Überprüfe die Metriken zur Serverleistung.
+ Überprüfen Sie die Tick-Zeiten und den Paketverlust.
+ Überwachen Sie Speicherlecks.

### Lösungsschritte
<a name="resolution-steps"></a>
+ Laden Sie Sitzungsprotokolle herunter.
+ Beheben Sie Probleme beim Erstellen.
+ Überwachen Sie die Verbesserungen.

## Absturzanalyse des Spieleservers
<a name="scenario-server-crashes"></a>

**Szenario:** Mehrere Spielsitzungen mit Fehlerstatus in der gesamten Flotte

**Schritte der Untersuchung:**

### Erste Bewertung
<a name="initial-assessment"></a>
+ Rufen Sie das Dashboard „Flottenübersicht“ auf.
+ Überprüfen Sie die Tabelle der abgestürzten Sitzungen.
+ Beachten Sie Muster in Bezug auf Zeit und Ort.

### Leistungsanalyse
<a name="performance-analysis"></a>
+ Überprüfen Sie die Server-Timing-Metriken.
+ Überprüfen Sie die Ressourcennutzung.
+ Überwachen Sie die Netzwerkleistung.

### Überprüfung der Infrastruktur
<a name="infrastructure-review"></a>
+ Überprüfen Sie die Flottenkapazität.
+ Überprüfen Sie den Zustand der Instanz.
+ Überprüfen Sie die Skalierungsrichtlinien.

### Lösungspfad
<a name="resolution-path"></a>
+ Analysieren Sie Serverprotokolle.
+ Überprüfen Sie die Code-Optimierung.
+ Implementieren Sie Korrekturen.

## Optimierung der Flottenkapazität
<a name="scenario-fleet-optimization"></a>

**Szenario:** Spielstart oder Benchmark-Studie

**Schritte der Analyse:**

### Ressourcenauslastung
<a name="resource-utilization"></a>
+ Nach Standort filtern.
+ Überprüfen Sie die P50/P95/P99-Metriken.
+ Analysieren Sie Nutzungsmuster.

### Analyse des Instanztyps
<a name="instance-type-analysis"></a>
+ Vergleichen Sie die Leistung nach Typ.
+ Identifizieren Sie Skalierungskandidaten.
+ Nutzungsmuster von Dokumenten.

### Optimierungsmaßnahmen
<a name="optimization-actions"></a>
+ Passen Sie die Skalierungsrichtlinien an.
+ Ändern Sie die Instanztypen.
+ Aktualisieren Sie die Flottenkonfiguration.

# Anleitung zur Fehlerbehebung
<a name="gamelift-servers-metrics-troubleshooting"></a>

## Allgemeine Probleme und Lösungsschritte
<a name="common-issues-resolution"></a>

### Fehlende oder unvollständige Metriken
<a name="troubleshooting-missing-metrics"></a>

#### Symptome
<a name="missing-metrics-symptoms"></a>
+ In den Dashboards werden keine Metriken angezeigt.
+ Teilweise Erfassung von Metriken.
+ Verzögerte Metrikaktualisierungen.

#### Lösungsschritte
<a name="missing-metrics-resolution"></a>

##### A. Überprüfen Sie den Collector-Status
<a name="verify-collector-status"></a>

Überprüfen Sie den Systemd-Dienst:

```
sudo systemctl status gamelift-telemetry-collector
```

Collector-Protokolle überprüfen:

```
sudo journalctl -u gamelift-telemetry-collector
```
+ Bestätigen Sie die Collector-Konfiguration.

##### B. Überprüfung der IAM-Berechtigungen
<a name="iam-permission-verification"></a>
+ Überprüfen Sie die Berechtigungen für die Instanzrolle.
+ Überprüfen Sie die erforderlichen Richtlinien:
  + `aps:RemoteWrite`
  + `cloudwatch:PutMetricData`
+ Überprüfen Sie die Vertrauensbeziehungen der Rollen.

##### C. Netzwerkkonnektivität
<a name="network-connectivity"></a>
+ Überprüfen Sie den Endpunktzugriff.
+ Überprüfen Sie die Sicherheitsgruppenregeln.
+ Überprüfen Sie das Netzwerk ACLs.

### Authentifizierungsfehler
<a name="troubleshooting-authentication-errors"></a>

#### Symptome
<a name="auth-errors-symptoms"></a>
+ SigV4-Authentifizierungsfehler.
+ Zugriff auf Nachrichten verweigert.
+ Probleme bei der Aktualisierung der Anmeldeinformationen.

#### Lösungsschritte
<a name="auth-errors-resolution"></a>

##### A. SigV4-Authentifizierung
<a name="sigv4-authentication"></a>
+ Überprüfen Sie die temporären Anmeldeinformationen.
+ Überprüfen Sie die Rotation der Anmeldeinformationen.
+ Überprüfen Sie das Instanzprofil.

##### B. AMP-Zugriff
<a name="amp-access"></a>
+ Überprüfen Sie die Workspace-Konfiguration.
+ Überprüfen Sie die Remote-Schreib-URL.
+ Überprüfen Sie die IAM-Rollenbindungen.

### Probleme mit dem Dashboard
<a name="troubleshooting-dashboard-issues"></a>

#### Symptome
<a name="dashboard-issues-symptoms"></a>
+ Leere Dashboards.
+ Fehlende Datenpunkte.
+ Fehler bei der Authentifizierung.

#### Lösungsschritte
<a name="dashboard-issues-resolution"></a>

##### A. Konfiguration der Datenquelle
<a name="data-source-configuration"></a>
+ Überprüfen Sie die Prometheus-Verbindung.
+ Prüfen Sie die CloudWatch Amazon-Integration.
+ Testen Sie die Datenquellenberechtigungen.

##### B. Grafana-Zugang
<a name="grafana-access"></a>
+ Bestätigen Sie die SSO-Konfiguration.
+ Überprüfen Sie bei Bedarf die 2FA-Einrichtung.
+ Überprüfen Sie die Benutzerberechtigungen.

### Windows-spezifische Probleme
<a name="troubleshooting-windows-issues"></a>

#### Symptome
<a name="windows-issues-symptoms"></a>
+ Fehler beim Starten des Dienstes.
+ Lücken bei der Erfassung von Metriken.
+ Fehler bei der Genehmigung.

#### Lösungsschritte
<a name="windows-issues-resolution"></a>
+ Überprüfen Sie den Windows-Dienststatus.
+ Überprüfen Sie die Windows-Ereignisprotokolle.
+ Überprüfen Sie die Collector-Konfiguration.
+ Überprüfen Sie Windows-spezifische Pfade.