

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Container Insights mit OpenTelemetry Metriken für Amazon EKS
<a name="container-insights-otel-metrics"></a>

**Vorversion**  
Container Insights mit OpenTelemetry Metriken bietet Einblick in den Betriebszustand Ihrer Amazon EKS-Cluster-Infrastruktur. Es ist in der öffentlichen Vorschau ohne zusätzliche Kosten in den USA Ost (Nord-Virginia), USA West (Oregon), Europa (Irland), Asien-Pazifik (Singapur) und Asien-Pazifik (Sydney) verfügbar.

Das Amazon CloudWatch Observability EKS-Add-on sammelt Open-Source-Metriken aus Ihren Amazon EKS-Clustern und sendet sie CloudWatch mit einer Granularität von 30 Sekunden an Using the OpenTelemetry Protocol (OTLP). Diese Metriken verwenden Metriknamen aus ihren ursprünglichen Quellen, darunter CADvisor, Prometheus Node Exporter, NVIDIA DCGM, Kube State Metrics und Neuron Monitor. AWS Sie können diese Metriken mit PromQL in CloudWatch Query Studio oder über die Prometheus-kompatible Abfrage-API abfragen.

Jede Metrik wird automatisch mit bis zu 150 Labels angereichert, einschließlich OpenTelemetry semantischer Konventionsattribute und Kubernetes-Pod- und Node-Labels. PromQL verarbeitet die Aggregation zum Zeitpunkt der Abfrage, sodass jede Metrik einmal pro Ressource und nicht auf mehreren Aggregationsebenen veröffentlicht wird. Das Add-on korreliert außerdem Accelerator-Metriken von AWS Neuron und AWS Elastic Fabric Adapter mit den spezifischen Pods und Containern, die sie verwenden, und sorgt so für Transparenz, die allein aus den Metrikquellen nicht verfügbar ist.

Um OTel Container Insights auf einem Amazon EKS-Cluster zu aktivieren, installieren Sie die Amazon CloudWatch Observability EKS-Zusatzversion `v6.0.1-eksbuild.1` oder höher über die Amazon EKS-Konsole oder über Infrastructure as Code.

Weitere Informationen zur Einrichtung von OTel Container Insights finden Sie unter[Einrichten von Container Insights](deploy-container-insights.md).

Weitere Informationen zur Abfrage dieser Metriken mit PromQL finden Sie unter. [PromQL abfragen](CloudWatch-PromQL-Querying.md)

## Wie OTel Container Insights im Vergleich zu Container Insights abschneidet (erweitert)
<a name="container-insights-otel-comparison"></a>

In der folgenden Tabelle sind die Unterschiede zwischen Container Insights (erweitert) und OTel Container Insights zusammengefasst.


| Feature | Container Insights (erweitert) | OTel Einblicke in Container | 
| --- | --- | --- | 
| Metriknamen | CloudWatch-formatieren Sie Metriken (zum Beispielpod\$1cpu\$1utilization) | Native Open-Source-Software (zum Beispiel) container\$1cpu\$1usage\$1seconds\$1total | 
| Beschriftungen pro Metrik | 3—6 vordefinierte Dimensionen pro Metrik | Bis zu 150 Labels, einschließlich aller Kubernetes-Pod- und Node-Labels | 
| Aggregation | Voraggregiert auf mehreren Ebenen (Cluster, Namespace, Workload, Pod) | Rohmetriken pro Ressource; zur Abfragezeit mit PromQL aggregiert | 
| Sprache der Abfrage | CloudWatch Metrik-API | PromQL (PromethUS-kompatibel) | 
| Metrische Aufnahme | CloudWatch Loggt im EMF-Format | OTLP-Endpunkt | 

## Wie werden Metriken gekennzeichnet
<a name="container-insights-otel-labels"></a>

Jede von OTel Container Insights gesammelte Metrik trägt Kennzeichnungen aus drei Quellen.

Native Labels der Telemetriequelle  
Beschriftungen aus der ursprünglichen Metrikquelle (CAdvisor bietet beispielsweise Beschriftungen wie `pod``namespace`, und`container`). Diese werden als Datenpunktattribute beibehalten.

OpenTelemetry Ressourcenattribute  
Das Add-on hängt Ressourcenattribute gemäß den OpenTelemetry semantischen Konventionen für [Kubernetes](https://opentelemetry.io/docs/specs/semconv/resource/k8s/), [Host](https://opentelemetry.io/docs/specs/semconv/resource/host/) und [Cloud](https://opentelemetry.io/docs/specs/semconv/resource/cloud/) an, wie, `k8s.pod.name``k8s.namespace.name`, `k8s.node.name` und. `host.name` `cloud.region` Diese Attribute sind in allen metrischen Quellen konsistent.

Bezeichnungen für Kubernetes-Pods und -Knoten  
Alle Pod-Labels und Node-Labels, die über die Kubernetes-API erkannt wurden, werden als Ressourcenattribute mit den Präfixen und angehängt. `k8s.pod.label` `k8s.node.label`

Weitere Informationen zur Abfrage dieser Attribute mit PromQL finden Sie unter. [PromQL abfragen](CloudWatch-PromQL-Querying.md)

## Unterstützte Metriken
<a name="container-insights-otel-supported-metrics"></a>

In der folgenden Tabelle sind die von OTel Container Insights gesammelten Metrikquellen und Kategorien aufgeführt.


| Quelle der Metrik | Metrik-Kategorie | Voraussetzungen | 
| --- | --- | --- | 
| cAdvisor | CPU-Metriken | - | 
| cBerater | Speichermetriken | - | 
| cBerater | Netzwerkmetriken | - | 
| cBerater | Festplatten- und Dateisystem-Metriken | - | 
| Prometheus-Knoten-Exporter | CPU-Metriken | - | 
| Prometheus-Knoten-Exporter | Speichermetriken | - | 
| Prometheus-Knoten-Exporter | Festplattenmetriken | - | 
| Prometheus-Knoten-Exporter | Dateisystem-Metriken | - | 
| Prometheus-Knoten-Exporter | Netzwerkmetriken | - | 
| Prometheus-Knoten-Exporter | Systemmetriken | - | 
| Prometheus-Knoten-Exporter | VMStat Metriken | - | 
| Prometheus-Knoten-Exporter | Netstat- und Socket-Metriken | - | 
| NVIDIA DCGM | Kennzahlen zur GPU-Auslastung und Leistung | Das [NVIDIA-Geräte-Plugin und das](https://github.com/NVIDIA/k8s-device-plugin) [NVIDIA-Container-Toolkit](https://github.com/NVIDIA/nvidia-container-toolkit) müssen installiert sein. | 
| NVIDIA DCGM | Metriken zum GPU-Speicher | Das [NVIDIA-Geräte-Plugin und das](https://github.com/NVIDIA/k8s-device-plugin) [NVIDIA-Container-Toolkit](https://github.com/NVIDIA/nvidia-container-toolkit) müssen installiert sein. | 
| NVIDIA DCGM | GPU-Leistung und thermische Messwerte | Das [NVIDIA-Geräte-Plugin und das](https://github.com/NVIDIA/k8s-device-plugin) [NVIDIA-Container-Toolkit](https://github.com/NVIDIA/nvidia-container-toolkit) müssen installiert sein. | 
| NVIDIA DCGM | Metriken zur GPU-Drosselung | Das [NVIDIA-Geräte-Plugin und das](https://github.com/NVIDIA/k8s-device-plugin) [NVIDIA-Container-Toolkit müssen installiert](https://github.com/NVIDIA/nvidia-container-toolkit) sein. | 
| NVIDIA DCGM | GPU-Fehler- und Zuverlässigkeitsmetriken | Das [NVIDIA-Geräte-Plugin und das](https://github.com/NVIDIA/k8s-device-plugin) [NVIDIA-Container-Toolkit](https://github.com/NVIDIA/nvidia-container-toolkit) müssen installiert sein. | 
| NVIDIA DCGM | GPU-Metriken NVLink  | Das [NVIDIA-Geräte-Plugin und das](https://github.com/NVIDIA/k8s-device-plugin) [NVIDIA-Container-Toolkit](https://github.com/NVIDIA/nvidia-container-toolkit) müssen installiert sein. | 
| NVIDIA DCGM | GPU-Informationsmetriken | Das [NVIDIA-Geräte-Plugin und das](https://github.com/NVIDIA/k8s-device-plugin) [NVIDIA-Container-Toolkit](https://github.com/NVIDIA/nvidia-container-toolkit) müssen installiert sein. | 
| AWS Neuronenmonitor | NeuronCore Metriken | [Der Neuron-Treiber](https://awsdocs-neuron.readthedocs-hosted.com/en/latest/general/setup/neuron-setup/pytorch/neuronx/ubuntu/torch-neuronx-ubuntu22.html) und das [Neuron-Geräte-Plugin](https://awsdocs-neuron.readthedocs-hosted.com/en/latest/containers/kubernetes-getting-started.html) müssen installiert sein. | 
| AWS Neuron Monitor | NeuronDevice Metriken | [Der Neuron-Treiber](https://awsdocs-neuron.readthedocs-hosted.com/en/latest/general/setup/neuron-setup/pytorch/neuronx/ubuntu/torch-neuronx-ubuntu22.html) und das [Neuron-Geräte-Plugin](https://awsdocs-neuron.readthedocs-hosted.com/en/latest/containers/kubernetes-getting-started.html) müssen installiert sein. | 
| AWS Neuron Monitor | Metriken des Neuronensystems | [Der Neuron-Treiber](https://awsdocs-neuron.readthedocs-hosted.com/en/latest/general/setup/neuron-setup/pytorch/neuronx/ubuntu/torch-neuronx-ubuntu22.html) und das [Neuron-Geräte-Plugin müssen installiert](https://awsdocs-neuron.readthedocs-hosted.com/en/latest/containers/kubernetes-getting-started.html) sein. | 
| AWS Elastischer Stoffadapter | EFA-Metriken | Das [EFA-Geräte-Plugin](https://github.com/aws/eks-charts/tree/master/stable/aws-efa-k8s-device-plugin) muss installiert sein. | 
| NVMe | NVMe SMART-Metriken | - | 
| Kennzahlen von Kube State | Pod, Knoten, Bereitstellung DaemonSet, StatefulSet, ReplicaSet, Job, Service CronJob, Namespace PersistentVolume, Metriken PersistentVolumeClaim  | - | 
| Kubernetes-API-Server | API-Server- und etcd-Metriken | - | 