View a markdown version of this page

Container Insights mit OpenTelemetry Metriken für Amazon EKS - Amazon CloudWatch

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Container Insights mit OpenTelemetry Metriken für Amazon EKS

Vorversion

Container Insights mit OpenTelemetry Metriken bietet Einblick in den Betriebszustand Ihrer Amazon EKS-Cluster-Infrastruktur. Es ist in der öffentlichen Vorschau ohne zusätzliche Kosten in den USA Ost (Nord-Virginia), USA West (Oregon), Europa (Irland), Asien-Pazifik (Singapur) und Asien-Pazifik (Sydney) verfügbar.

Das Amazon CloudWatch Observability EKS-Add-on sammelt Open-Source-Metriken aus Ihren Amazon EKS-Clustern und sendet sie CloudWatch mit einer Granularität von 30 Sekunden an Using the OpenTelemetry Protocol (OTLP). Diese Metriken verwenden Metriknamen aus ihren ursprünglichen Quellen, darunter CADvisor, Prometheus Node Exporter, NVIDIA DCGM, Kube State Metrics und Neuron Monitor. AWS Sie können diese Metriken mit PromQL in CloudWatch Query Studio oder über die Prometheus-kompatible Abfrage-API abfragen.

Jede Metrik wird automatisch mit bis zu 150 Labels angereichert, einschließlich OpenTelemetry semantischer Konventionsattribute und Kubernetes-Pod- und Node-Labels. PromQL verarbeitet die Aggregation zum Zeitpunkt der Abfrage, sodass jede Metrik einmal pro Ressource und nicht auf mehreren Aggregationsebenen veröffentlicht wird. Das Add-on korreliert außerdem Accelerator-Metriken von AWS Neuron und AWS Elastic Fabric Adapter mit den spezifischen Pods und Containern, die sie verwenden, und sorgt so für Transparenz, die allein aus den Metrikquellen nicht verfügbar ist.

Um OTel Container Insights auf einem Amazon EKS-Cluster zu aktivieren, installieren Sie die Amazon CloudWatch Observability EKS-Zusatzversion v6.0.1-eksbuild.1 oder höher über die Amazon EKS-Konsole oder über Infrastructure as Code.

Weitere Informationen zur Einrichtung von OTel Container Insights finden Sie unterEinrichten von Container Insights.

Weitere Informationen zur Abfrage dieser Metriken mit PromQL finden Sie unter. PromQL abfragen

Wie OTel Container Insights im Vergleich zu Container Insights abschneidet (erweitert)

In der folgenden Tabelle sind die Unterschiede zwischen Container Insights (erweitert) und OTel Container Insights zusammengefasst.

Feature Container Insights (erweitert) OTel Einblicke in Container
Metriknamen CloudWatch-formatieren Sie Metriken (zum Beispielpod_cpu_utilization) Native Open-Source-Software (zum Beispiel) container_cpu_usage_seconds_total
Beschriftungen pro Metrik 3—6 vordefinierte Dimensionen pro Metrik Bis zu 150 Labels, einschließlich aller Kubernetes-Pod- und Node-Labels
Aggregation Voraggregiert auf mehreren Ebenen (Cluster, Namespace, Workload, Pod) Rohmetriken pro Ressource; zur Abfragezeit mit PromQL aggregiert
Sprache der Abfrage CloudWatch Metrik-API PromQL (PromethUS-kompatibel)
Metrische Aufnahme CloudWatch Loggt im EMF-Format OTLP-Endpunkt

Wie werden Metriken gekennzeichnet

Jede von OTel Container Insights gesammelte Metrik trägt Kennzeichnungen aus drei Quellen.

Native Labels der Telemetriequelle

Beschriftungen aus der ursprünglichen Metrikquelle (CAdvisor bietet beispielsweise Beschriftungen wie podnamespace, undcontainer). Diese werden als Datenpunktattribute beibehalten.

OpenTelemetry Ressourcenattribute

Das Add-on hängt Ressourcenattribute gemäß den OpenTelemetry semantischen Konventionen für Kubernetes, Host und Cloud an, wie, k8s.pod.namek8s.namespace.name, k8s.node.name und. host.name cloud.region Diese Attribute sind in allen metrischen Quellen konsistent.

Bezeichnungen für Kubernetes-Pods und -Knoten

Alle Pod-Labels und Node-Labels, die über die Kubernetes-API erkannt wurden, werden als Ressourcenattribute mit den Präfixen und angehängt. k8s.pod.label k8s.node.label

Weitere Informationen zur Abfrage dieser Attribute mit PromQL finden Sie unter. PromQL abfragen

Unterstützte Metriken

In der folgenden Tabelle sind die von OTel Container Insights gesammelten Metrikquellen und Kategorien aufgeführt.

Quelle der Metrik Metrik-Kategorie Voraussetzungen
cAdvisor CPU-Metriken -
cBerater Speichermetriken -
cBerater Netzwerkmetriken -
cBerater Festplatten- und Dateisystem-Metriken -
Prometheus-Knoten-Exporter CPU-Metriken -
Prometheus-Knoten-Exporter Speichermetriken -
Prometheus-Knoten-Exporter Festplattenmetriken -
Prometheus-Knoten-Exporter Dateisystem-Metriken -
Prometheus-Knoten-Exporter Netzwerkmetriken -
Prometheus-Knoten-Exporter Systemmetriken -
Prometheus-Knoten-Exporter VMStat Metriken -
Prometheus-Knoten-Exporter Netstat- und Socket-Metriken -
NVIDIA DCGM Kennzahlen zur GPU-Auslastung und Leistung Das NVIDIA-Geräte-Plugin und das NVIDIA-Container-Toolkit müssen installiert sein.
NVIDIA DCGM Metriken zum GPU-Speicher Das NVIDIA-Geräte-Plugin und das NVIDIA-Container-Toolkit müssen installiert sein.
NVIDIA DCGM GPU-Leistung und thermische Messwerte Das NVIDIA-Geräte-Plugin und das NVIDIA-Container-Toolkit müssen installiert sein.
NVIDIA DCGM Metriken zur GPU-Drosselung Das NVIDIA-Geräte-Plugin und das NVIDIA-Container-Toolkit müssen installiert sein.
NVIDIA DCGM GPU-Fehler- und Zuverlässigkeitsmetriken Das NVIDIA-Geräte-Plugin und das NVIDIA-Container-Toolkit müssen installiert sein.
NVIDIA DCGM GPU-Metriken NVLink Das NVIDIA-Geräte-Plugin und das NVIDIA-Container-Toolkit müssen installiert sein.
NVIDIA DCGM GPU-Informationsmetriken Das NVIDIA-Geräte-Plugin und das NVIDIA-Container-Toolkit müssen installiert sein.
AWS Neuronenmonitor NeuronCore Metriken Der Neuron-Treiber und das Neuron-Geräte-Plugin müssen installiert sein.
AWS Neuron Monitor NeuronDevice Metriken Der Neuron-Treiber und das Neuron-Geräte-Plugin müssen installiert sein.
AWS Neuron Monitor Metriken des Neuronensystems Der Neuron-Treiber und das Neuron-Geräte-Plugin müssen installiert sein.
AWS Elastischer Stoffadapter EFA-Metriken Das EFA-Geräte-Plugin muss installiert sein.
NVMe NVMe SMART-Metriken -
Kennzahlen von Kube State Pod, Knoten, Bereitstellung DaemonSet, StatefulSet, ReplicaSet, Job, Service CronJob, Namespace PersistentVolume, Metriken PersistentVolumeClaim -
Kubernetes-API-Server API-Server- und etcd-Metriken -