Wie oTEL Container Insights im Vergleich zu Container Insights abschneidet (erweitert)Wie werden Metriken gekennzeichnet Unterstützte Metriken Duales Publizieren deaktivieren

Container Insights mit OpenTelemetry Metriken für Amazon EKS

Vorversion

Container Insights mit OpenTelemetry Metriken bietet Einblick in den Betriebszustand Ihrer Amazon EKS-Cluster-Infrastruktur. Es ist in der öffentlichen Vorschau ohne zusätzliche Kosten in den USA Ost (Nord-Virginia), USA West (Oregon), Europa (Irland), Asien-Pazifik (Singapur) und Asien-Pazifik (Sydney) verfügbar.

Das Amazon CloudWatch Observability EKS-Add-on sammelt Open-Source-Metriken aus Ihren Amazon EKS-Clustern und sendet sie CloudWatch mit einer Granularität von 30 Sekunden an Using the OpenTelemetry Protocol (OTLP). Diese Metriken verwenden Metriknamen aus ihren ursprünglichen Quellen, darunter CADvisor, Prometheus Node Exporter, NVIDIA DCGM, Kube State Metrics und Neuron Monitor. AWS Sie können diese Metriken mit PromQL in CloudWatch Query Studio oder über die Prometheus-kompatible Abfrage-API abfragen.

Jede Metrik wird automatisch mit bis zu 150 Labels angereichert, einschließlich OpenTelemetry semantischer Konventionsattribute und Kubernetes-Pod- und Node-Labels. PromQL verarbeitet die Aggregation zum Zeitpunkt der Abfrage, sodass jede Metrik einmal pro Ressource und nicht auf mehreren Aggregationsebenen veröffentlicht wird. Das Add-on korreliert außerdem Accelerator-Metriken von AWS Neuron und AWS Elastic Fabric Adapter mit den spezifischen Pods und Containern, die sie verwenden, und sorgt so für Transparenz, die allein aus den Metrikquellen nicht verfügbar ist.

Um OTel Container Insights auf einem Amazon EKS-Cluster zu aktivieren, installieren Sie die Amazon CloudWatch Observability EKS-Zusatzversion v6.0.1-eksbuild.1 oder höher über die Amazon EKS-Konsole oder über Infrastructure as Code.

Weitere Informationen zur Einrichtung von OTel Container Insights finden Sie unterEinrichten von Container Insights.

Weitere Informationen zur Abfrage dieser Metriken mit PromQL finden Sie unter. PromQL abfragen

Wie oTEL Container Insights im Vergleich zu Container Insights abschneidet (erweitert)

In der folgenden Tabelle sind die Unterschiede zwischen Container Insights (erweitert) und OTel Container Insights zusammengefasst.

Feature	Container Insights (erweitert)	Einblicke in Container
Metriknamen	CloudWatch-format Metriken (zum Beispiel`pod_cpu_utilization`)	Open-source nativ (zum Beispiel`container_cpu_usage_seconds_total`)
Beschriftungen pro Metrik	3—6 vordefinierte Dimensionen pro Metrik	Bis zu 150 Labels, einschließlich aller Kubernetes-Pod- und Node-Labels
Aggregation	Pre-aggregated auf mehreren Ebenen (Cluster, Namespace, Workload, Pod)	Rohmetriken pro Ressource; zur Abfragezeit mit PromQL aggregiert
Sprache der Abfrage	CloudWatch Metrik-API	PromQL () Prometheus-compatible
Metrische Aufnahme	CloudWatch Loggt im EMF-Format	OTLP-Endpunkt

Wie werden Metriken gekennzeichnet

Jede von oTEL Container Insights gesammelte Metrik trägt Kennzeichnungen aus drei Quellen.

Native Labels der Telemetriequelle: Beschriftungen aus der ursprünglichen Metrikquelle (CAdvisor bietet beispielsweise Beschriftungen wie podnamespace, undcontainer). Diese werden als Datenpunktattribute beibehalten.
OpenTelemetry Ressourcenattribute: Das Add-on hängt Ressourcenattribute gemäß den OpenTelemetry semantischen Konventionen für Kubernetes, Host und Cloud an, z. B.,k8s.pod.name,k8s.namespace.name, k8s.node.name und. host.name cloud.region Diese Attribute sind in allen metrischen Quellen konsistent.
Bezeichnungen für Kubernetes-Pods und -Knoten: Alle Pod-Labels und Node-Labels, die über die Kubernetes-API erkannt wurden, werden als Ressourcenattribute mit den Präfixen und angehängt. k8s.pod.label k8s.node.label

Weitere Informationen zur Abfrage dieser Attribute mit PromQL finden Sie unter. PromQL abfragen

Unterstützte Metriken

In der folgenden Tabelle sind die von oTEL Container Insights gesammelten metrischen Quellen und Kategorien aufgeführt.

Quelle der Metrik	Metrik-Kategorie	Voraussetzungen
cAdvisor	CPU-Metriken	-
cBerater	Speichermetriken	-
cBerater	Netzwerkmetriken	-
cBerater	Festplatten- und Dateisystem-Metriken	-
Prometheus-Knoten-Exporter	CPU-Metriken	-
Prometheus-Knoten-Exporter	Speichermetriken	-
Prometheus-Knoten-Exporter	Festplattenmetriken	-
Prometheus-Knoten-Exporter	Dateisystem-Metriken	-
Prometheus-Knoten-Exporter	Netzwerkmetriken	-
Prometheus-Knoten-Exporter	Systemmetriken	-
Prometheus-Knoten-Exporter	VMstat-Metriken	-
Prometheus-Knoten-Exporter	NetStat- und Socket-Metriken	-
NVIDIA DCGM	Kennzahlen zur GPU-Auslastung und Leistung	Das NVIDIA-Geräte-Plugin und das NVIDIA-Container-Toolkit müssen installiert sein.
NVIDIA DCGM	Metriken zum GPU-Speicher	Das NVIDIA-Geräte-Plugin und das NVIDIA-Container-Toolkit müssen installiert sein.
NVIDIA DCGM	GPU-Leistung und thermische Messwerte	Das NVIDIA-Geräte-Plugin und das NVIDIA-Container-Toolkit müssen installiert sein.
NVIDIA DCGM	Metriken zur GPU-Drosselung	Das NVIDIA-Geräte-Plugin und das NVIDIA-Container-Toolkit müssen installiert sein.
NVIDIA DCGM	GPU-Fehler- und Zuverlässigkeitsmetriken	Das NVIDIA-Geräte-Plugin und das NVIDIA-Container-Toolkit müssen installiert sein.
NVIDIA DCGM	GPU NVLink-Metriken	Das NVIDIA-Geräte-Plugin und das NVIDIA-Container-Toolkit müssen installiert sein.
NVIDIA DCGM	GPU-Informationsmetriken	Das NVIDIA-Geräte-Plugin und das NVIDIA-Container-Toolkit müssen installiert sein.
AWS Neuronenmonitor	NeuronCore Metriken	Der Neuron-Treiber und das Neuron-Geräte-Plugin müssen installiert sein.
AWS Neuron Monitor	NeuronDevice Metriken	Der Neuron-Treiber und das Neuron-Geräte-Plugin müssen installiert sein.
AWS Neuron Monitor	Metriken des Neuronensystems	Der Neuron-Treiber und das Neuron-Geräte-Plugin müssen installiert sein.
AWS Elastischer Stoffadapter	EFA-Metriken	Das EFA-Geräte-Plugin muss installiert sein.
NVMe	NVMe SMART-Metriken	-
Kube State-Metriken	Pod, Knoten, Bereitstellung DaemonSet, StatefulSet, ReplicaSet, Job, Service CronJob, Namespace PersistentVolume, Metriken PersistentVolumeClaim	-
Kubernetes-API-Server	API-Server- und etcd-Metriken	-

Duales Publizieren deaktivieren

Ab der Amazon CloudWatch Observability EKS-Add-On-Version v6.0.1-eksbuild.1 oder höher veröffentlicht das Add-on standardmäßig Metriken sowohl über Container Insights (Legacy) als auch über OTel Container Insights. Wenn Sie nur eines davon verwenden möchten, können Sie das andere deaktivieren.

Deaktivieren Sie oTEL Container Insights

Um die Veröffentlichung von OTel Container Insights-Metriken zu beenden und nur ältere Container Insights-Metriken zu verwenden, setzen Sie die otelContainerInsights Konfiguration auf deaktiviert.

Verwenden Sie den folgenden Konfigurationswert:


{"otelContainerInsights":{"enabled":false}}

Führen Sie den folgenden Befehl aus, um die Konfiguration anzuwenden:


aws eks update-addon \
  --cluster-name CLUSTER_NAME \
  --addon-name amazon-cloudwatch-observability \
  --configuration-values '{"otelContainerInsights":{"enabled":false}}' \
  --region REGION

Deaktivieren Sie Container Insights

Um die Veröffentlichung älterer Container Insights-Metriken zu beenden und nur oTEL Container Insights zu verwenden, setzen Sie die containerInsights Konfiguration auf deaktiviert.

Verwenden Sie den folgenden Konfigurationswert:


{"containerInsights":{"enabled":false}}

Führen Sie den folgenden Befehl aus, um die Konfiguration anzuwenden:


aws eks update-addon \
  --cluster-name CLUSTER_NAME \
  --addon-name amazon-cloudwatch-observability \
  --configuration-values '{"containerInsights":{"enabled":false}}' \
  --region REGION

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Container Insights mit verbesserter Beobachtbarkeit für Amazon EKS

Einrichten von Container Insights