Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Container Insights mit OpenTelemetry Metriken für Amazon EKS
Vorversion
Container Insights mit OpenTelemetry Metriken bietet Einblick in den Betriebszustand Ihrer Amazon EKS-Cluster-Infrastruktur. Es ist in der öffentlichen Vorschau ohne zusätzliche Kosten in den USA Ost (Nord-Virginia), USA West (Oregon), Europa (Irland), Asien-Pazifik (Singapur) und Asien-Pazifik (Sydney) verfügbar.
Das Amazon CloudWatch Observability EKS-Add-on sammelt Open-Source-Metriken aus Ihren Amazon EKS-Clustern und sendet sie CloudWatch mit einer Granularität von 30 Sekunden an Using the OpenTelemetry Protocol (OTLP). Diese Metriken verwenden Metriknamen aus ihren ursprünglichen Quellen, darunter CADvisor, Prometheus Node Exporter, NVIDIA DCGM, Kube State Metrics und Neuron Monitor. AWS Sie können diese Metriken mit PromQL in CloudWatch Query Studio oder über die Prometheus-kompatible Abfrage-API abfragen.
Jede Metrik wird automatisch mit bis zu 150 Labels angereichert, einschließlich OpenTelemetry semantischer Konventionsattribute und Kubernetes-Pod- und Node-Labels. PromQL verarbeitet die Aggregation zum Zeitpunkt der Abfrage, sodass jede Metrik einmal pro Ressource und nicht auf mehreren Aggregationsebenen veröffentlicht wird. Das Add-on korreliert außerdem Accelerator-Metriken von AWS Neuron und AWS Elastic Fabric Adapter mit den spezifischen Pods und Containern, die sie verwenden, und sorgt so für Transparenz, die allein aus den Metrikquellen nicht verfügbar ist.
Um OTel Container Insights auf einem Amazon EKS-Cluster zu aktivieren, installieren Sie die Amazon CloudWatch Observability EKS-Zusatzversion v6.0.1-eksbuild.1 oder höher über die Amazon EKS-Konsole oder über Infrastructure as Code.
Weitere Informationen zur Einrichtung von OTel Container Insights finden Sie unterEinrichten von Container Insights.
Weitere Informationen zur Abfrage dieser Metriken mit PromQL finden Sie unter. PromQL abfragen
Wie OTel Container Insights im Vergleich zu Container Insights abschneidet (erweitert)
In der folgenden Tabelle sind die Unterschiede zwischen Container Insights (erweitert) und OTel Container Insights zusammengefasst.
| Feature | Container Insights (erweitert) | OTel Einblicke in Container |
|---|---|---|
| Metriknamen | CloudWatch-formatieren Sie Metriken (zum Beispielpod_cpu_utilization) |
Native Open-Source-Software (zum Beispiel) container_cpu_usage_seconds_total |
| Beschriftungen pro Metrik | 3—6 vordefinierte Dimensionen pro Metrik | Bis zu 150 Labels, einschließlich aller Kubernetes-Pod- und Node-Labels |
| Aggregation | Voraggregiert auf mehreren Ebenen (Cluster, Namespace, Workload, Pod) | Rohmetriken pro Ressource; zur Abfragezeit mit PromQL aggregiert |
| Sprache der Abfrage | CloudWatch Metrik-API | PromQL (PromethUS-kompatibel) |
| Metrische Aufnahme | CloudWatch Loggt im EMF-Format | OTLP-Endpunkt |
Wie werden Metriken gekennzeichnet
Jede von OTel Container Insights gesammelte Metrik trägt Kennzeichnungen aus drei Quellen.
- Native Labels der Telemetriequelle
-
Beschriftungen aus der ursprünglichen Metrikquelle (CAdvisor bietet beispielsweise Beschriftungen wie
podnamespace, undcontainer). Diese werden als Datenpunktattribute beibehalten. - OpenTelemetry Ressourcenattribute
-
Das Add-on hängt Ressourcenattribute gemäß den OpenTelemetry semantischen Konventionen für Kubernetes
, Host und Cloud an, wie, k8s.pod.namek8s.namespace.name,k8s.node.nameund.host.namecloud.regionDiese Attribute sind in allen metrischen Quellen konsistent. - Bezeichnungen für Kubernetes-Pods und -Knoten
-
Alle Pod-Labels und Node-Labels, die über die Kubernetes-API erkannt wurden, werden als Ressourcenattribute mit den Präfixen und angehängt.
k8s.pod.labelk8s.node.label
Weitere Informationen zur Abfrage dieser Attribute mit PromQL finden Sie unter. PromQL abfragen
Unterstützte Metriken
In der folgenden Tabelle sind die von OTel Container Insights gesammelten Metrikquellen und Kategorien aufgeführt.
| Quelle der Metrik | Metrik-Kategorie | Voraussetzungen |
|---|---|---|
| cAdvisor | CPU-Metriken | - |
| cBerater | Speichermetriken | - |
| cBerater | Netzwerkmetriken | - |
| cBerater | Festplatten- und Dateisystem-Metriken | - |
| Prometheus-Knoten-Exporter | CPU-Metriken | - |
| Prometheus-Knoten-Exporter | Speichermetriken | - |
| Prometheus-Knoten-Exporter | Festplattenmetriken | - |
| Prometheus-Knoten-Exporter | Dateisystem-Metriken | - |
| Prometheus-Knoten-Exporter | Netzwerkmetriken | - |
| Prometheus-Knoten-Exporter | Systemmetriken | - |
| Prometheus-Knoten-Exporter | VMStat Metriken | - |
| Prometheus-Knoten-Exporter | Netstat- und Socket-Metriken | - |
| NVIDIA DCGM | Kennzahlen zur GPU-Auslastung und Leistung | Das NVIDIA-Geräte-Plugin und das |
| NVIDIA DCGM | Metriken zum GPU-Speicher | Das NVIDIA-Geräte-Plugin und das |
| NVIDIA DCGM | GPU-Leistung und thermische Messwerte | Das NVIDIA-Geräte-Plugin und das |
| NVIDIA DCGM | Metriken zur GPU-Drosselung | Das NVIDIA-Geräte-Plugin und das |
| NVIDIA DCGM | GPU-Fehler- und Zuverlässigkeitsmetriken | Das NVIDIA-Geräte-Plugin und das |
| NVIDIA DCGM | GPU-Metriken NVLink | Das NVIDIA-Geräte-Plugin und das |
| NVIDIA DCGM | GPU-Informationsmetriken | Das NVIDIA-Geräte-Plugin und das |
| AWS Neuronenmonitor | NeuronCore Metriken | Der Neuron-Treiber |
| AWS Neuron Monitor | NeuronDevice Metriken | Der Neuron-Treiber |
| AWS Neuron Monitor | Metriken des Neuronensystems | Der Neuron-Treiber |
| AWS Elastischer Stoffadapter | EFA-Metriken | Das EFA-Geräte-Plugin |
| NVMe | NVMe SMART-Metriken | - |
| Kennzahlen von Kube State | Pod, Knoten, Bereitstellung DaemonSet, StatefulSet, ReplicaSet, Job, Service CronJob, Namespace PersistentVolume, Metriken PersistentVolumeClaim | - |
| Kubernetes-API-Server | API-Server- und etcd-Metriken | - |