View a markdown version of this page

Wawasan Kontainer dengan OpenTelemetry metrik untuk Amazon EKS - Amazon CloudWatch

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Wawasan Kontainer dengan OpenTelemetry metrik untuk Amazon EKS

Pratinjau

Wawasan Kontainer dengan OpenTelemetry metrik memberikan visibilitas ke dalam kesehatan operasional infrastruktur klaster Amazon EKS Anda. Ini tersedia dalam pratinjau publik tanpa biaya tambahan di AS Timur (Virginia N.), AS Barat (Oregon), Eropa (Irlandia), Asia Pasifik (Singapura), dan Asia Pasifik (Sydney).

Add-on Amazon CloudWatch Observability EKS mengumpulkan metrik open source dari kluster Amazon EKS Anda dan mengirimkannya untuk CloudWatch menggunakan OpenTelemetry Protokol (OTLP) pada perincian 30 detik. Metrik ini menggunakan nama metrik dari sumber aslinya, termasuk cAdvisor, Prometheus Node Exporter, NVIDIA DCGM, Kube State Metrics, dan Neuron Monitor. AWS Anda dapat melakukan kueri metrik ini menggunakan PromQL di CloudWatch Query Studio atau melalui API kueri yang kompatibel dengan Prometheus.

Setiap metrik secara otomatis diperkaya dengan hingga 150 label, termasuk atribut konvensi OpenTelemetry semantik dan label pod dan node Kubernetes. PromQL menangani agregasi pada waktu kueri, sehingga setiap metrik diterbitkan satu kali per sumber daya daripada di beberapa tingkat agregasi. Add-on ini juga menghubungkan metrik akselerator dari AWS Neuron dan Adaptor Kain AWS Elastis dengan pod dan wadah tertentu yang menggunakannya, memberikan visibilitas yang tidak tersedia dari sumber metrik saja.

Untuk mengaktifkan OTel Wawasan Kontainer di kluster Amazon EKS, instal versi add-on Amazon CloudWatch Observability EKS v6.0.1-eksbuild.1 atau yang lebih baru melalui konsol Amazon EKS atau melalui infrastruktur sebagai kode.

Untuk informasi selengkapnya tentang menyiapkan OTel Wawasan Kontainer, lihatMenyiapkan Wawasan Kontainer.

Untuk informasi selengkapnya tentang kueri metrik ini dengan PromQL, lihat. Kueri PromQL

Bagaimana OTel Container Insights dibandingkan dengan Container Insights (ditingkatkan)

Tabel berikut merangkum perbedaan antara Wawasan Kontainer (ditingkatkan) dan Wawasan OTel Kontainer.

Fitur Wawasan Kontainer (ditingkatkan) OTel Wawasan Kontainer
Nama metrik CloudWatch-format metrik (misalnya,) pod_cpu_utilization Asli sumber terbuka (misalnya,container_cpu_usage_seconds_total)
Label per metrik 3—6 dimensi yang telah ditentukan per metrik Hingga 150 label, termasuk semua label pod dan node Kubernetes
Agregasi Pra-agregasi pada berbagai tingkatan (cluster, namespace, beban kerja, pod) Metrik mentah per sumber daya; agregat pada waktu kueri dengan PromQL
Bahasa kueri CloudWatch Metrik API PromQL (kompatibel dengan Prometheus)
Konsumsi metrik CloudWatch Log dalam format EMF Titik akhir OTLP

Bagaimana metrik diberi label

Setiap metrik yang dikumpulkan oleh OTel Container Insights membawa label dari tiga sumber.

Label asli sumber telemetri

Label dari sumber metrik asli (misalnya, cAdvisor menyediakan label sepertipod,namespace, dancontainer). Ini dipertahankan sebagai atribut titik data.

OpenTelemetry atribut sumber daya

Add-on menambahkan atribut resource mengikuti konvensi OpenTelemetry semantik untuk Kubernetes, Host, dan Cloud, seperti,,, dan. k8s.pod.name k8s.namespace.name k8s.node.name host.name cloud.region Atribut ini konsisten di semua sumber metrik.

Label pod dan node Kubernetes

Semua label pod dan label node yang ditemukan dari Kubernetes API ditambahkan sebagai atribut resource dengan prefiks dan. k8s.pod.label k8s.node.label

Untuk informasi selengkapnya tentang cara menanyakan atribut ini menggunakan PromQL, lihat. Kueri PromQL

Metrik yang didukung

Tabel berikut mencantumkan sumber metrik dan kategori yang dikumpulkan oleh OTel Container Insights.

Sumber metrik Kategori metrik Prasyarat
cAdvisor Metrik CPU -
cAdvisor Metrik memori -
cAdvisor Metrik jaringan -
cAdvisor Metrik disk dan sistem file -
Prometheus Node Exportir Metrik CPU -
Prometheus Node Exportir Metrik memori -
Prometheus Node Exportir Metrik disk -
Prometheus Node Exportir Metrik sistem file -
Prometheus Node Exportir Metrik jaringan -
Prometheus Node Exportir Metrik sistem -
Prometheus Node Exportir VMStat metrik -
Prometheus Node Exportir Metrik netstat dan soket -
NVIDIA DCGM Pemanfaatan GPU dan metrik kinerja Plugin perangkat NVIDIA dan toolkit kontainer NVIDIA harus diinstal.
NVIDIA DCGM Metrik memori GPU Plugin perangkat NVIDIA dan toolkit kontainer NVIDIA harus diinstal.
NVIDIA DCGM Daya GPU dan metrik termal Plugin perangkat NVIDIA dan toolkit kontainer NVIDIA harus diinstal.
NVIDIA DCGM Metrik pelambatan GPU Plugin perangkat NVIDIA dan toolkit kontainer NVIDIA harus diinstal.
NVIDIA DCGM Kesalahan GPU dan metrik keandalan Plugin perangkat NVIDIA dan toolkit kontainer NVIDIA harus diinstal.
NVIDIA DCGM Metrik GPU NVLink Plugin perangkat NVIDIA dan toolkit kontainer NVIDIA harus diinstal.
NVIDIA DCGM Metrik informasi GPU Plugin perangkat NVIDIA dan toolkit kontainer NVIDIA harus diinstal.
AWS Monitor Neuron NeuronCore metrik Driver neuron dan plugin perangkat Neuron harus diinstal.
AWS Monitor Neuron NeuronDevice metrik Driver neuron dan plugin perangkat Neuron harus diinstal.
AWS Monitor Neuron Metrik sistem neuron Driver neuron dan plugin perangkat Neuron harus diinstal.
AWS Adaptor Kain Elastis Metrik EFA Plugin perangkat EFA harus diinstal.
NVMe NVMe Metrik SMART -
Metrik Negara Bagian Kube Pod, node, Deployment,, DaemonSet, StatefulSet, Job ReplicaSet,, Layanan CronJob, Namespace,, metrik PersistentVolume PersistentVolumeClaim -
Server API Kubernetes Server API dan metrik etcd -