View a markdown version of this page

Operator inferensi gagal memulai - Amazon SageMaker AI

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Operator inferensi gagal memulai

Pod operator inferensi gagal memulai dan menyebabkan pesan kesalahan berikut. Kesalahan ini disebabkan oleh kebijakan izin pada peran eksekusi operator yang tidak diizinkan untuk dilakukansts:AssumeRoleWithWebIdentity. Karena ini, bagian operator yang berjalan di bidang kontrol tidak dimulai.

Pesan kesalahan:

Warning Unhealthy 5m46s (x22 over 49m) kubelet Startup probe failed: Get "http://10.1.100.59:8081/healthz": context deadline exceeded (Client.Timeout exceeded while awaiting headers)

Akar penyebab:

  • Kebijakan izin dari peran eksekusi operator inferensi tidak disetel untuk mengakses token otorisasi untuk sumber daya.

Resolusi:

Tetapkan kebijakan berikut untuk peran eksekusi EXECUTION_ROLE_ARN untuk operator HyperPod inferensi:

HyperpodInferenceAccessPolicy-ml-cluster to include all resources
JSON
{ "Version":"2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "s3:ListBucket", "s3:PutObject", "s3:GetObject", "s3:DeleteObject" ], "Resource": "*" }, { "Effect": "Allow", "Action": [ "ecr:GetAuthorizationToken" ], "Resource": "*" } ] }

Langkah verifikasi:

  1. Ubah kebijakan.

  2. Mengakhiri pod operator HyperPod inferensi.

  3. Pod akan dimulai ulang tanpa membuang pengecualian apa pun.