View a markdown version of this page

O operador de inferência falha ao iniciar - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

O operador de inferência falha ao iniciar

O pod do operador de inferência falhou ao iniciar e está causando a seguinte mensagem de erro. Esse erro ocorre porque a política de permissão da função de execução do operador não está autorizada a ser executadasts:AssumeRoleWithWebIdentity. Devido a isso, a peça do operador em execução no plano de controle não é iniciada.

Mensagem de erro:

Warning Unhealthy 5m46s (x22 over 49m) kubelet Startup probe failed: Get "http://10.1.100.59:8081/healthz": context deadline exceeded (Client.Timeout exceeded while awaiting headers)

Causa raiz:

  • A política de permissão da função de execução do operador de inferência não está definida para acessar o token de autorização para recursos.

Resolução:

Defina a seguinte política da função de execução de EXECUTION_ROLE_ARN para o operador de HyperPod inferência:

HyperpodInferenceAccessPolicy-ml-cluster to include all resources
JSON
{ "Version":"2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "s3:ListBucket", "s3:PutObject", "s3:GetObject", "s3:DeleteObject" ], "Resource": "*" }, { "Effect": "Allow", "Action": [ "ecr:GetAuthorizationToken" ], "Resource": "*" } ] }

Etapas de verificação:

  1. Alterar a política.

  2. Encerre o pod do operador de HyperPod inferência.

  3. O pod será reiniciado sem nenhuma exceção.