As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
O operador de inferência falha ao iniciar
O pod do operador de inferência falhou ao iniciar e está causando a seguinte mensagem de erro. Esse erro ocorre porque a política de permissão da função de execução do operador não está autorizada a ser executadasts:AssumeRoleWithWebIdentity. Devido a isso, a peça do operador em execução no plano de controle não é iniciada.
Mensagem de erro:
Warning Unhealthy 5m46s (x22 over 49m) kubelet Startup probe failed: Get "http://10.1.100.59:8081/healthz": context deadline exceeded (Client.Timeout exceeded while awaiting headers)
Causa raiz:
-
A política de permissão da função de execução do operador de inferência não está definida para acessar o token de autorização para recursos.
Resolução:
Defina a seguinte política da função de execução de EXECUTION_ROLE_ARN para o operador de HyperPod inferência:
HyperpodInferenceAccessPolicy-ml-cluster to include all resources
Etapas de verificação:
-
Alterar a política.
-
Encerre o pod do operador de HyperPod inferência.
-
O pod será reiniciado sem nenhuma exceção.