Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
El operador de inferencia no se puede iniciar
El módulo del operador de inferencia no se pudo iniciar y está provocando el siguiente mensaje de error. Este error se debe a que la política de permisos sobre la función de ejecución del operador no está autorizada a desempeñarsts:AssumeRoleWithWebIdentity. Debido a esto, la parte del operador que se ejecuta en el plano de control no se inicia.
Mensaje de error:
Warning Unhealthy 5m46s (x22 over 49m) kubelet Startup probe failed: Get "http://10.1.100.59:8081/healthz": context deadline exceeded (Client.Timeout exceeded while awaiting headers)
Causa raíz:
-
La política de permisos de la función de ejecución del operador de inferencia no está configurada para acceder al token de autorización de los recursos.
Solución:
Establezca la siguiente política de la función de ejecución del EXECUTION_ROLE_ARN operador de HyperPod inferencia:
HyperpodInferenceAccessPolicy-ml-cluster to include all resources
Pasos de verificación:
-
Cambiar la política.
-
Finalice el módulo del operador HyperPod de inferencia.
-
El pod se reiniciará sin que se produzcan excepciones.