View a markdown version of this page

추론 연산자가 시작되지 않음 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

추론 연산자가 시작되지 않음

추론 연산자 포드를 시작하지 못하여 다음 오류 메시지가 발생합니다. 이 오류는 운영자 실행 역할에 대한 권한 정책이를 수행할 권한이 없기 때문입니다sts:AssumeRoleWithWebIdentity. 이로 인해 컨트롤 플레인에서 실행되는 연산자 부분이 시작되지 않습니다.

오류 메시지:

Warning Unhealthy 5m46s (x22 over 49m) kubelet Startup probe failed: Get "http://10.1.100.59:8081/healthz": context deadline exceeded (Client.Timeout exceeded while awaiting headers)

근본 원인:

  • 추론 연산자 실행 역할의 권한 정책은 리소스에 대한 권한 부여 토큰에 액세스하도록 설정되지 않았습니다.

​해결 방법:

HyperPod 추론 연산자에 EXECUTION_ROLE_ARN 대해의 실행 역할에 대해 다음 정책을 설정합니다.

HyperpodInferenceAccessPolicy-ml-cluster to include all resources
JSON
{ "Version":"2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "s3:ListBucket", "s3:PutObject", "s3:GetObject", "s3:DeleteObject" ], "Resource": "*" }, { "Effect": "Allow", "Action": [ "ecr:GetAuthorizationToken" ], "Resource": "*" } ] }

확인 단계:

  1. 정책을 변경합니다.

  2. HyperPod 추론 연산자 포드를 종료합니다.

  3. 포드는 예외를 발생시키지 않고 다시 시작됩니다.