View a markdown version of this page

AWSSupport-RequestSageMakerLimitIncrease - AWS Systems Manager Referência do Automation Runbook

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

AWSSupport-RequestSageMakerLimitIncrease

Descrição

O AWSSupport-RequestSageMakerLimitIncrease runbook permite o envio em massa de várias solicitações de aumento de cota da Amazon SageMaker SageMaker AI (AI) em uma única operação, simplificando o gerenciamento de cotas para cargas de trabalho de aprendizado de máquina em grande escala. O runbook valida cada solicitação em relação às cotas de serviços de SageMaker IA ajustáveis, encaminha as solicitações dentro dos limites de aprovação automática para processamento imediato e cria casos de AWS Support para solicitações que exigem análise manual. Os aumentos de cota são aplicados na mesma AWS região em que o runbook é executado.

Importante

Esse runbook não oferece suporte a solicitações de aumento de cota para instâncias de computação especializadas, incluindo os tipos de instância P4, P5 e Trainium. Para esses tipos de instância, envie solicitações individuais de aumento de cota por meio do console AWS Service Quotas ou AWS do Support.

O runbook faz uma pausa de até uma hora enquanto aguarda a aprovação dos diretores designados por meio da notificação do Amazon Simple Notification Service (Amazon SNS). Analise cuidadosamente o resultado da ApproveQuotaCodeLimitMapping etapa antes de aprovar, pois os aumentos de cota aprovados não podem ser revertidos.

Executar esta automação (console)

Tipo de documento

Automação

Proprietário

Amazon

Plataformas

Linux, macOS, Windows

Parâmetros

  • AutomationAssumeRole

    Tipo AWS::IAM::Role: :Arn

    Descrição: (Opcional) O Amazon Resource Name (ARN) da função AWS Identity and Access Management (IAM) que permite que a AWS Systems Manager (Systems Manager) Automation execute as ações em seu nome. Se nenhum perfil for especificado, o Systems Manager Automation usa as permissões do usuário que inicia este runbook.

  • ResourcesMapping

    Tipo: StringList

    Descrição: (Obrigatório) As cotas do serviço de SageMaker IA devem ser aumentadas, especificadas como valores separados por dois pontos. Suporta três formatos:

    • Category:Resource:NewValue— quando os nomes das categorias e dos recursos estão disponíveis. Exemplo: spot-training-job:ml.c4.xlarge:25

    • Resource:NewValue— quando somente o nome do recurso está disponível. Exemplo: max_number_of_experiment_trial_associations:501

    • QuotaCode:NewValue— ao usar o código de cota direta. Exemplo: L-9xAxx23x:25

    Você pode misturar formatos na mesma solicitação, separados por vírgulas. Máximo de 50 itens. Exemplo: studio:CodeEditor-ml.r6id.large:787,spot-training-job:ml.c4.xlarge:34,L-99AEC235:2

  • SNSTopicArn

    Tipo: string

    Descrição: (Obrigatório) O ARN do tópico do Amazon SNS usado para enviar notificações de aprovação durante a execução da automação.

  • ApproverIAM

    Tipo: StringList

    Descrição: (Obrigatório) Uma lista de diretores AWS autenticados que podem aprovar ou rejeitar as solicitações de aumento de cota. Máximo de 10 aprovadores. Formatos aceitos: nome de usuário do IAM, ARN do usuário do IAM, ARN da função do IAM ou ARN do usuário da função assumida pelo IAM.

  • MinimumRequiredApprovals

    Tipo: inteiro

    Valores válidos: 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10

    Padrão: 1

    Descrição: (Opcional) O número mínimo de aprovações necessárias para retomar a automação. Não pode exceder o número de aprovadores definido emApproverIAM.

Permissões obrigatórias do IAM

O parâmetro AutomationAssumeRole requer as seguintes ações para usar o runbook com êxito.

  • servicequotas:ListServiceQuotas

  • servicequotas:RequestServiceQuotaIncrease

  • servicequotas:GetRequestedServiceQuotaChange

  • sns:Publish

  • ssm:SendAutomationSignal

Etapas do documento

  1. VerifyCategoriesAndResources- Valida todas as categorias e recursos especificados em relação às cotas de serviços de SageMaker IA ajustáveis usando a API Service AWS Quotas. Confirma que cada nome de categoria e recurso existe e é modificável e identifica solicitações em que o novo limite é menor que o valor atual.

  2. BranchOnValidCategoriesFound- Verifica se algum mapeamento de cota válido foi encontrado. Se existirem mapeamentos válidos, prossiga para. ApproveQuotaCodeLimitMapping Caso contrário, pula diretamente paraGenerateSummaryReport.

  3. ApproveQuotaCodeLimitMapping- Prepara uma mensagem de aprovação detalhada mostrando solicitações válidas prontas para processamento, solicitações inválidas com explicações (como limites inferiores aos valores atuais ou códigos de cota não suportados) e um detalhamento completo de todas as solicitações de aumento de cota para análise antes da aprovação.

  4. WaitingForApproval- Pausa a automação e envia uma notificação de aprovação para o tópico especificado do Amazon SNS. Os aprovadores designados devem analisar o resultado da ApproveQuotaCodeLimitMapping etapa e aprovar ou rejeitar as solicitações. Essa etapa expira após 3600 segundos (uma hora) se nenhuma ação for tomada.

  5. RequestQuotaIncreases- Envia solicitações individuais de aumento de cota para cada recurso válido por meio da API Service Quotas AWS . As solicitações são feitas a uma por segundo para evitar a limitação da API. Lida com exceções de API com novas tentativas exponenciais.

  6. WaitForRequestQuotaIncreaseResults- Pesquisa o status de todas as solicitações de aumento de cota enviadas até que nenhuma permaneça no PENDING estado. Os status de terminal aceitos são CASE_OPENEDAPPROVED,DENIED,NOT_APPROVED,CASE_CLOSED, e. INVALID_REQUEST

  7. GetRequestQuotaIncreaseResults- Recupera o status final de todas as solicitações de aumento de cotas enviadas pela API Service AWS Quotas e mapeia o IDs caso de suporte aos recursos correspondentes e IDs à solicitação de relatórios.

  8. GenerateSummaryReport- Compila um resumo abrangente de todas as solicitações de aumento de cotas e seus resultados, incluindo contagens totais de solicitações, detalhes por solicitação, caso de suporte IDs para solicitações que exigem análise manual e próximas etapas acionáveis.

Saídas

GenerateSummaryReport.SummaryReport- Um resumo abrangente de todas as solicitações de aumento de cotas, seus status e qualquer caso de suporte IDs criado para análise manual.