

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Reserve planos de treinamento para seus trabalhos ou HyperPod grupos de treinamento
<a name="reserve-capacity-with-training-plans"></a>

Os planos SageMaker de treinamento da Amazon são um recurso que permite que você reserve e ajude a maximizar o uso da capacidade da GPU para cargas de trabalho de treinamento de modelos de IA em grande escala. Esse recurso fornece acesso a tipos de instância muito procurados que abrangem uma variedade de opções de computação acelerada por GPU, incluindo as mais recentes tecnologias de GPU NVIDIA e chips trainium. AWS Com os planos de SageMaker treinamento, você pode garantir acesso previsível a esses recursos computacionais de alta demanda e alto desempenho dentro dos prazos e orçamentos especificados, sem a necessidade de gerenciar a infraestrutura subjacente. Essa flexibilidade é particularmente valiosa para organizações que lidam com os desafios de adquirir e programar essas instâncias de computação tão procuradas para workloads essenciais de IA.

## O que são planos SageMaker de treinamento
<a name="training-plans-what-is"></a>

SageMaker os planos de treinamento permitem que você reserve a capacidade computacional adaptada às suas necessidades de recursos alvo, como trabalhos de SageMaker treinamento ou SageMaker HyperPod clusters. O serviço gerencia automaticamente a reserva, o provisionamento de recursos de computação acelerada, a configuração da infraestrutura, a execução de workloads e a recuperação de falhas na infraestrutura.

SageMaker os planos de treinamento consistem em um ou mais blocos de capacidade reservada, cada um definido pelos seguintes parâmetros:
+ Tipo de instância específico
+ Quantidade de instâncias
+ Zona de disponibilidade
+ Duração
+ Horário de início e término

**nota**  
Os planos de treinamento são específicos para seu recurso alvo ( SageMaker Training Job ou SageMaker HyperPod) e não podem ser trocados.
Vários blocos de capacidade reservada em um único plano de treinamento podem ser descontínuos. Isso significa que pode haver lacunas entre os blocos de capacidade reservada.

## Benefícios dos planos SageMaker de treinamento
<a name="training-plans-benefits"></a>

SageMaker os planos de treinamento oferecem os seguintes benefícios:
+ **Acesso previsível**: reserve a capacidade de GPU para workloads de machine learning dentro de prazos especificados.
+ **Gerenciamento de custos**: planeje e faça um orçamento com antecedência dos requisitos de treinamento em grande escala.
+ **Gerenciamento automatizado de recursos**: os planos de SageMaker treinamento lidam com o provisionamento e o gerenciamento da infraestrutura.
+ **Flexibilidade**: crie planos de treinamento para vários recursos, incluindo cargos e SageMaker HyperPod grupos de SageMaker treinamento.
+ **Tolerância a falhas**: beneficie-se da recuperação automática de falhas na infraestrutura e da migração da carga de trabalho entre zonas de disponibilidade para trabalhos de treinamento de SageMaker IA.

## SageMaker planos de treinamento, reserva antecipada e horários de início flexíveis
<a name="training-plan-reservation-timing"></a>

SageMaker os planos de treinamento permitem que você reserve a capacidade computacional com antecedência, com horários e durações de início flexíveis. 
+ **Reserva antecipada**: você pode reservar um plano de treinamento até 8 semanas (56 dias) antes da data de início.
+ **Prazo mínimo de entrega**: as ofertas de planos de SageMaker treinamento podem estar disponíveis para começar em até 30 minutos após a reserva, sujeitas à disponibilidade.
**nota**  
Você pode pesquisar e comprar um plano que estará acessível em 30 minutos. Para garantir a ativação oportuna, a transação de pagamento deve ser concluída com êxito pelo menos 5 minutos antes do horário de início desejado. Por exemplo, se quiser que um plano comece às 14h, você pode fazer uma pesquisa de última hora até 13h30 e concluir sua compra até 13h55 para garantir que o plano esteja pronto até as 14h.
+ **Duração da reserva e quantidade de instâncias**: os planos de SageMaker treinamento permitem que você reserve instâncias com opções específicas de duração e quantidade. Para ver os tipos de instância disponíveis em determinadas Região da AWS opções, de duração e quantidade, consulte[Tipos de instância Regiões da AWS e preços suportados](#training-plans-supported-instances-and-regions).
+ **Hora de término**: os planos de treinamento sempre terminam às 11h30 UTC do último dia da reserva.
+ **Encerramento do plano de treinamento**: se você estiver usando trabalhos de treinamento como recurso alvo e 30 minutos permanecerem em uma capacidade reservada, os planos de SageMaker treinamento iniciarão o processo de encerramento de todas as instâncias em execução dentro desse bloco até que a próxima capacidade reservada se torne ativa. Você mantém acesso total ao seu plano de treinamento até 30 minutos antes do horário final do bloco de capacidade reservada.

  Se seu recurso de destino for um SageMaker HyperPod cluster, esse limite de tempo é de uma hora.

## SageMaker planos de treinamento, fluxo de trabalho do usuário
<a name="training-plans-workflow"></a>

SageMaker os planos de treinamento funcionam com as seguintes etapas:

Etapas de administração:

1. **Pesquisar e analisar**: encontre ofertas de planos disponíveis que atendam aos seus requisitos de computação, como tipo, contagem, horário de início e duração da instância.

1. **Criar um plano**: reserve um plano de treinamento que atenda às suas necessidades usando o ID da oferta de plano escolhida.

1. **Pagamento e agendamento**: após o pagamento antecipado bem-sucedido, o status do plano passa a ser `Scheduled`.

Etapas para engenheiros de ML/usuários do plano:

1. **Alocação de recursos**: use seu plano para enfileirar trabalhos de treinamento de SageMaker IA ou alocar para um SageMaker HyperPod grupo de instâncias de cluster.

1. **Ativação**: quando a data de início do plano chega, ela se torna `Active`. Com base na capacidade reservada disponível, os planos SageMaker de treinamento iniciam automaticamente trabalhos de treinamento ou provisionam grupos de instâncias.

**nota**  
O status do plano de treinamento muda de `Scheduled` para `Active` quando um período de capacidade reservada começa e depois volta para `Scheduled` enquanto se espera o início do próximo período de capacidade reservada. 

Os diagramas a seguir fornecem uma visão geral abrangente de como os planos de SageMaker treinamento interagem com diferentes[target resources](#training-plans-target-resources), ilustrando o ciclo de vida de um plano e seu papel na alocação de recursos tanto para trabalhos de treinamento quanto SageMaker para clusters. SageMaker HyperPod 
+ **Planos de SageMaker treinamento para Training Job**: O primeiro diagrama ilustra o end-to-end fluxo de trabalho da interação entre um plano de treinamento e SageMaker Training Job.   
![\[Faturamento, reserva de capacidade com planos de treinamento e SageMaker Training Job. Ilustração do ciclo de vida do plano de treinamento e dos estados de tarefas de treinamento gerenciadas por administradores e engenheiros de ML.\]](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/images/training-plans/tp-training-plan-for-training-jobs.png)
+ **Planos de treinamento para SageMaker HyperPod clusters**: o segundo diagrama ilustra o end-to-end fluxo de trabalho da interação entre um plano de treinamento e um grupo de SageMaker HyperPod instâncias.  
![\[Faturamento, reserva de capacidade com planos de treinamento e fluxo de trabalho de gerenciamento de grupos de instâncias. Ilustração de administradores e engenheiros de ML do ciclo de vida do plano de treinamento e dos estados do grupo de instâncias.\]](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/images/training-plans/tp-training-plan-for-hyperpod.png)

## Tipos de instância Regiões da AWS e preços suportados
<a name="training-plans-supported-instances-and-regions"></a>

Os planos de treinamento permitem o uso de reservas para os seguintes tipos específicos de instância de alto desempenho, cada um disponível em Regiões da AWS selecionadas:
+ **ml.p4d.24xlarge**
+ **ml.p5.48xlarge**
+ **ml.p5e.48xlarge**
+ **ml.p5en.48xlarge**
+ **ml.trn1.32xlarge**
+ **ml.trn2.48xlarge**
+ **ml.p6-b200.48xlarge**
+ **ml.c6i-32xlargesc**

**UltraServers**
+ **ml.p6e-gb200.36xlarge**
+ **ml.p6e-gb200.72xlarge**

**nota**  
A disponibilidade dos tipos de instância pode ser alterada ao longo do tempo. Para up-to-date obter mais informações sobre os tipos de instância disponíveis de acordo com a região, bem como seus respectivos preços, consulte [SageMaker Preços](https://aws.amazon.com/sagemaker-ai/pricing/). Role para baixo até a seção de **planos de treinamento SageMaker HyperPod flexíveis da Amazon** em **Preços sob demanda**. Selecione uma região para ver a lista de tipos de instância disponíveis.

A disponibilidade em várias regiões permite escolher o local mais adequado para workloads, considerando fatores como requisitos de residência de dados e proximidade de outros serviços da AWS .

**Importante**  
Você pode usar planos SageMaker de treinamento para reservar instâncias com as seguintes opções de duração da reserva e quantidade de instâncias.  
As durações das reservas estão disponíveis em incrementos de 1 dia, de 1 a 182 dias.
As opções de quantidade de instâncias de reserva são 1, 2, 4, 8, 16, 32 ou 64 instâncias.
Certifique-se de que seus trabalhos de treinamento ou cotas de HyperPod serviço permitam um número máximo de instâncias por tipo de instância que exceda o número de instâncias especificado em seu plano. Para visualizar suas cotas atuais ou solicitar um aumento de cota, consulte [Veja as cotas dos planos de SageMaker treinamento usando o console AWS de gerenciamento](training-plan-quotas.md).

## UltraServers em SageMaker IA
<a name="training-plans-ultraservers"></a>

UltraServers na SageMaker IA oferecem um conjunto de instâncias interconectadas por meio de um domínio de rede de alta largura de banda. Por exemplo, o P6e- GB200 UltraServer conecta até 18 `p6e-gb200.36xlarge` instâncias em um domínio NVLink NVIDIA. Com 4 NVIDIA Blackwell GPUs por instância, cada P6e- GB200 UltraServer suporta 72 GPUs, para que você possa executar suas maiores cargas de trabalho de IA com alto desempenho em IA. SageMaker 

Ao usar UltraServers com SageMaker IA, você obtém desempenho combinado com a infraestrutura gerenciada da SageMaker IA, recursos integrados de resiliência a falhas, recursos de monitoramento integrados e integração nativa com outros AWS serviços e SageMaker IA. Essa integração permite que você se concentre no desenvolvimento e na implantação de modelos, enquanto a SageMaker IA lida com o trabalho pesado indiferenciado de gerenciar a infraestrutura de IA.

**nota**  
UltraServers estão disponíveis somente na Zona Local de Dallas (us-east-1-dfw-2a), que é uma extensão da região Leste dos EUA (Norte da Virgínia). Para obter mais informações, consulte [Introdução ao Zona local AWS s](https://docs.aws.amazon.com/local-zones/latest/ug/getting-started.html)

### Considerações
<a name="training-plans-ultraservers-considerations"></a>

Considere o seguinte ao usar UltraServers com SageMaker IA:
+ Você pode usar tanto UltraServers para trabalhos de treinamento [ SageMaker HyperPod](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod.html)quanto para [trabalhos SageMaker de treinamento](https://docs.aws.amazon.com/sagemaker/latest/dg/train-model.html).
+ Você só pode comprar UltraServers em unidades completas. Para obter mais informações sobre instâncias e preços, consulte Planos de treinamento SageMaker HyperPod flexíveis da Amazon nos [preços do Amazon SageMaker AI](https://aws.amazon.com/sagemaker-ai/pricing/).
+ Se você estiver usando UltraServers com HyperPod, adiciona HyperPod automaticamente rótulos de topologia aos seus recursos para ajudá-lo na alocação de recursos. Para obter mais informações, consulte [Usando o agendamento com reconhecimento de topologia na Amazon. SageMaker HyperPod](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod-topology.html)
+ SageMaker A IA UltraServers oferece vários recursos que aprimoram a resiliência de suas cargas de trabalho, incluindo verificações preemptivas e detecção e mitigação automáticas de falhas. Dependendo do problema, a SageMaker IA pode executar ações para recuperar suas cargas de trabalho, como reiniciar instâncias, substituir instâncias com falha por peças sobressalentes e substituir instâncias com falha. UltraServers
+ Para aumentar a resiliência, você pode configurar instâncias dentro de um UltraServer para serem usadas como peças de reposição. Manter uma instância sobressalente dentro do UltraServer garante que a SageMaker IA possa responder rapidamente a uma falha na instância e, ao mesmo tempo, minimizar qualquer impacto em seus trabalhos. Recomendamos que você mantenha uma instância sobressalente por UltraServer. Não é necessário reservar nenhuma instância sobressalente, mas isso pode prejudicar as opções de suporte e retardar a recuperação de falhas. Você compra UltraServers por inteiro, então o número de peças de reposição que você reserva não afeta os preços.
+ Para ver o status e as instâncias em um UltraServer, use a operação da [ ListTrainingPlans](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ListTrainingPlans.html)API ou o AWS console para ver os planos de treinamento. Usando essas ferramentas, você pode ver o número total de instâncias disponíveis, instâncias atualmente em uso, instâncias não íntegras, o número de peças de reposição configuradas e outras informações. Os status possíveis são `ok`, `impaired` e `insufficient-data`.

## SageMaker comportamento de busca de planos de treinamento
<a name="training-plans-search-behavior"></a>

Ao pesquisar uma oferta de plano de treinamento, os planos de SageMaker treinamento usam a seguinte abordagem para maximizar a disponibilidade e a flexibilidade dos recursos para os usuários, mesmo quando a demanda é alta e os blocos de capacidade reservada são escassos:
+ **Pesquisa contínua inicial**: os planos de SageMaker treinamento tentam primeiro encontrar um único bloco contínuo de capacidade reservada que corresponda à duração especificada nas datas de início e término, ao mesmo tempo em que atenda a todos os outros critérios especificados, incluindo o recurso alvo, o tipo de instância solicitada e o número de instâncias.
+ **Pesquisa em dois blocos**: os planos de SageMaker treinamento não retornam um resultado “sem capacidade” se um único bloco contínuo de capacidade reservada que atenda a todos os critérios não estiver disponível. Em vez disso, ele tenta atender automaticamente à solicitação usando dois blocos de capacidade reservada separados, dividindo a duração total em dois segmentos de tempo.

  Essa abordagem de dois blocos fornece maior flexibilidade na alocação de recursos, possivelmente protegendo instâncias de alta demanda que, de outra forma, não estariam disponíveis.

**nota**  
SageMaker os planos de treinamento retornam até três ofertas de um ou dois segmentos. Por exemplo, para um plano de duração de 48 horas, os planos de SageMaker treinamento podem oferecer um plano com dois blocos de 24 horas, um bloco contínuo de 48 horas e dois blocos com duração desigual.

## Considerações
<a name="training-plans-considerations"></a>

**Importante**  
Os planos de treinamento não podem ser modificados após a compra.
Os planos de treinamento não podem ser compartilhados entre AWS contas ou dentro AWS da sua organização.
+ Ao pesquisar ofertas de planos de treinamento, os planos de SageMaker treinamento adaptam sua estratégia de pesquisa com base em: [target resources](#training-plans-target-resources)

  **Para SageMaker HyperPod clusters**:
  + As ofertas são limitadas a uma única zona de disponibilidade (AZ).
  + Isso garante desempenho de rede consistente e localidade de dados dentro do cluster.

  **Para trabalhos SageMaker de treinamento**:
  + As ofertas podem abranger várias zonas de disponibilidade. 
  + Isso é particularmente relevante quando a oferta do plano contém várias capacidades reservadas descontínuas.
  + Por exemplo, um plano pode incluir capacidade em AZ-A para um bloco de capacidade reservada e AZ-B para outro. SageMaker os planos de treinamento podem mover automaticamente as cargas de trabalho entre as zonas de disponibilidade (AZs) com base na disponibilidade dos recursos.

    Essa abordagem multi-AZ para tarefas de treinamento oferece maior flexibilidade na alocação de recursos, aumentando as chances de encontrar a capacidade adequada para sua workload. No entanto, você deve estar ciente de que seus trabalhos podem ser executados de forma diferente AZs durante diferentes partes do período de reserva.
+ Ao receber uma oferta de dois blocos, os usuários devem considerar cuidadosamente se essa alocação dividida atende aos requisitos de workload. Para se adaptar à natureza não contínua da reserva, pode ser necessário ajustar o agendamento do trabalho ou da distribuição da workload.

# IAM para planos SageMaker de treinamento
<a name="training-plan-iam-permissions"></a>

SageMaker os planos de treinamento exigem permissões específicas para duas funções distintas:

1. **Perfil de criador do plano**: os usuários atribuídos ao perfil de *criador do plano* precisam de permissões para pesquisar ofertas de plano de treinamento e criar, listar e descrever planos de treinamento.

1. **Função de usuário do plano**: os usuários com a função de *usuário do plano* precisam de permissões para usar planos de SageMaker treinamento em trabalhos de treinamento ou ao criar e atualizar SageMaker HyperPod clusters.

Antes de usar os planos de SageMaker treinamento, atualize as permissões com base no seu método de acesso:
+ Para Console de gerenciamento da AWS nossos SageMaker SDKs usuários: atualize as permissões da função do IAM configurada para o usuário do console ou da API.
+ Para AWS CLI usuários: certifique-se de que seu AWS CLI perfil esteja configurado corretamente com as credenciais e permissões apropriadas.
+ Para usuários do aplicativo Studio JupyterLab, como, defina permissões na função de execução associada ao espaço usado pelo aplicativo.

Você pode definir essas permissões usando uma política gerenciada ou permissões individuais mais granulares.

Para ter informações sobre como atualizar a política de permissões para um perfil, consulte [Atualizar permissões para um perfil](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles_update-role-permissions.html). Para ter mais informações sobre como encontrar e atualizar um perfil de execução, consulte [Obtenha um perfil de execução](sagemaker-roles.md#sagemaker-roles-get-execution-role).

**nota**  
Os administradores devem considerar cuidadosamente quais usuários precisam criar planos de treinamento e atribuir permissões adequadamente.

## Políticas gerenciadas
<a name="training-plan-managed-policies"></a>
+ Para criadores de plano: [https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerTrainingPlanCreateAccess.html](https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerTrainingPlanCreateAccess.html) oferece acesso para criar e gerenciar planos de treinamento.
+ Para usuários de plano: [https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerFullAccess.html](https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerFullAccess.html) inclui as permissões para usar planos de treinamento.

**nota**  
A política `AmazonSageMakerFullAccess` gerenciada foi projetada como uma ease-of-use política principalmente para fins de experimentação. Embora ofereça amplo acesso aos recursos de SageMaker IA, incluindo o uso de planos de treinamento, é importante observar:  
Não é recomendada para ambientes de produção devido às suas permissões amplas.
Não inclui permissões para criar planos de treinamento, pois `CreateTrainingPlan` é considerada uma ação administrativa que exige pagamento adiantado.
Para casos de uso de produção, é altamente recomendável criar políticas personalizadas que sigam o princípio de privilégio mínimo, que concede somente as permissões específicas necessárias para cada perfil.

## Permissões individuais
<a name="training-plan-individual-permissions"></a>

A lista a seguir detalha as permissões granulares que devem ser definidas nas declarações de política do IAM de uma função, com base nas ações específicas que um usuário precisa realizar com os planos de SageMaker treinamento:

### Lista de permissões dos planos de treinamento
<a name="training-plan-individual-permissions-list"></a>
+ `SearchTrainingPlanOfferings`: essa permissão possibilita que os usuários pesquisem as ofertas de planos de treinamento disponíveis.

  ```
  {
    "Sid": "SearchTrainingPlanOfferingsPermissions",
    "Effect": "Allow",
    "Action": [
      "sagemaker:SearchTrainingPlanOfferings"
    ],
    "Resource": "*"
  }
  ```
+ `CreateTrainingPlan`: essa permissão possibilita que os usuários criem planos de treinamento.
**nota**  
Você também deve incluir permissões para `CreateReservedCapacity` e `AddTags` e especificar os tipos de recurso `training-plan` e `reserved-capacity`.

  ```
  {
    "Sid": "CreateTrainingPlanPermissions",
    "Effect": "Allow",
    "Action": [
      "sagemaker:CreateTrainingPlan",
      "sagemaker:CreateReservedCapacity",
      "sagemaker:AddTags"
    ],
    "Resource": [
      "arn:aws:sagemaker:*:*:training-plan/*",
      "arn:aws:sagemaker:*:*:reserved-capacity/*"
    ]
  }
  ```
+ `DescribeTrainingPlan`: essa permissão possibilita que os usuários visualizem detalhes dos planos de treinamento existentes.

  ```
  {
    "Sid": "DescribeTrainingPlanPermissions",
    "Effect": "Allow",
    "Action": [
      "sagemaker:DescribeTrainingPlan"
    ],
    "Resource": [
      "arn:aws:sagemaker:::training-plan/*"
    ]
  }
  ```
+ `ListTrainingPlans`: Essa permissão permite que os usuários listem todos os planos de treinamento em suas AWS contas.

  ```
  {
    "Sid": "ListTrainingPlansPermissions",
    "Effect": "Allow",
    "Action": [
      "sagemaker:ListTrainingPlans"
    ],
    "Resource": "*"
  }
  ```

### Permissões individuais por tipo de usuário
<a name="training-plan-permissions-per-user-type"></a>

Esta seção apresenta uma análise detalhada das permissões individuais necessárias para cada perfil, conforme mencionado na seção [IAM para planos SageMaker de treinamento](#training-plan-iam-permissions). 

Para os criadores de plano, as seguintes permissões são necessárias:
+ `sagemaker:SearchTrainingPlanOfferings`
+ `sagemaker:CreateTrainingPlan`
+ `sagemaker:CreateReservedCapacity`
+ `sagemaker:AddTags`
+ `sagemaker:DescribeTrainingPlan`
+ `sagemaker:ListTrainingPlans`

Os usuários de plano precisam das seguintes permissões:
+ `sagemaker:CreateTrainingJob`(para SageMaker Training Job)
+ `sagemaker:CreateCluster`e `sagemaker:UpdateCluster` (para SageMaker HyperPod)
+ Acesso aos `reserved-capacity` recursos `training-plan` e; ao configurar as políticas do IAM para planos de SageMaker treinamento, inclua permissões para ambos `training-plan` e para os `reserved-capacity` recursos. Esses recursos são necessários tanto para trabalhos SageMaker de treinamento quanto para SageMaker HyperPod clusters. Isso permite que suas funções do IAM interajam com os recursos dos planos de SageMaker treinamento e gerenciem a capacidade reservada.
  + Para trabalhos SageMaker de treinamento, certifique-se de que sua política inclua o `"arn:aws:sagemaker:::reserved-capacity/"` recurso `"arn:aws:sagemaker:::training-plan/"` ARNs e.

------
#### [ JSON ]

****  

```
{
  "Version":"2012-10-17",		 	 	 
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "sagemaker:CreateTrainingJob"
      ],
      "Resource": [
        "arn:aws:sagemaker:us-east-2:111122223333:training-job/",
        "arn:aws:sagemaker:us-east-2:111122223333:training-plan/",
        "arn:aws:sagemaker:us-east-2:111122223333:reserved-capacity/*"
      ]
    }
  ]
}
```

------

Da mesma forma, para SageMaker HyperPod configurações, inclua-as ARNs além dos recursos específicos do cluster.

------
#### [ JSON ]

****  

```
{
  "Version":"2012-10-17",		 	 	 
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "sagemaker:CreateCluster",
        "sagemaker:UpdateCluster"
      ],
      "Resource": [
        "arn:aws:sagemaker:us-east-2:111122223333:cluster/",
        "arn:aws:sagemaker:us-east-2:111122223333:training-plan/",
        "arn:aws:sagemaker:us-east-2:111122223333:reserved-capacity/*"
      ]
    }
  ]
}
```

------

# Criação de planos de treinamento
<a name="training-plan-creation"></a>

Para reservar a capacidade computacional usando o recurso SageMaker de planos de treinamento, siga estas etapas:

1. **Identifique seu recurso alvo:** comece determinando se você precisa de capacidade para SageMaker treinar trabalhos ou SageMaker HyperPod grupos.

1. **Especifique seus requisitos de capacidade:** defina suas necessidades de capacidade em detalhes. Isso inclui selecionar o tipo de instância apropriado para sua workload, determinar o número de instâncias necessárias e especificar a duração do uso. Para obter informações sobre os tipos de instância compatíveis em determinadas Região da AWS opções, de duração e quantidade, consulte[Tipos de instância Regiões da AWS e preços suportados](reserve-capacity-with-training-plans.md#training-plans-supported-instances-and-regions).

1. **Pesquise as ofertas de planos de treinamento disponíveis:** depois de especificar seus requisitos, use a funcionalidade de pesquisa dos planos de SageMaker treinamento para encontrar ofertas de planos de treinamento disponíveis em um ou mais segmentos. Cada oferta inclui detalhes, como hora de início, zona de disponibilidade específica para capacidade reservada e preço do plano. Analise essas ofertas, considerando fatores como custo-benefício, preferências geográficas e alinhamento com suas necessidades específicas.

   Se não houver nenhum plano adequado, ajuste seus critérios de pesquisa e procure um novo conjunto de ofertas.

1. **Crie um plano de treinamento com base em uma oferta adequada::** depois de identificar uma oferta adequada, continue criando seu plano de treinamento. Esse processo envolve selecionar a oferta escolhida e iniciar a reserva.
   + A reserva do plano de treinamento cria uma fatura.
   + O pagamento do valor total é cobrado como parte do processo de atendimento. Depois que o pagamento for concluído, o plano estará pronto para agendar seus trabalhos de SageMaker treinamento ou criar HyperPod clusters.

   Para saber mais sobre como usar planos de treinamento para seus trabalhos SageMaker de treinamento, consulte[Utilização de planos de SageMaker treinamento para trabalhos de treinamento](training-plan-utilization-for-training-jobs.md).

    Para saber como usar planos de treinamento para seus HyperPod clusters, consulte[Utilização de planos de treinamento para clusters da Amazon SageMaker HyperPod](training-plan-utilization-for-hyperpod.md).

Você pode criar um plano de treinamento usando o console de SageMaker IA ou métodos programáticos. O console de SageMaker IA oferece uma interface gráfica visual com uma visão abrangente de suas opções, enquanto a criação programática pode ser feita usando a AWS CLI ou SageMaker SDKs para interagir diretamente com a API de planos de treinamento.

Para obter instruções step-by-step do console e referências detalhadas da API, consulte as respectivas seções nesta documentação.

**Topics**
+ [SageMaker criação de planos de treinamento usando o console de SageMaker IA](training-plan-creation-using-console.md)
+ [SageMaker criação de planos de treinamento usando a SageMaker API, ou AWS CLI](training-plan-creation-using-api-cli-sdk.md)

# SageMaker criação de planos de treinamento usando o console de SageMaker IA
<a name="training-plan-creation-using-console"></a>

SageMaker os planos de treinamento oferecem uma maneira conveniente de criar planos de treinamento por meio da interface do usuário do console de SageMaker IA, permitindo que os usuários programem facilmente seus recursos de treinamento de aprendizado de máquina. Este guia explica o processo de criação de um plano de treinamento para trabalhos e SageMaker HyperPod clusters de SageMaker treinamento usando o console de SageMaker IA. Seguindo essas etapas, você pesquisará ofertas de planos de treinamento, analisará as opções disponíveis e comprará o plano que melhor atenda às suas necessidades.

Para criar um plano de treinamento visualmente usando uma interface de usuário:

1. Comece navegando até o console de SageMaker IA em [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Escolha **Planos de treinamento** no menu do painel esquerdo.

1. A partir daí, escolha o botão **Criar plano de treinamento** na área de conteúdo principal para iniciar o processo de configuração de seu cronograma de treinamento personalizado.

![\[SageMaker Console de IA mostrando a página de planos de treinamento. A interface exibe informações sobre como os planos de treinamento funcionam, inclusive etapas para solicitar, monitorar e usar um plano. O painel de navegação esquerdo destaca a opção “Planos de treinamento” e o botão “Criar plano de treinamento” está visível na área de conteúdo principal.\]](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/images/training-plans/tp-console.png)


Em seguida, pesquise ofertas de planos que atendam aos seus requisitos de computação.

**Topics**
+ [Pesquisar ofertas de plano de treinamento](search-training-plan-offerings.md)
+ [Reservar o melhor plano de treinamento](choose-best-training-plan.md)
+ [Listar as tarefas de treinamento](list-training-plans.md)
+ [Visualizar detalhes do plano de treinamento](training-plan-details.md)

# Pesquisar ofertas de plano de treinamento
<a name="search-training-plan-offerings"></a>

Depois de escolher **Planos de treinamento** no painel esquerdo do console de SageMaker IA e, em seguida, **Criar plano de treinamento**, um formulário **Localizar plano de treinamento** é aberto. Esse formulário permite que você especifique seus requisitos e pesquise ofertas adequadas de plano de treinamento.

Siga estas etapas para concluir a instalação:

1. Identifique seu **destino**: os planos de treinamento são específicos para o recurso de destino. Especifique se você deseja usar um plano para executar trabalhos SageMaker de treinamento ou SageMaker HyperPod clusters.

1. Para o **tipo de computação**, você pode escolher entre **Instância** ou **UltraServer**. UltraServers são conectar várias instâncias do Amazon EC2 usando uma interconexão aceleradora de baixa latência e alta largura de banda. Para obter mais informações, consulte [Amazon EC2 UltraServers](https://aws.amazon.com/ec2/ultraservers/). Para saber como você pode usar UltraServers com a SageMaker IA, consulte[UltraServers em SageMaker IA](reserve-capacity-with-training-plans.md#training-plans-ultraservers).

1. Escolha o **tipo de instância** **e a contagem** de instâncias de sua preferência: para ver os tipos de instância disponíveis em determinadas Região da AWS opções de duração e quantidade, consulte[Tipos de instância Regiões da AWS e preços suportados](reserve-capacity-with-training-plans.md#training-plans-supported-instances-and-regions).

1. Defina seus parâmetros de tempo: escolha as datas de início e término desejadas e especifique a duração do plano nessa janela.

1. Escolha **Encontrar planos de treinamento**.

![\[SageMaker Console de IA mostrando a página de ofertas do plano de treinamento Search. A interface exibe opções para selecionar o recurso de destino para o plano (trabalho de treinamento ou HyperPod cluster), especificar o tipo e a contagem de instâncias, definir datas de início e término e a duração da entrada. O botão Encontrar planos de treinamento está visível na parte inferior do formulário.\]](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/images/training-plans/tp-search-training-plan-offerings.png)


SageMaker os planos de treinamento buscam ofertas que atendam aos seus requisitos de capacidade. Quando são encontradas correspondências dentro do período especificado, elas são exibidas na parte inferior da página. Cada oferta de plano de treinamento inclui os seguintes detalhes:
+ Duração total do plano
+ Datas de início e fim
+ Preço total para pagamento adiantado: 

  Passe o mouse sobre o preço para ver o detalhamento da taxa por hora da instância, da contagem de instâncias e do total de horas.
+ Número total de segmentos do plano

Ao clicar no link de detalhes do segmento, uma visualização modal é aberta com detalhes específicos do segmento:
+ Duração
+ Datas de início e fim
+ Zona de disponibilidade

![\[SageMaker Console de IA mostrando a página Pesquisar ofertas do plano de treinamento com campos de entrada para os requisitos do plano e a seção Planos disponíveis exibindo detalhes de três planos encontrados com durações, preços e status de disponibilidade variados.\]](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/images/training-plans/tp-available-offerings.png)


Se nenhum plano adequado for encontrado ou os planos disponíveis não atenderem às suas necessidades, ajuste seus critérios de pesquisa modificando os parâmetros no formulário **Requisitos dos planos de treinamento**. Depois de encontrar uma oferta adequada, selecione-a e escolha **Próximo** para prosseguir para a página de reserva do plano. Nessa página, você pode atribuir um nome ao seu plano e, em seguida, analisar e confirmar sua seleção antes de finalizar a reserva.

**nota**  
Os planos marcados com `Immediately available` serão iniciados em 30 minutos, desde que o pagamento seja concluído pelo menos 5 minutos antes da hora de início programada.

# Reservar o melhor plano de treinamento
<a name="choose-best-training-plan"></a>

A pesquisa de plano de treinamento exibiu ofertas adequadas às suas necessidades de capacidade e orçamento. 

1. Insira um nome para o plano e escolha **Próximo**.

1. Analise e **envie** seu pedido de compra.
**Importante**  
Os planos de treinamento não podem ser modificados após a compra.
Os planos de treinamento não podem ser compartilhados entre AWS contas ou dentro AWS da sua organização.

   Após o envio do pedido
   + O plano de treinamento aparece inicialmente como `Pending` na lista de planos de treinamento.
   + Uma fatura é gerada automaticamente após o recebimento do pedido.
   + O pagamento total é recebido durante o processo de atendimento.
   + Depois que o pagamento é processado com êxito, o status do plano muda para `Scheduled` e o plano fica disponível para uso.

![\[SageMaker Console de IA mostrando a página “Revisão e compra” de um plano de treinamento. A página exibe detalhes do plano de treinamento, como informações sobre o segmento, preço, nome do plano e tags. Existem opções para editar, cancelar, voltar ou criar o plano.\]](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/images/training-plans/tp-review-and-purchase-training-plan.png)


# Listar as tarefas de treinamento
<a name="list-training-plans"></a>

Para visualizar seus planos de treinamento:

1. Navegue até o console de SageMaker IA em [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Escolha **Planos de treinamento** no menu do painel esquerdo. Isso exibe uma lista de todos os seus planos de treinamento, incluindo nome, status, tipo de recurso de destino e outros detalhes importantes.

   Depois de comprar um plano, essa lista é aberta. Os planos recém-criados exibem o status `Pending` até que o pagamento seja concluído. O status geralmente é atualizado alguns minutos após o processamento do pagamento.

![\[SageMaker Console de IA mostrando a lista da página de planos de treinamento. A página inclui uma tabela listando os planos de treinamento com detalhes como nome, status, total de instâncias, instâncias em uso, zona, data de início e data de término. Um botão para criar um plano de treinamento está visível.\]](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/images/training-plans/tp-list-training-plans.png)


# Visualizar detalhes do plano de treinamento
<a name="training-plan-details"></a>

Na lista de planos de treinamento, siga o nome do plano para visualizar os respectivos detalhes. Especificamente, você pode verificar o uso atual de capacidade e listar as workloads na página de detalhes do seu plano. 

A página de detalhes mostra:
+ Visão geral do plano de treinamento: status, meta, tipo de instância e duração.
+ Seções expansíveis para detalhes do segmento, preços, nome do plano e tags.
+ Utilização de capacidade:
  + Total: o número total de instâncias reservadas no plano de treinamento.
  + Em uso: o número de instâncias em uso no momento no plano de treinamento.
  + Instâncias disponíveis: o número de instâncias disponíveis para uso no momento no plano de treinamento.

Na parte inferior da página, um link permite que você visualize os trabalhos de treinamento ou a lista de grupos de instâncias de SageMaker HyperPod cluster associados a esse plano, dependendo do recurso de destino. 

![\[SageMaker Página do console de IA exibindo detalhes de um plano de treinamento. A página mostra informações básicas do plano, status e detalhes da instância. Abaixo estão as seções expansíveis para obter detalhes adicionais. Na parte inferior, uma seção de utilização da capacidade mostra as instâncias totais, em uso e disponíveis para o plano.\]](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/images/training-plans/tp-view-training-plan.png)


# SageMaker criação de planos de treinamento usando a SageMaker API, ou AWS CLI
<a name="training-plan-creation-using-api-cli-sdk"></a>

SageMaker os planos de treinamento apoiam a criação programática de planos de treinamento por meio de sua API. Você pode interagir com a API de planos de treinamento usando o AWS CLI ou SageMaker SDKs.

SageMaker As ações de API dos planos de treinamento fornecem um fluxo de trabalho abrangente para gerenciar os planos de treinamento de forma programática:
+ **`SearchTrainingPlanOfferings`:** permite que os usuários consultem e descubram os recursos de computação disponíveis especificando determinados parâmetros, como tipo de instância, contagem e janela de tempo desejada. A API exibe uma lista classificada das ofertas de plano de treinamento que melhor atendem aos requisitos do usuário.
+ **`CreateTrainingPlan`:** permite a reserva de uma oferta específica de plano de treinamento, transformando uma possível capacidade computacional em uma capacidade reservada programada com um ARN de plano de treinamento exclusivo.
+ **`ListTrainingPlans`:** fornece um método para recuperar e revisar todos os planos de treinamento existentes na AWS conta de um usuário, com recursos opcionais de filtragem e classificação.
+ **`DescribeTrainingPlan`:** oferece informações detalhadas sobre um plano de treinamento específico, inclusive os respectivos estágios do ciclo de vida, como `Pending`, `Active` e `Expired`.
+ **`ExtendTrainingPlan`:** amplia um plano de treinamento existente comprando uma oferta de extensão. Para obter mais informações, consulte [Extensão dos planos de treinamento](training-plan-extension.md).
+ **`DescribeTrainingPlanExtensionHistory`:** recupera o histórico de extensões de um plano de treinamento. Para obter mais informações, consulte [Extensão dos planos de treinamento](training-plan-extension.md).

**Topics**
+ [Pesquisar ofertas de plano de treinamento](search-training-plan-offerings-api-cli-sdk.md)
+ [Reservar o melhor plano de treinamento](choose-best-training-plan-using-api-cli-sdk.md)
+ [Listar as tarefas de treinamento](list-training-plans-using-api-cli-sdk.md)
+ [Visualizar detalhes do plano de treinamento](training-plan-details-using-api-cli-sdk.md)

# Pesquisar ofertas de plano de treinamento
<a name="search-training-plan-offerings-api-cli-sdk"></a>

Para criar um plano de treinamento, primeiro chame a operação de API [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html), inserindo os requisitos do plano (como tipo de instância, contagem e janela de tempo desejada) como parâmetros de entrada. Os planos de treinamento são específicos para seus recursos de destino. Especifique para qual recurso de destino o plano será usado (`training-job` ou `hyperpod-cluster`). A API exibe uma lista de ofertas disponíveis que correspondem aos seus requisitos. Se nenhuma oferta adequada for encontrada, talvez seja necessário ajustar seus requisitos e pesquisar novamente.

Essa chamada de API recupera as ofertas do plano de treinamento que melhor atendem às suas necessidades de capacidade. Cada resposta [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TrainingPlanOffering.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TrainingPlanOffering.html) exibida é identificada por um ID de oferta exclusivo. A primeira oferta da lista representa a melhor opção para suas necessidades. Se nenhum plano de treinamento adequado estiver disponível nas datas especificadas, a lista estará vazia. Ajuste seus critérios de pesquisa e procure um novo conjunto de ofertas.
+ As durações das reservas estão disponíveis em incrementos de 1 dia, de 1 a 182 dias.
+ As opções de quantidade de instâncias de reserva são 1, 2, 4, 8, 16, 32 ou 64 instâncias.

Para saber mais sobre a lista de instâncias disponíveis suportadas pelos planos de SageMaker treinamento, consulte[Tipos de instância Regiões da AWS e preços suportados](reserve-capacity-with-training-plans.md#training-plans-supported-instances-and-regions).

O exemplo a seguir usa um AWS CLI comando para solicitar ofertas de planos de treinamento com informações específicas sobre tipo de instância, contagem e horário.

```
# List training plan offerings with instance type, instance count, duration in hours, start time after, and end time before.
aws sagemaker search-training-plan-offerings \
--target-resources "training-job" \
--instance-type "ml.p4d.24xlarge" \
--instance-count 1 \
--duration-hours 15 \
--start-time-after "1737484800"
--end-time-before "1737657600"
```

Este documento JSON é um exemplo de resposta da API de planos de SageMaker treinamento. A resposta fornece informações sobre várias ofertas de planos de treinamento disponíveis que atendem aos requisitos de capacidade especificados. Inclui três ofertas distintas com durações, taxas iniciais e start/end horários variados, todas usando o mesmo tipo de instância e visando trabalhos de treinamento.

```
{
    "TrainingPlanOfferings": [
        {
            "TrainingPlanOfferingId": "tpo-SHA-256-hash-value",
            "TargetResources": [
                "training-job"
            ],
            "RequestedStartTimeAfter": "2025-01-21T11:08:27.704000-08:00",
            "DurationHours": 15,
            "DurationMinutes": 51,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD",
            "ReservedCapacityOfferings": [
                {
                    "InstanceType": "ml.p4d.24xlarge",
                    "InstanceCount": 1,
                    "AvailabilityZone": "us-west-2a",
                    "DurationHours": 15,
                    "DurationMinutes": 51,
                    "StartTime": "2025-01-21T11:39:00-08:00",
                    "EndTime": "2025-01-22T03:30:00-08:00"
                }
            ]
        },
        {
            "TrainingPlanOfferingId": "tpo-SHA-256-hash-value",
            "TargetResources": [
                "training-job"
            ],
            "RequestedStartTimeAfter": "2025-01-21T11:08:27.704000-08:00",
            "DurationHours": 39,
            "DurationMinutes": 51,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD",
            "ReservedCapacityOfferings": [
                {
                    "InstanceType": "ml.p4d.24xlarge",
                    "InstanceCount": 1,
                    "AvailabilityZone": "us-west-2a",
                    "DurationHours": 39,
                    "DurationMinutes": 51,
                    "StartTime": "2025-01-21T11:39:00-08:00",
                    "EndTime": "2025-01-23T03:30:00-08:00"
                }
            ]
        },
        {
            "TrainingPlanOfferingId": "tpo-SHA-256-hash-value",
            "TargetResources": [
                "training-job"
            ],
            "RequestedStartTimeAfter": "2025-01-21T11:08:27.704000-08:00",
            "DurationHours": 24,
            "DurationMinutes": 0,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD",
            "ReservedCapacityOfferings": [
                {
                    "InstanceType": "ml.p4d.24xlarge",
                    "InstanceCount": 1,
                    "AvailabilityZone": "us-west-2a",
                    "DurationHours": 24,
                    "DurationMinutes": 0,
                    "StartTime": "2025-01-22T03:30:00-08:00",
                    "EndTime": "2025-01-23T03:30:00-08:00"
                }
            ]
        }
    ]
}
```

A seguir está um exemplo de comando de como usar o AWS CLI para pesquisar ofertas de planos de treinamento que UltraServers incluam.

```
aws sagemaker search-training-plan-offerings \
--ultra-server-type ml.c6i-32xlargesc \
--ultra-server-count 1 \
--duration-hours 24 \
--target-resources hyperpod-cluster
--start-time-after "1737484800" \
--end-time-before "1737657600"
```

```
{
    "TrainingPlanOfferings": [
        {
            "TrainingPlanOfferingId": "tpo-SHA-256-hash-value",
            "TargetResources": [
                "training-job"
            ],
            "RequestedStartTimeAfter": "2025-07-21T16:59:25.760000+00:00",
            "DurationHours": 24,
            "DurationMinutes": 0,
            "UpfrontFee": "0.24",
            "CurrencyCode": "USD",
            "ReservedCapacityOfferings": [
                {
                    "ReservedCapacityType": "UltraServer",
                    "UltraServerType": "ml.u-p6e-gb200x72",
                    "UltraServerCount": 1,
                    "InstanceType": "ml.p6e-gb200.36xlarge",
                    "InstanceCount": 18,
                    "AvailabilityZone": "us-east-2a",
                    "DurationHours": 24,
                    "DurationMinutes": 0,
                    "StartTime": "2025-07-22T11:30:00+00:00",
                    "EndTime": "2025-07-23T11:30:00+00:00"
                }
            ]
        }
    ]
}
```

As seções a seguir definem os parâmetros de solicitação de entrada obrigatórios e opcionais para a operação de API `SearchTrainingPlanOfferings`.

## Parâmetros necessários
<a name="search-training-plan-options-required-params"></a>

Ao chamar a API [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html) para listar ofertas de plano de treinamento que atendam aos seus requisitos, você deve fornecer os seguintes valores:
+ `TargetResources`: os recursos de destino (`training-job` ou `hyperpod-cluster`) para os quais o plano será usado. O valor padrão é `training-job`. Os planos de treinamento são específicos para seus recursos de destino.
  + Um plano de treinamento projetado para trabalhos de SageMaker treinamento só pode ser usado para agendar e executar trabalhos de treinamento.
  + Um plano de treinamento para HyperPod clusters pode ser usado exclusivamente para fornecer recursos computacionais ao grupo de instâncias de um cluster.
+ `InstanceType`: o tipo de instância a ser provisionada. O `InstanceType` deve ser de um tipo compatível. 

  Para saber mais sobre a lista de instâncias disponíveis suportadas pelos planos de SageMaker treinamento, consulte[Tipos de instância Regiões da AWS e preços suportados](reserve-capacity-with-training-plans.md#training-plans-supported-instances-and-regions).
+ `InstanceCount`: o número de instâncias a serem provisionadas. Se o número de instâncias for maior que 1, deve ser uma potência de 2.
+ `DurationHour`: a duração total em horas do plano solicitado. `DurationHour` é arredondado para o próximo múltiplo de 24.

## Parâmetros opcionais
<a name="search-training-plan-options-optional-params"></a>

As seções a seguir fornecem detalhes de alguns parâmetros opcionais que você pode passar para a solicitação de API `SearchTrainingPlanOfferings`.
+ `StartTimeAfter`: especifique a hora de início solicitada do plano. `StartTimeAfter` deve ser um `timestamp` ou um valor `ISO 8601 date/time` no futuro.
+ `EndTimeBefore`: especifique a hora de término solicitada do plano no formato `timestamp` ou `ISO 8601 date/time`. `EndTimeBefore` deve ser pelo menos 24 horas após a hora de início.
+ `UltraServerType`: especifique o tipo UltraServer de pesquisa. Para obter mais informações sobre UltraServers, consulte[UltraServers em SageMaker IA](reserve-capacity-with-training-plans.md#training-plans-ultraservers).
+ `UltraServerCount`: especifique o número de UltraServers para pesquisar.

# Reservar o melhor plano de treinamento
<a name="choose-best-training-plan-using-api-cli-sdk"></a>

Depois de analisar as ofertas de plano de treinamento disponíveis que melhor atendem às suas necessidades, você pode reservar um plano específico chamando a operação de API [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html). Quando criado, a princípio o plano entra em um estado `Pending` e permanece nele até que o processo de reserva seja concluído. A resposta à chamada de API exibirá o nome do recurso da Amazon (ARN) do plano de treinamento. Anote esse ARN para fins de rastreamento e monitoramento posteriores. A reserva do plano de treinamento é preenchida de forma assíncrona no backend. O pagamento do valor total é cobrado como parte do processo de atendimento. Depois que a transação de pagamento é concluída e as capacidades reservadas solicitadas são garantidas, o plano de treinamento é definido com o estado `Scheduled` e está pronto para ser agendado.

**Importante**  
Os planos de treinamento não podem ser modificados após a compra.
Os planos de treinamento não podem ser compartilhados entre AWS contas ou dentro AWS da sua organização.

O exemplo a seguir usa o AWS CLI comando an para solicitar um plano de treinamento específico, passando o ID do plano como parâmetro.

```
aws sagemaker create-training-plan \
--training-plan-offering-id "tpo-SHA-256-hash-value" \
--training-plan-name "name" \
```

Este documento JSON é um exemplo de resposta da API de planos de SageMaker treinamento. A resposta contém o nome do recurso da Amazon (ARN) do plano de treinamento que foi criado com êxito.

**nota**  
O plano de treinamento permanece no status `Pending` até que o processo de atendimento seja concluído.

```
{
   "TrainingPlanArn":"arn:aws:sagemaker:us-east-1:123456789123:training-plan/large-models-fine-tuning"
}
```

As seções a seguir definem os parâmetros de solicitação de entrada obrigatórios e opcionais para a operação de API [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html).

## Parâmetros necessários
<a name="choose-best-training-plan-using-api-cli-sdk-required-params"></a>

Ao chamar a API [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingPlan.html) para reservar um plano de treinamento específico, você deve fornecer os seguintes valores:
+ `TrainingPlanOfferingId`: o ID do plano que você está escolhendo. Você pode recuperar o ID de uma oferta de plano na resposta da chamada de API `SearchTrainingPlanOfferings`. O formato deve começar com `pto-*`.
+ `TrainingPlanName`: o nome do plano que você está criando. 

# Listar as tarefas de treinamento
<a name="list-training-plans-using-api-cli-sdk"></a>

Você pode listar todos os planos de treinamento que foram criados em sua AWS conta e região chamando a [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ListTrainingPlans.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ListTrainingPlans.html)API.

O exemplo a seguir usa um AWS CLI comando para recuperar a lista dos seus planos de treinamento.

```
aws sagemaker list-training-plans \
--start-time-after "2024-09-26T00:00:01.000Z"
```

Este documento JSON é um exemplo de resposta da API de planos de SageMaker treinamento. A resposta fornece detalhes sobre um plano de treinamento que foi criado e reservado com êxito.

```
{
   "[TrainingPlanSummaries](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TrainingPlanSummary.html)": [ 
      { 
         "AvailableInstanceCount": 2,
         "CurrencyCode": "USD",
         "DurationHours": 48,
         "DurationMinutes": 0,
         "EndTime": "2024-09-28T04:30:00-07:00",
         "InUseInstanceCount": 2,
         "[ReservedCapacitySummaries](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ReservedCapacitySummary.html)": [ 
            { 
               "AvailabilityZone": "string",
               "DurationHours": 48,
               "DurationMinutes": 0,
               "EndTime": "2024-09-28T04:30:00-07:00",
               "InstanceType": "ml.p5.48xlarge",
               "ReservedCapacityArn": "arn:aws:sagemaker:us-east-1:123456789123:reserved-capacity/large-models-fine-tuning-rc1",
               "StartTime": "2024-09-26T04:30:00-07:00",
               "Status": "Scheduled",
               "TotalInstanceCount": 4,
               "UltraServerCount": 4,
               "UltraServerType": "ml.p6e-gb200.36xlarge"
            }
         ],
         "StartTime": "2024-09-26T04:30:00-07:00",
         "Status": "Scheduled",
         "StatusMessage": "Payment confirmed, training plan scheduled."
         "TargetResources": [ "training-job" ],
         "TotalInstanceCount": 4,
         "TotalUltraServerCount": 4,
         "TrainingPlanArn": "arn:aws:sagemaker:us-east-1:123456789123:training-plan/large-models-fine-tuning",
         "TrainingPlanName": "large-models-fine-tuning",
         "UpfrontFee": "xxxx.xx"
      }
   ]
}
```

As seções a seguir fornecem detalhes de alguns parâmetros opcionais que você pode passar para solicitação de API `ListTrainingPlans`.

## Parâmetros opcionais
<a name="list-training-plans-optional-params"></a>

As seções a seguir fornecem detalhes de alguns parâmetros opcionais que você pode passar para a solicitação de API `ListTrainingPlans`.
+ `StartTimeAfter`: a hora de início do intervalo de tempo real dos planos listados, especificada como `timestamp` ou `ISO 8601 date/time`. 
+ `StartTimeBefore`: a hora de término do intervalo de tempo real dos planos listados, especificada como `timestamp` ou `ISO 8601 date/time`. 
+ `Filters`: Critérios usados para filtrar os resultados, com até 5 pares nome-valor em que “Nome” é o nome de um campo de a [TrainingPlanSummary](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TrainingPlanSummary.html)e “Valor” é o valor a ser considerado para o filtro. Por exemplo, `Name=Status,Value=Active`.

O exemplo a seguir usa um AWS CLI comando para recuperar sua lista de planos de treinamento, usando alguns dos parâmetros opcionais descritos acima.

```
aws sagemaker list-training-plans --max-results 10 --sort-by StartTime --sort-order Descending --start-time-after 13000000 --filters Name=Status,Value=Active
```

# Visualizar detalhes do plano de treinamento
<a name="training-plan-details-using-api-cli-sdk"></a>

Para monitorar o status ou recuperar detalhes de um plano de treinamento, você pode usar a API [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlan.html). A resposta da API inclui um campo `Status` que mostra o estado atual do plano de treinamento:
+ Se a compra do plano falhar, o status será definido como `Failed`.
+ Após o pagamento bem-sucedido, o status muda de `Pending` para `Scheduled`, com base na data de início do plano. 
+ Quando o plano atinge a data de início, o status muda para `Active`.
+ Para planos com várias capacidades reservadas descontínuas, o status reverte para `Scheduled` entre os períodos ativos, até a data de início da próxima capacidade reservada. 
+ Após a data de término do plano, o status passa a ser `Expired`.

Quando o status for`Scheduled`, você poderá utilizar a capacidade reservada no plano para seus trabalhos de SageMaker treinamento ou cargas de trabalho de HyperPod cluster.

**nota**  
As tarefas de treinamento associadas ao plano permanecem no status `Pending` até que o plano se torne `Active`. 
Para HyperPod clusters que usam um plano de treinamento para capacidade computacional, o status do grupo de instâncias aparece como `InService` uma vez criado. 

O exemplo a seguir usa um AWS CLI comando para recuperar os detalhes de um plano de treinamento pelo nome.

```
aws sagemaker describe-training-plan \
--training-plan-name "name"
```

Este documento JSON é um exemplo de resposta da API de planos de SageMaker treinamento. Essa resposta fornece detalhes sobre um plano de treinamento que foi criado com êxito.

```
      { 
         "AvailableInstanceCount": 2,
         "CurrencyCode": "USD",
         "DurationHours": 48,
         "DurationMinutes": 0,
         "EndTime": "2024-09-28T04:30:00-07:00",
         "InUseInstanceCount": 2,
         "[ReservedCapacitySummaries](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ReservedCapacitySummary.html)": [ 
            { 
               "AvailabilityZone": "string",
               "DurationHours": 48,
               "DurationMinutes": 0,
               "EndTime": "2024-09-28T04:30:00-07:00",
               "InstanceType": "ml.p5.48xlarge",
               "ReservedCapacityArn": "arn:aws:sagemaker:us-east-1:123456789123:reserved-capacity/large-models-fine-tuning-rc1",
               "StartTime": "2024-09-26T04:30:00-07:00",
               "Status": "Scheduled",
               "TotalInstanceCount": 4,
               "UltraServerCount": 4,
               "UltraServerType": "ml.p6e-gb200.36xlarge"
            }
         ],
         "StartTime": "2024-09-26T04:30:00-07:00",
         "Status": "Scheduled",
         "StatusMessage": "Payment confirmed, training plan scheduled."
         "TargetResources": [ "training-job" ],
         "TotalInstanceCount": 4,
         "TotalUltraServerCount": 4,
         "TrainingPlanArn": "arn:aws:sagemaker:us-east-1:123456789123:training-plan/large-models-fine-tuning",
         "TrainingPlanName": "large-models-fine-tuning",
         "UpfrontFee": "xxxx.xx"
      }
```

As seções a seguir definem o parâmetro de solicitação de entrada obrigatório para a operação de API `DescribeTrainingPlan`.

## Parâmetros necessários
<a name="training-plan-details-required-params"></a>
+ `TrainingPlanName`: o nome do plano de treinamento que você deseja descrever.

# Extensão dos planos de treinamento
<a name="training-plan-extension"></a>

SageMaker os planos de treinamento permitem que você estenda seus planos de treinamento existentes para evitar interrupções na carga de trabalho. Quando um plano de treinamento está prestes a expirar, você pode estendê-lo diretamente por meio do console de SageMaker IA ou programaticamente usando a API ou. AWS CLI Isso elimina a necessidade de criar um novo plano e reconfigurar sua carga de trabalho com um novo ARN do plano de treinamento.

Com as extensões do plano de treinamento, seus trabalhos ou SageMaker HyperPod grupos de SageMaker treinamento em execução continuam funcionando perfeitamente, sem interrupção, uma vez que o plano é estendido. O plano estendido reflete a nova data de término e você pode recuperar o histórico de todas as extensões do seu plano de treinamento.

**Importante**  
Observe que as extensões não podem ser canceladas ou modificadas para adicionar ou remover instâncias.

## Recursos principais do
<a name="training-plan-extension-features"></a>
+ Estenda os planos de treinamento por meio do console ou da API
+ Estenda os planos em incrementos de 1 dia até 14 dias ou incrementos de 7 dias até 182 dias
+ Estenda um plano várias vezes
+ Visualize/liste o histórico de extensões de seus planos de treinamento no console ou por meio da API
+ Continuação perfeita da execução de cargas de trabalho em SageMaker IA sem reconfiguração

## Pré-requisitos
<a name="training-plan-extension-prerequisites"></a>

Antes de estender um plano de treinamento, certifique-se do seguinte:
+ O plano de treinamento deve ter um status de `Active` ou`Scheduled`.
+ O plano não deve ter nenhuma extensão de `Payment Pending` status.
+ As extensões podem ser solicitadas até no mínimo 1 hora ou no máximo 56 dias antes da expiração do plano.

**Topics**
+ [Recursos principais do](#training-plan-extension-features)
+ [Pré-requisitos](#training-plan-extension-prerequisites)
+ [Estenda um plano de treinamento usando o console de SageMaker IA](training-plan-extension-using-console.md)
+ [Estenda um plano de treinamento usando a SageMaker API ou AWS CLI](training-plan-extension-using-api-cli-sdk.md)

# Estenda um plano de treinamento usando o console de SageMaker IA
<a name="training-plan-extension-using-console"></a>

SageMaker os planos de treinamento oferecem uma maneira conveniente de ampliar seus planos de treinamento existentes por meio da interface do console de SageMaker IA. Este guia explica o processo de extensão de um plano de treinamento para trabalhos e SageMaker HyperPod clusters de SageMaker treinamento usando o console de SageMaker IA.

Para estender um plano de treinamento usando o console:

1. Navegue até o console de SageMaker IA em [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Escolha **Planos de treinamento** no painel de navegação esquerdo.

1. Selecione o plano de treinamento que você deseja estender na lista.

1. Escolha o botão **Estender**.

1. Insira a data de término desejada para sua extensão e escolha **Pesquisar** para encontrar as ofertas de extensão disponíveis.

1. Analise a lista de ofertas de extensão, que inclui detalhes como duração, zona de disponibilidade, taxa inicial e horários de início e término.

1. Selecione a oferta de extensão que melhor atenda às suas necessidades.

1. Revise os detalhes da extensão na caixa de diálogo de confirmação e escolha **Enviar** para confirmar sua compra.

Depois que a extensão é comprada, a data de término do plano de treinamento é atualizada para refletir a nova duração estendida.

## Exibir histórico de extensões
<a name="training-plan-extension-history-console"></a>

Para ver o histórico de extensões de um plano de treinamento:

1. Navegue até a página **Planos de treinamento** no console de SageMaker IA.

1. Selecione o plano de treinamento que você deseja visualizar.

1. Na página de detalhes do plano de treinamento, consulte a seção **Extensões** para ver todas as extensões anteriores, incluindo ID da oferta da extensão, datas de início e término, status e quando a extensão foi criada.

## Valores de status da extensão
<a name="training-plan-extension-status-values-console"></a>

As extensões podem ter os seguintes valores de status:
+ `Pending`: A extensão foi solicitada e está aguardando o processamento do pagamento.
+ `Active`: A extensão foi comprada com sucesso e está ativa.
+ `Scheduled`: a extensão está programada para começar futuramente.
+ `Failed`: a compra da extensão falhou (por exemplo, devido a problemas de pagamento).
+ `Expired`: O período de extensão terminou.

# Estenda um plano de treinamento usando a SageMaker API ou AWS CLI
<a name="training-plan-extension-using-api-cli-sdk"></a>

SageMaker os planos de treinamento oferecem suporte à extensão programática dos planos de treinamento por meio de sua API. Você pode interagir com a API de planos de treinamento usando o AWS CLI ou SageMaker SDKs.

A extensão do plano de treinamento envolve as seguintes ações de API:
+ **`SearchTrainingPlanOfferings`:** pesquise as ofertas de extensão disponíveis especificando o ARN do seu plano de treinamento e a duração da extensão desejada. A API retorna ofertas de extensão em `TrainingPlanExtensionOfferings` campo.
+ **`ExtendTrainingPlan`:** Adquira uma oferta de extensão específica para ampliar seu plano de treinamento fornecendo `TrainingPlanExtensionOfferingId` o. Isso reserva a capacidade computacional adicional e atualiza a data de término do seu plano de treinamento.
+ **`DescribeTrainingPlanExtensionHistory`:** veja o histórico completo de extensões de um plano de treinamento, incluindo todas as extensões anteriores com status, datas e informações de pagamento.

**Topics**
+ [Pesquise ofertas de extensão](search-extension-offerings-api-cli-sdk.md)
+ [Compre uma extensão](extend-training-plan-api-cli-sdk.md)
+ [Exibir histórico de extensões](describe-extension-history-api-cli-sdk.md)

# Pesquise ofertas de extensão
<a name="search-extension-offerings-api-cli-sdk"></a>

Use a [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html)API com o `TrainingPlanArn` parâmetro para encontrar ofertas de extensão disponíveis para seu plano de treinamento.

O exemplo a seguir usa um AWS CLI comando para pesquisar ofertas de extensão para um plano de treinamento existente.

```
aws sagemaker search-training-plan-offerings \
--training-plan-arn "arn:aws:sagemaker:us-east-2:123456789012:training-plan/my-training-plan" \
--duration-hours 48
```

Este documento JSON é um exemplo de resposta da API de planos de SageMaker treinamento. A resposta inclui `TrainingPlanExtensionOfferings` conter as ofertas de extensão disponíveis para o plano de treinamento especificado.

```
{
    "TrainingPlanOfferings": [],
    "TrainingPlanExtensionOfferings": [
        {
            "TrainingPlanExtensionOfferingId": "tpeo-SHA-256-hash-value",
            "AvailabilityZone": "us-east-2a",
            "StartDate": "2025-09-23T12:00:00Z",
            "EndDate": "2025-09-25T12:00:00Z",
            "DurationHours": 48,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD"
        }
    ]
}
```

As seções a seguir definem os parâmetros de solicitação de entrada obrigatórios e opcionais para a operação da `SearchTrainingPlanOfferings` API ao pesquisar ofertas de extensão.

## Parâmetros necessários
<a name="search-extension-offerings-required-params"></a>

Ao chamar a [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_SearchTrainingPlanOfferings.html)API para pesquisar ofertas de extensão, você deve fornecer o seguinte valor:
+ `TrainingPlanArn`: O do plano de treinamento que você deseja estender. Eles `TrainingPlanArn` devem fazer referência a um plano de treinamento existente com um status de `Active` ou`Scheduled`.

## Parâmetros opcionais
<a name="search-extension-offerings-optional-params"></a>

As seções a seguir fornecem detalhes sobre alguns parâmetros opcionais que você pode passar para sua solicitação de `SearchTrainingPlanOfferings` API ao pesquisar ofertas de extensão.
+ `DurationHours`: A duração desejada em horas para a extensão. `DurationHours` é arredondado para o próximo múltiplo de 24.

# Compre uma extensão
<a name="extend-training-plan-api-cli-sdk"></a>

Depois de selecionar uma oferta de extensão, use a [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html)API para comprar a extensão.

O exemplo a seguir usa um AWS CLI comando para estender um plano de treinamento.

```
aws sagemaker extend-training-plan \
--training-plan-extension-offering-id "tpeo-SHA-256-hash-value"
```

Este documento JSON é um exemplo de resposta da API de planos de SageMaker treinamento. A resposta inclui a lista de extensões do plano de treinamento.

```
{
    "TrainingPlanExtensions": [
        {
            "TrainingPlanExtensionOfferingId": "tpeo-SHA-256-hash-value",
            "ExtendedAt": "2025-09-17T10:00:00Z",
            "StartDate": "2025-09-23T12:00:00Z",
            "EndDate": "2025-09-25T12:00:00Z",
            "Status": "Pending",
            "PaymentStatus": "Pending",
            "AvailabilityZone": "us-east-2a",
            "DurationHours": 48,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD"
        }
    ]
}
```

A seção a seguir define o parâmetro de solicitação de entrada obrigatório para a operação `ExtendTrainingPlan` da API.

## Parâmetros necessários
<a name="extend-training-plan-required-params"></a>

Ao chamar a [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ExtendTrainingPlan.html)API para estender um plano de treinamento, você deve fornecer o seguinte valor:
+ `TrainingPlanExtensionOfferingId`: o ID da oferta de extensão que você está comprando. Você pode recuperar esse ID `TrainingPlanExtensionOfferings` na resposta da sua chamada de `SearchTrainingPlanOfferings` API. O formato deve começar com `tpeo-*`.

# Exibir histórico de extensões
<a name="describe-extension-history-api-cli-sdk"></a>

Use a [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html)API para ver o histórico completo de extensões de um plano de treinamento.

O exemplo a seguir usa um AWS CLI comando para recuperar o histórico da extensão.

```
aws sagemaker describe-training-plan-extension-history \
--training-plan-arn "arn:aws:sagemaker:us-east-2:123456789012:training-plan/my-training-plan"
```

Este documento JSON é um exemplo de resposta da API de planos de SageMaker treinamento. A resposta inclui uma lista paginada de todas as extensões do plano de treinamento.

```
{
    "TrainingPlanExtensions": [
        {
            "TrainingPlanExtensionOfferingId": "tpeo-SHA-256-hash-value",
            "ExtendedAt": "2025-09-17T10:00:00Z",
            "StartDate": "2025-09-23T12:00:00Z",
            "EndDate": "2025-09-25T12:00:00Z",
            "Status": "Active",
            "PaymentStatus": "Completed",
            "AvailabilityZone": "us-east-2a",
            "DurationHours": 48,
            "UpfrontFee": "xxxx.xx",
            "CurrencyCode": "USD"
        }
    ],
    "NextToken": null
}
```

As seções a seguir definem os parâmetros de solicitação de entrada obrigatórios e opcionais para a operação de API `DescribeTrainingPlanExtensionHistory`.

## Parâmetros necessários
<a name="describe-extension-history-required-params"></a>

Ao chamar a [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlanExtensionHistory.html)API, você deve fornecer o seguinte valor:
+ `TrainingPlanArn`: O do plano de treinamento para o qual recuperar o histórico de extensões.

## Parâmetros opcionais
<a name="describe-extension-history-optional-params"></a>

As seções a seguir fornecem detalhes de alguns parâmetros opcionais que você pode passar para a solicitação de API `DescribeTrainingPlanExtensionHistory`.
+ `NextToken`: se a resposta anterior tiver sido truncada, você receberá esse token. Use-o em sua próxima solicitação para receber o próximo conjunto de resultados.
+ `MaxResults`: o número máximo de extensões a serem retornadas na resposta.

## Valores de status da extensão
<a name="extension-status-values-api"></a>

As extensões podem ter os seguintes valores de status:
+ `Pending`: A extensão foi solicitada e está aguardando o processamento do pagamento.
+ `Active`: A extensão foi comprada com sucesso e está ativa.
+ `Scheduled`: a extensão está programada para começar futuramente.
+ `Failed`: a compra da extensão falhou (por exemplo, devido a problemas de pagamento).
+ `Expired`: O período de extensão terminou.

# Utilização de planos de SageMaker treinamento para trabalhos de treinamento
<a name="training-plan-utilization-for-training-jobs"></a>

Você pode usar um plano de SageMaker treinamento para seus trabalhos de treinamento especificando o plano de sua escolha ao criar um trabalho de treinamento.

**nota**  
O plano de treinamento deve estar no status `Scheduled` ou `Active` para ser usado por uma tarefa de treinamento.

Se a capacidade necessária não estiver imediatamente disponível para uma tarefa de treinamento, a tarefa aguardará até que haja capacidade disponível, ou até que `StoppingCondition` seja atingida, ou a tarefa ficará no status de capacidade `Pending` por dois dias, o que ocorrer primeiro. Se a condição de interrupção for atendida, a tarefa será interrompida. Se uma tarefa ficar pendente por dois dias, ela será encerrada com um`InsufficientCapacityError`.

**Importante**  
**Processo de encerramento da capacidade reservada:** você tem acesso total a todas as instâncias reservadas até 30 minutos antes do horário de término da capacidade reservada. Quando restam 30 minutos em sua capacidade reservada, os planos de SageMaker treinamento iniciam o processo de encerramento de todas as instâncias em execução dentro dessa capacidade reservada.  
Para garantir que você não perca o progresso do treinamento devido a esses encerramentos, recomendamos verificar suas tarefas de treinamento.

## Implementar um ponto de verificação na tarefa de treinamento
<a name="training-jobs-checkpointing"></a>

Ao usar planos SageMaker de treinamento para seus trabalhos SageMaker de treinamento, certifique-se de implementar o checkpoint em seu script de treinamento. Isso permite que você salve o progresso de seu treinamento antes que a capacidade reservada expire. A verificação é especialmente importante ao trabalhar com capacidades reservadas, pois permite que você retome o treinamento a partir do último ponto salvo se seu trabalho for interrompido entre duas capacidades reservadas ou quando seu plano de treinamento atinge a data de término.

Para isso, é possível usar a variável de ambiente `SAGEMAKER_CURRENT_CAPACITY_BLOCK_EXPIRATION_TIMESTAMP`. Essa variável ajuda a determinar quando iniciar o processo de verificação. Ao incorporar essa lógica em seu script de treinamento, você garante que o progresso do modelo seja salvo em intervalos apropriados.

Veja aqui um exemplo de como você pode implementar essa lógica de ponto de verificação em seu script de treinamento do Python:

```
import os
import time
from datetime import datetime, timedelta

def is_close_to_expiration(threshold_minutes=30):
    # Retrieve the expiration timestamp from the environment variable
    expiration_time_str = os.environ.get('SAGEMAKER_CURRENT_CAPACITY_BLOCK_EXPIRATION_TIMESTAMP', '0')
    
    # If the timestamp is not set (default '0'), return False
    if expiration_time_str == '0':
        return False
    
    # Convert the timestamp string (in milliseconds) to a datetime object
    expiration_time = datetime(1970, 1, 1) + timedelta(milliseconds=int(expiration_time_str))
    
    # Calculate the time difference between now and the expiration time
    time_difference = expiration_time - datetime.now()
    
    # Return True if we're within the threshold time of expiration
    return time_difference < timedelta(minutes=threshold_minutes)

def start_checkpointing():
    # Placeholder function for checkpointing logic
    print("Starting checkpointing process...")
    # TODO: Implement actual checkpointing logic here
    # For example:
    # - Save model state
    # - Save optimizer state
    # - Save current epoch and iteration numbers
    # - Save any other relevant training state

# Main training loop
num_epochs = 100
final_checkpointing_done = False
for epoch in range(num_epochs):
    # TODO: Replace this with your actual training code
    # For example:
    # - Load a batch of data
    # - Forward pass
    # - Calculate loss
    # - Backward pass
    # - Update model parameters
    
    # Check if we're close to capacity expiration and haven't done final checkpointing
    if not final_checkpointing_done and is_close_to_expiration():
        start_checkpointing()
        final_checkpointing_done = True
    
    # Simulate some training time (remove this in actual implementation)
    time.sleep(1)
print("Training completed.")
```

**nota**  
O provisionamento do trabalho de treinamento segue uma ordem First-In-First-Out (FIFO), mas um trabalho de cluster menor criado posteriormente pode receber capacidade antes de um trabalho de cluster maior criado anteriormente, se o trabalho maior não puder ser realizado.
SageMaker a piscina aquecida gerenciada por treinamento é compatível com os planos de SageMaker treinamento. Para reutilização do cluster, você deve fornecer valores de `TrainingPlanArn` idênticos nas solicitações `CreateTrainingJob` subsequentes para reutilizar o mesmo cluster.

**Topics**
+ [Implementar um ponto de verificação na tarefa de treinamento](#training-jobs-checkpointing)
+ [Crie um trabalho de treinamento usando o console de SageMaker IA](use-training-plan-for-training-jobs-using-console.md)
+ [Crie um trabalho de treinamento usando a API AWS CLI, SageMaker SDK](use-training-plan-for-training-jobs-using-api-cli-sdk.md)

# Crie um trabalho de treinamento usando o console de SageMaker IA
<a name="use-training-plan-for-training-jobs-using-console"></a>

Você pode usar planos de SageMaker treinamento para seus trabalhos de treinamento usando a SageMaker AI UI. Ao criar uma tarefa de treinamento, os planos disponíveis são sugeridos se sua escolha de instância e região corresponderem aos planos disponíveis.

Para criar um trabalho de treinamento usando a capacidade reservada de um plano de treinamento no SageMaker console:

1. Navegue até o console de SageMaker IA em [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. No painel de navegação à esquerda, selecione **Treinamento** e **Trabalhos de treinamento**.

1. Escolha **Criar tarefa de treinamento**.

1. Ao configurar os recursos para a tarefa de treinamento, procure a seção **Capacidade da instância**. Se houver planos disponíveis que correspondam ao tipo de instância e região escolhidos, eles serão exibidos aqui. Selecione um plano de treinamento que se alinhe às suas necessidades de capacidade computacional.

   Se nenhum plano adequado estiver disponível, você pode ajustar o tipo de instância ou a região ou continuar sem usar um plano de treinamento.

1. Depois de selecionar um plano de treinamento (ou optar por continuar sem um), conclua o restante da configuração da tarefa de treinamento e escolha **Criar tarefa de treinamento** para iniciar o processo.

![\[SageMaker Página do console de IA para criar um novo trabalho de treinamento. A página exibe várias opções de configuração, como definições de tarefa, opções de algoritmo, configuração de recursos, seleção de planos de treinamento e condições de interrupção.\]](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/images/training-plans/tp-create-training-job.png)


Analise e inicie o seu trabalho. Seu trabalho começa a ser executado assim que o plano de treinamento se torna `Active`, dependendo da capacidade.

# Crie um trabalho de treinamento usando a API AWS CLI, SageMaker SDK
<a name="use-training-plan-for-training-jobs-using-api-cli-sdk"></a>

Para usar planos de SageMaker treinamento em seu trabalho de SageMaker treinamento, especifique o `TrainingPlanArn` parâmetro do plano desejado `ResourceConfig` ao chamar a operação da [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html)API. Você pode usar exatamente um plano por tarefa.

**Importante**  
O campo `InstanceType` definido na seção `ResourceConfig` da solicitação `CreateTrainingJob` deve corresponder ao `InstanceType` do seu plano de treinamento.

## Executar uma tarefa de treinamento em um plano usando a CLI
<a name="training-job-cli"></a>

O exemplo a seguir demonstra como criar um trabalho de SageMaker treinamento e associá-lo a um plano de treinamento fornecido usando o `TrainingPlanArn` atributo no `create-training-job` AWS CLI comando. 

Para obter mais informações sobre como criar um trabalho de treinamento usando o AWS CLI [CreateTrainingJob](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html)comando, consulte [https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-training-job.html](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-training-job.html).

```
# Create a training job
aws sagemaker create-training-job \
  --training-job-name training-job-name \
  ...
    
  --resource-config '{
        "InstanceType": "ml.p5.48xlarge",
        "InstanceCount": 8,
        "VolumeSizeInGB": 10,
        "TrainingPlanArn": "training-plan-arn"
        }
    }' \
    ...
```

Este AWS CLI exemplo de comando cria um novo trabalho de treinamento em SageMaker IA, passando um plano de treinamento na `--resource-config` discussão.

```
aws sagemaker create-training-job \
  --training-job-name job-name \
  --role-arn arn:aws:iam::111122223333:role/DataAndAPIAccessRole \
  --algorithm-specification '{"TrainingInputMode": "File","TrainingImage": "111122223333.dkr.ecr.us-east-1.amazonaws.com/algo-image:tag", "ContainerArguments": [" "]}' \
  --input-data-config '[{"ChannelName":"training","DataSource":{"S3DataSource":{"S3DataType":"S3Prefix","S3Uri":"s3://bucketname/input","S3DataDistributionType":"ShardedByS3Key"}}}]' \
  --output-data-config '{"S3OutputPath": "s3://bucketname/output"}' \
  --resource-config '{"VolumeSizeInGB":10,"InstanceCount":4,"InstanceType":"ml.p5.48xlarge", "TrainingPlanArn" : "arn:aws:sagemaker:us-east-1:111122223333:training-plan/plan-name"}' \
  --stopping-condition '{"MaxRuntimeInSeconds": 1800}' \
  --region us-east-1
```

Depois de criar a tarefa de treinamento, você pode chamar a API `DescribeTrainingJob` para verificar se ela foi atribuída corretamente ao plano de treinamento.

```
aws sagemaker describe-training-job --training-job-name training-job-name
```

## Execute um trabalho de treinamento em um plano usando o SageMaker SDK AI Python
<a name="training-job-sdk"></a>

Como alternativa, você pode criar um trabalho de treinamento associado a um plano de treinamento usando o SDK do [SageMaker Python](https://sagemaker.readthedocs.io/en/stable/v2.html).

Se você estiver usando o SDK do SageMaker Python JupyterLab no Studio para criar um trabalho de treinamento, certifique-se de que a função de execução usada pelo espaço que executa seu JupyterLab aplicativo tenha as permissões necessárias para usar SageMaker os planos de treinamento. Para saber mais sobre as permissões necessárias para usar os planos de SageMaker treinamento, consulte[IAM para planos SageMaker de treinamento](training-plan-iam-permissions.md).

O exemplo a seguir demonstra como criar um trabalho de SageMaker treinamento e associá-lo a um plano de treinamento fornecido usando o `training_plan` atributo no `Estimator` objeto ao usar o SDK do SageMaker Python.

Para obter mais informações sobre o SageMaker Estimador, consulte [Usar um SageMaker estimador para executar um](https://docs.aws.amazon.com/sagemaker/latest/dg/docker-containers-adapt-your-own-private-registry-estimator.html) trabalho de treinamento.

```
import sagemaker
import boto3
from sagemaker import get_execution_role
from sagemaker.estimator import Estimator
from sagemaker.inputs import TrainingInput

# Set up the session and SageMaker client
session = boto3.Session()
region = session.region_name
sagemaker_session = session.client('sagemaker')

# Get the execution role for the training job
role = get_execution_role()

# Define the input data configuration
trainingInput = TrainingInput(
    s3_data='s3://input-path',
    distribution='ShardedByS3Key',
    s3_data_type='S3Prefix'
)

estimator = Estimator(
    entry_point='train.py',
    image_uri="123456789123.dkr.ecr.{}.amazonaws.com/image:tag",
    role=role,
    instance_count=4,
    instance_type='ml.p5.48xlarge',
    training_plan="training-plan-arn",
    volume_size=20,
    max_run=3600,
    sagemaker_session=sagemaker_session,
    output_path="s3://output-path"
)

# Create the training job
estimator.fit(inputs=trainingInput, job_name=job_name)
```

Depois de criar a tarefa de treinamento, você pode chamar a API `DescribeTrainingJob` para verificar se ela foi atribuída corretamente ao plano de treinamento.

```
# Check job details
sagemaker_session.describe_training_job(TrainingJobName=job_name)
```

# Utilização de planos de treinamento para clusters da Amazon SageMaker HyperPod
<a name="training-plan-utilization-for-hyperpod"></a>

Para usar planos de SageMaker treinamento para seu SageMaker HyperPod cluster Amazon, você especifica o plano de treinamento que deseja usar no nível da instância do cluster ao criar ou atualizar seu cluster. 

**nota**  
O plano de treinamento deve estar no `Active` status `Scheduled` ou para ser usado por um HyperPod cluster.
A configuração do cluster deve estar alinhada com a zona de disponibilidade (AZ) especificada em seu plano de treinamento.  
Para a configuração da VPC, localização dos recursos e configuração do grupo de segurança, consulte a [Configuração SageMaker HyperPod com uma Amazon VPC personalizada](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-vpc) SageMaker HyperPod documentação.  
Se estiver configurando HyperPod com o Amazon FSx for Lustre, saiba mais sobre a seleção de regiões e AZ, analise os requisitos de configuração de VPC e entenda as melhores práticas de alinhamento de AZ em. [(Opcional) Configurando SageMaker HyperPod com o Amazon FSx for Lustre](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-fsx)
Você pode selecionar um plano para cada um dos seus grupos de instâncias. No entanto, não recomendamos o uso de um plano de treinamento para o grupo de instâncias primárias de um cluster, pois os nós primários exigem recursos contínuos e estáveis que não se alinham à duração fixa e à natureza possivelmente descontínua das capacidades do plano de treinamento.

**Topics**
+ [Crie um SageMaker HyperPod cluster nos planos de treinamento usando o console de SageMaker IA](use-training-plan-for-hyperpod-creation-using-console.md)
+ [Atualize um SageMaker HyperPod cluster nos planos de treinamento usando o console de SageMaker IA](use-training-plan-for-hyperpod-update-using-console.md)
+ [Crie um SageMaker HyperPod cluster em planos de treinamento usando a SageMaker API ou AWS CLI](use-training-plan-for-hyperpod-creation-using-api-cli-sdk.md)
+ [Atualize um SageMaker HyperPod cluster nos planos de treinamento usando a SageMaker API ou AWS CLI](use-training-plan-for-hyperpod-update-using-api-cli-sdk.md)

# Crie um SageMaker HyperPod cluster nos planos de treinamento usando o console de SageMaker IA
<a name="use-training-plan-for-hyperpod-creation-using-console"></a>

Para criar um SageMaker HyperPod cluster usando planos de treinamento da interface do usuário do console de SageMaker IA, siga estas etapas:

1. Navegue até o console de SageMaker IA em [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. No painel de navegação à esquerda, selecione **Hyperpod** e escolha **Criar cluster**.

1. Ao configurar um grupo de instâncias, você pode selecionar um plano que se alinhe às suas necessidades de capacidade computacional.

![\[SageMaker Interface do console AI mostrando uma janela modal para criar um grupo de instâncias em um SageMaker HyperPod cluster. O formulário inclui campos para nome do grupo de instâncias, tipo de instância, quantidade, capacidade da instância (com opções para planos sob demanda e de treinamento) e um caminho de diretório para o script de ciclo de vida no momento da criação.\]](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/images/training-plans/tp-create-hyperpod-cluster.png)


Analise e crie o cluster. Os grupos de instâncias que usam um plano de treinamento têm a escala vertical aumentada até a contagem de instâncias pretendida quando o plano de treinamento se torna `Active`, se houver capacidade disponível. Trinta minutos antes do término de cada período de capacidade reservada, a escala do grupo de instâncias começa a ser reduzida verticalmente para zero instância. Esse estado de redução da escala vertical persiste até que o próximo período de capacidade reservada comece ou o plano termine. Durante todo esse processo, um grupo de instâncias íntegro mantém o status `InService` após sua criação inicial, independentemente da contagem atual de instâncias.

# Atualize um SageMaker HyperPod cluster nos planos de treinamento usando o console de SageMaker IA
<a name="use-training-plan-for-hyperpod-update-using-console"></a>

Você pode atualizar, remover ou adicionar um plano de treinamento a um SageMaker HyperPod cluster existente usando a interface de usuário do console de SageMaker IA. Para atualizar o grupo de instâncias de um SageMaker HyperPod cluster, siga estas etapas:

1. Navegue até o console de SageMaker IA em [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. No painel de navegação à esquerda, escolha **HyperPod**.

1. Navegue até a página de detalhes do cluster seguindo o hiperlink associado ao nome do cluster.

1. Ao configurar um grupo de instâncias, você pode atualizar o seu plano para que alinhe às suas necessidades de capacidade computacional.

![\[SageMaker Interface do console AI mostrando uma janela modal para atualizar um grupo de instâncias em um SageMaker HyperPod cluster. O formulário inclui campos para nome do grupo de instâncias, tipo de instância, quantidade, capacidade da instância (com opções para planos sob demanda e de treinamento) e um caminho de diretório para o script de ciclo de vida no momento da criação.\]](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/images/training-plans/tp-update-hyperpod-clusters.png)


Analise e atualize o cluster.

# Crie um SageMaker HyperPod cluster em planos de treinamento usando a SageMaker API ou AWS CLI
<a name="use-training-plan-for-hyperpod-creation-using-api-cli-sdk"></a>

Para usar planos de SageMaker treinamento para seu SageMaker HyperPod cluster da Amazon, especifique o ARN do plano de treinamento que você deseja usar no [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-TrainingPlanArn](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-TrainingPlanArn)parâmetro do [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html)ao chamar a operação da [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html)API. 

A sub-rede associada à AZ designada do seu plano deve estar incluída na `VPCConfig` da configuração do seu cluster. Você pode recuperar o `AvailabilityZone` de um plano de treinamento em resposta a uma chamada de [``DescribeTrainingPlan](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingPlan.html)API.

O exemplo a seguir ilustra como criar um novo SageMaker HyperPod cluster e fornecer a um grupo de instâncias um plano de treinamento no `--instance-groups` atributo do `create-cluster` AWS CLI comando. 

```
# Create a cluster         
aws sagemaker create-cluster \
  --cluster-name cluster-name \
  --instance-groups '[ \
        { \
            "InstanceCount": 1,\
            "InstanceGroupName": "controller-nodes",\
            "InstanceType": "ml.t3.xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
        },\
        { \
            "InstanceCount": 2, \
            "InstanceGroupName": "worker-nodes",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id}:role/execution_role}",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        }]'
```

Para obter informações sobre como criar um HyperPod cluster usando [https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-cluster.html](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-cluster.html)o. AWS CLI

Depois de criar o cluster, você pode verificar se foi atribuída capacidade adequada ao grupo de instâncias chamando a API `DescribeCluster`.

```
aws sagemaker describe-cluster --cluster-name cluster-name
```

# Atualize um SageMaker HyperPod cluster nos planos de treinamento usando a SageMaker API ou AWS CLI
<a name="use-training-plan-for-hyperpod-update-using-api-cli-sdk"></a>

Você pode adicionar, atualizar ou remover um plano de treinamento atualizando o grupo de instâncias de um cluster existente usando o `update-cluster` AWS CLI comando. O exemplo a seguir ilustra como atualizar um SageMaker HyperPod cluster e fornecer um novo plano de treinamento a um grupo de instâncias.

```
# Update a cluster
aws sagemaker update-cluster \
  --cluster-name cluster-name \
  --instance-groups '[ \
        { \
            "InstanceCount": 1,\
            "InstanceGroupName": "controller-nodes",\
            "InstanceType": "ml.t3.xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
        },\
        { \
            "InstanceCount": 2, \
            "InstanceGroupName": "worker-nodes",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id}:role/execution_role}",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        },\
        {\
            "InstanceCount": 1,\
            "InstanceGroupName": "worker-nodes-2",\
            "InstanceType": "p4d.24xlarge",\
            "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\
            "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\
            "ThreadsPerCore": 1,\
            "TrainingPlanArn": training_plan_arn,\
        }\
    ]'
```

# Veja as cotas dos planos de SageMaker treinamento usando o console AWS de gerenciamento
<a name="training-plan-quotas"></a>

**Importante**  
Para obter informações sobre preços sobre planos de SageMaker treinamento, consulte a página de [ SageMaker preços da Amazon](https://aws.amazon.com/sagemaker/pricing/). Navegue até a seção de **planos de treinamento SageMaker HyperPod flexíveis da Amazon** em **Preços sob demanda**. Escolha a região desejada para ver os tipos de instância disponíveis e os preços correspondentes.
Certifique-se de que seus trabalhos de treinamento ou cotas de HyperPod serviço permitam um número máximo de instâncias por tipo de instância que exceda o número de instâncias especificado em seu plano.

Você pode visualizar as cotas e os limites atuais dos planos de SageMaker treinamento usando o AWS Management Console. 

Para pesquisar um valor de cota específico:

1. Abra o [console do Service Quotas](https://console.aws.amazon.com/servicequotas/home/services/sagemaker/quotas).

1. No painel de navegação à esquerda, selecione **Serviços da AWS **.

1. Na lista de AWS serviços, pesquise e selecione **Amazon SageMaker AI**.

1. Na lista **de cotas de serviço**, você pode ver o nome da cota de serviço, o valor aplicado (se disponível), a cota AWS padrão e se o valor da cota é ajustável.

Para encontrar cotas específicas, você pode usar a barra de pesquisa na parte superior da lista **Cotas de serviço**. Digite o `Limit Name` da cota que você está procurando. Por exemplo, para encontrar a cota para o número de planos de treinamento por região, você digitaria **training-plan-total\$1count** na barra de pesquisa.

A tabela a seguir descreve os nomes dos limites de cota para planos de SageMaker treinamento.


**SageMaker limites de cota de planos de treinamento**  

| Nome do limite | Nome de exibição | 
| --- | --- | 
| training-plan-total\$1contar | Número de planos de treinamento por região | 
| reserved-capacity-ml-p4d-24xgrande | Número de instâncias ml.p4d.24xlarge em capacidade reservada entre planos de treinamento por região | 
| reserved-capacity-ml-p5-48 x grande | Número de instâncias ml.p5.48xlarge em capacidade reservada nos planos de treinamento por região | 
| reserved-capacity-ml-p5e-48xlarge | Número de instâncias ml.p5e.48xlarge em capacidade reservada nos planos de treinamento por região | 
| reserved-capacity-ml-p5 a 48 x grande | Número de instâncias ml.p5en.48xlarge em capacidade reservada nos planos de treinamento por região | 
| reserved-capacity-ml-trn1-32 x grande | Número de instâncias ml-trn1-32xlarge em capacidade reservada em todos os planos de treinamento por região | 
| reserved-capacity-ml-trn2 a 48 x grande | Número de instâncias ml.trn2.48xlarge em capacidade reservada nos planos de treinamento por região | 

Se você precisar de limites mais altos para seus planos de SageMaker treinamento, talvez seja possível solicitar um aumento de cota. A possibilidade de aumentar uma cota depende de ela ser ajustável, o que você pode ver no console do **Service Quotas**.

Para solicitar um aumento da cota:

1. Navegue até a cota específica no console do **Service Quotas**.

1. Se a cota for ajustável, você poderá solicitar um aumento de cota no nível da conta ou do recurso com base no valor listado na coluna **Ajustabilidade**.

1. Em **Alterar o valor da cota**, insira o novo valor. O novo valor deve ser maior que o valor atual.

1. Escolha **Solicitar**.

1. As solicitações de aumento de cota estão sujeitas à análise e aprovação por AWS. Para visualizar quaisquer solicitações pendentes ou resolvidas recentemente no console, navegue até a guia **Histórico de solicitações** na página de detalhes do serviço ou escolha **Painel no painel** de navegação. Para solicitações pendentes, escolha o status da solicitação para abrir o recibo da solicitação. O status inicial de uma solicitação é `Pending`. Depois que o status mudar para`Quota requested`, você verá o número do caso no AWS Support. Escolha o número do caso para abrir o tíquete de sua solicitação.

Para saber mais sobre como solicitar um aumento de cota, consulte [Solicitar um aumento de cota](https://docs.aws.amazon.com/servicequotas/latest/userguide/request-quota-increase.html) no *Guia do usuário do AWS Service Quotas*.

# Notas da versão
<a name="training-plan-release-notes"></a>

Consulte as notas de lançamento a seguir para acompanhar as atualizações mais recentes dos planos SageMaker de treinamento.

## Notas de lançamento dos planos de SageMaker treinamento da Amazon: 04 de dezembro de 2024
<a name="training-plan-release-notes-20241204"></a>

**Novos atributos**
+ Lançou os planos SageMaker de treinamento da Amazon no AWS re:Invent 2024.