

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# AWS Batch suporte para trabalhos de treinamento em SageMaker IA
<a name="training-job-queues"></a>

Uma [fila de trabalhos do AWS Batch](https://docs.aws.amazon.com/batch/latest/userguide/job_queues.html) armazena e prioriza os trabalhos enviados antes de serem executados em recursos de computação. Você pode enviar trabalhos de treinamento de SageMaker IA para uma fila de trabalhos para aproveitar as ferramentas de agendamento e priorização de tarefas sem servidor fornecidas pela. AWS Batch

## Como funciona
<a name="training-job-queues-how-it-works"></a>

As etapas a seguir descrevem o fluxo de trabalho de como usar uma AWS Batch fila de trabalhos com trabalhos de treinamento de SageMaker IA. Para ver tutoriais mais detalhados e exemplos de caderno, consulte a seção [Conceitos básicos](#training-job-queues-get-started).
+ Configuração AWS Batch e todas as permissões necessárias. Para obter mais informações, consulte [Configurar o AWS Batch](https://docs.aws.amazon.com/batch/latest/userguide/get-set-up-for-aws-batch.html) no *Manual do usuário do AWS Batch *.
+ Crie os seguintes AWS Batch recursos no console ou usando o AWS CLI:
  + [Ambiente de serviço](https://docs.aws.amazon.com/batch/latest/userguide/service-environments.html) — contém parâmetros de configuração para integração com a SageMaker IA.
  + [SageMaker Fila de trabalhos de treinamento de IA](https://docs.aws.amazon.com/batch/latest/userguide/create-sagemaker-job-queue.html) — integra-se à SageMaker IA para enviar trabalhos de treinamento.
+ Configure seus detalhes e solicite um trabalho de treinamento de SageMaker IA, como a imagem do contêiner de treinamento. Para enviar um trabalho de treinamento para uma AWS Batch fila, você pode usar o AWS CLI, o ou o AWS SDK para Python (Boto3) SageMaker AI Python SDK.
+ Envie suas tarefas de treinamento à fila de trabalhos. É possível usar as seguintes opções para enviar tarefas:
  + Use a API do AWS Batch [SubmitServiceJob](https://docs.aws.amazon.com/batch/latest/APIReference/API_SubmitServiceJob.html).
  + Use o [`aws_batch`módulo](https://github.com/aws/sagemaker-python-sdk/tree/master/src/sagemaker/aws_batch) do SDK SageMaker AI Python. Depois de criar um TrainingQueue objeto e um objeto de treinamento modelo (como um Estimador ou ModelTrainer), você pode enviar trabalhos de treinamento para o TrainingQueue usando o `queue.submit()` método.
+ Depois de enviar trabalhos, visualize sua fila de trabalhos e o status do trabalho com o AWS Batch console, a AWS Batch [DescribeServiceJob](https://docs.aws.amazon.com/batch/latest/APIReference/API_DescribeServiceJob.html)API ou a API de SageMaker IA [DescribeTrainingJob](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingJob.html).

## Custo e disponibilidade
<a name="training-job-queues-cost-availability"></a>

Para obter informações detalhadas sobre preços de trabalhos de treinamento, consulte os [preços do Amazon SageMaker AI](https://aws.amazon.com/sagemaker-ai/pricing/). Com AWS Batch, você paga somente pelos AWS recursos usados, como instâncias do Amazon EC2. Para obter mais informações, consulte [Preços do AWS Batch](https://aws.amazon.com/batch/pricing/).

Você pode usar AWS Batch para trabalhos de treinamento de SageMaker IA em qualquer Região da AWS lugar onde os trabalhos de treinamento estejam disponíveis. Para obter mais informações, consulte os [endpoints e cotas do Amazon SageMaker AI](https://docs.aws.amazon.com/general/latest/gr/sagemaker.html).

Para garantir que você tenha a capacidade necessária quando precisar, você pode usar os planos de treinamento flexíveis (FTP) de SageMaker IA. Esses planos permitem que você reserve capacidade para suas tarefas de treinamento. Quando combinado com os recursos AWS Batch de filas, você pode maximizar a utilização durante a duração do seu plano. Para obter mais informações, consulte [Reservar planos de treinamento para seus cargos ou HyperPod grupos de treinamento](https://docs.aws.amazon.com/sagemaker/latest/dg/reserve-capacity-with-training-plans.html).

## Conceitos básicos
<a name="training-job-queues-get-started"></a>

Para ver um tutorial sobre como configurar uma fila de AWS Batch trabalhos e enviar trabalhos de treinamento em SageMaker IA, consulte [Introdução à SageMaker IA AWS Batch no](https://docs.aws.amazon.com/batch/latest/userguide/getting-started-sagemaker.html) *Guia do AWS Batch usuário*.

Para notebooks Jupyter que mostram como usar o `aws_batch` módulo no SDK do AI SageMaker Python, consulte os exemplos de cadernos [AWS Batch para trabalhos de treinamento em SageMaker IA](https://github.com/aws/amazon-sagemaker-examples/tree/default/%20%20%20%20%20%20build_and_train_models/sm-training-queues) no repositório. amazon-sagemaker-examples GitHub 