View a markdown version of this page

Monitorar trabalhos de inferência em lote - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Monitorar trabalhos de inferência em lote

Além das configurações definidas para um trabalho de inferência em lote, você também pode monitorar seu progresso vendo seu status. Para obter mais informações sobre os possíveis status de um trabalho, consulte o status campo em ModelInvocationJobSummary.

Para acompanhar o progresso de um trabalho, você pode usar os contadores de progresso que as operações da ListModelInvocationJobsAPI GetModelInvocationJobe as operações da API retornam. Esses contadores mostram o número total de registros de entrada e quantos o serviço processou. Você pode monitorar a conclusão sem verificar os buckets de saída do Amazon S3. Como alternativa, você pode encontrar esses números no manifest.json.out arquivo no bucket do Amazon S3 que contém os arquivos de saída. Para obter mais informações, consulte Visualizar os resultados de um trabalho de inferência em lote. Para saber como baixar um objeto do S3, consulte Como baixar objetos.

dica

Em vez de pesquisar o status do trabalho, você pode usar EventBridge a Amazon para receber notificações automáticas quando um trabalho de inferência em lote for concluído ou mudar de estado. Para obter mais informações, consulte Monitore as mudanças no estado de trabalho do Amazon Bedrock usando a Amazon EventBridge.

Para saber como visualizar detalhes de trabalhos de inferência em lote, escolha a guia correspondente ao método de sua preferência e siga as etapas:

Console
Como visualizar informações sobre trabalhos de inferência em lote
  1. Faça login no Console de gerenciamento da AWS com uma identidade do IAM que tenha permissões para usar o console Amazon Bedrock. Em seguida, abra o console Amazon Bedrock em https://console.aws.amazon.com/bedrock.

  2. No painel de navegação à esquerda, selecione Inferência em lote.

  3. Na seção Trabalhos de inferência em lote, escolha um trabalho.

  4. Na página de detalhes do trabalho, é possível visualizar informações sobre a configuração do trabalho e monitorar seu progresso visualizando seu Status.

API

Para obter informações sobre um trabalho de inferência em lote, envie uma GetModelInvocationJobsolicitação com um endpoint do plano de controle Amazon Bedrock e forneça o ID ou ARN do trabalho no campo. jobIdentifier

Para listar informações sobre vários trabalhos de inferência em lote, envie uma ListModelInvocationJobssolicitação com um endpoint do plano de controle Amazon Bedrock. É possível especificar os seguintes parâmetros opcionais:

Campo Descrição breve
maxResults O número máximo de resultados a serem apresentados em uma resposta.
nextToken Se houver mais resultados do que o número especificado no campo maxResults, a resposta exibirá um valor de nextToken. Para ver o próximo lote de resultados, envie o valor de nextToken em outra solicitação.

A resposta para GetModelInvocationJob e ListModelInvocationJobs inclui um modelInvocationType campo que indica se o trabalho usa o formato InvokeModel ou a Converse API.

A resposta também inclui os seguintes campos que você pode usar para monitorar o progresso de um trabalho em execução:

  • totalRecordCount— O número total de registros enviados ao trabalho de inferência em lote.

  • processedRecordCount— O número de registros processados até o momento, que inclui sucessos e erros.

  • successRecordCount— O número de registros processados com sucesso até o momento.

  • errorRecordCount— O número de registros que causaram erros durante o processamento.

Para calcular a porcentagem de progresso de um trabalho em execução, divida processedRecordCount portotalRecordCount. Os contadores retornam 0 quando você envia um trabalho, mas o processamento ainda não começou. Enquanto um trabalho está em andamento, os contadores podem ser atrasados em até 1 minuto.

Para listar todas as tags de um trabalho, envie uma ListTagsForResourcesolicitação com um endpoint do plano de controle Amazon Bedrock e inclua o Amazon Resource Name (ARN) do trabalho.