View a markdown version of this page

Rastreie o uso e os custos no Amazon Bedrock - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Rastreie o uso e os custos no Amazon Bedrock

O Amazon Bedrock fornece várias maneiras de atribuir o uso e os custos da inferência de modelos a usuários, equipes, aplicativos, ambientes ou experimentos específicos. Você pode usar um único mecanismo ou combinar vários. Por exemplo, use a atribuição principal do IAM para visibilidade por usuário junto com projetos para marcação por aplicativo e solicite metadados para acompanhamento de experimentos por chamada.

dica

Se você não tiver certeza de qual mecanismo se adequa ao seu caso de uso, comece com o Perguntas frequentes no final deste capítulo. Ele responde a perguntas comuns de decisão, como “Quero uma atribuição por usuário e por solicitação — quais são minhas escolhas?” e “Qual é a diferença entre o CUR clássico e o CUR 2.0?”.

Como escolher uma abordagem

O método de atribuição de custo escolhido depende da dimensão que você deseja rastrear, das APIs do Amazon Bedrock que você usa e do nível de granularidade necessário. As duas tabelas a seguir apresentam visões complementares. Use o primeiro para pesquisar mecanismos de acordo com seu objetivo e o segundo para comparar mecanismos lado a lado.

Escolha por meta

Se você sabe o que quer do controle de custos, comece aqui.

Se seu objetivo é... Use
Per-user ou dólares por equipe em sua conta Atribuição principal do IAM
Per-application ou dólares por carga de trabalho Perfis de inferência de aplicações(bedrock-runtime), ou Projetos e Espaços de trabalho (bedrock-mantle)
Per-prompt uso e custo de tokens, divididos por qualquer dimensão Per-request marcação de metadados, com registros de invocação do modelo
Per-user e detalhes por solicitação Registros de invocação do modelo, com o usuário retirado do identity ARN ou de uma tag de metadados de solicitação
Tanto em dólares precisos na fatura quanto em detalhes por solicitação Combine um método nativo (por exemplo,Atribuição principal do IAM) com Per-request marcação de metadados
Compare mecanismos

A tabela a seguir compara os mecanismos disponíveis de acordo com o que eles permitem que você atribua, o que eles produzem, a granularidade dessa saída, onde os dados são entregues e quais endpoints eles suportam.

Mecanismo Atributo por Output Granularity Destino dos dados APIs aceitas do : bedrock-runtime bedrock-mantle
Atribuição principal do IAM Identidade do IAM Dólares faturados Agregado, por tipo de uso por dia AWS Cost Explorer/CUR 2.0 InvokeModel, Converse, Conclusões de bate-papo Green circle with white checkmark icon. Red circle with white X icon indicating error, cancel, or close action.
Perfis de inferência de aplicações Tags de recursos do perfil Dólares faturados Agregado, por tipo de uso por dia AWS Cost Explorer/CUR 2.0 InvokeModel, Converse, Conclusões de bate-papo Green circle with white checkmark icon. Red circle with white X icon indicating error, cancel, or close action.
Projetos Tags de recursos do projeto Dólares faturados Agregado, por tipo de uso por dia AWS Cost Explorer/CUR 2.0 Respostas, conclusões de bate-papos Red circle with white X icon indicating error, cancel, or close action. Green circle with white checkmark icon.
Espaços de trabalho Tags de recursos do projeto por meio do cabeçalho do espaço de trabalho Dólares faturados Agregado, por tipo de uso por dia AWS Cost Explorer/CUR 2.0 Mensagens antrópicas Red circle with white X icon indicating error, cancel, or close action. Green circle with white checkmark icon.
Per-request marcação de metadados Per-request etiquetas de valor-chave Contagem de tokens (você converte em custo) Por solicitação Somente registros de invocação InvokeModel InvokeModelWithResponseStream, Converse, ConverseStream Green circle with white checkmark icon. Red circle with white X icon indicating error, cancel, or close action.
nota

Os métodos nativos (Atribuição principal do IAM,, Perfis de inferência de aplicaçõesProjetos, eEspaços de trabalho) entregam dólares faturados agregados ao AWS Cost Explorer e ao CUR 2.0. A melhor granulação é por tipo de uso por dia, atribuída por identidade ou tag; elas não produzem uma linha por solicitação. Para obter detalhes por solicitação, use registros de invocação do modelo, em que cada chamada é um registro separado com suas próprias contagens de tokens.

Atribuição por trás de um gateway LLM

Quando um gateway ou proxy liga para o Amazon Bedrock em nome de vários usuários, o Amazon Bedrock registra a função do IAM do gateway como a identidade do chamador. Para preservar a atribuição em nível de usuário, escolha com base na saída de que você precisa.

  • Para dólares por usuário em suas ferramentas de cobrança, faça com que o gateway assuma sua função Amazon Bedrock por usuário ou locatário, usando tags por usuário ou por RoleSessionName sessão. Armazene em cache as credenciais resultantes durante a vida útil da sessão para evitar uma AWS STS chamada em cada solicitação. Para obter mais informações, consulte Atribuição principal do IAM.

  • Para obter detalhes por solicitação, defina o usuário nos metadados da solicitação em cada chamada. Os metadados da solicitação variam de acordo com a solicitação sem AWS STS chamadas adicionais, o que as tags de sessão não podem fazer em uma sessão compartilhada.