As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Rastreie o uso e os custos no Amazon Bedrock
O Amazon Bedrock fornece várias maneiras de atribuir o uso e os custos da inferência de modelos a usuários, equipes, aplicativos, ambientes ou experimentos específicos. Você pode usar um único mecanismo ou combinar vários. Por exemplo, use a atribuição principal do IAM para visibilidade por usuário junto com projetos para marcação por aplicativo e solicite metadados para acompanhamento de experimentos por chamada.
dica
Se você não tiver certeza de qual mecanismo se adequa ao seu caso de uso, comece com o Perguntas frequentes no final deste capítulo. Ele responde a perguntas comuns de decisão, como “Quero uma atribuição por usuário e por solicitação — quais são minhas escolhas?” e “Qual é a diferença entre o CUR clássico e o CUR 2.0?”.
Como escolher uma abordagem
O método de atribuição de custo escolhido depende da dimensão que você deseja rastrear, das APIs do Amazon Bedrock que você usa e do nível de granularidade necessário. As duas tabelas a seguir apresentam visões complementares. Use o primeiro para pesquisar mecanismos de acordo com seu objetivo e o segundo para comparar mecanismos lado a lado.
Escolha por meta
Se você sabe o que quer do controle de custos, comece aqui.
| Se seu objetivo é... | Use |
|---|---|
| Per-user ou dólares por equipe em sua conta | Atribuição principal do IAM |
| Per-application ou dólares por carga de trabalho | Perfis de inferência de aplicações(bedrock-runtime), ou Projetos e Espaços de trabalho (bedrock-mantle) |
| Per-prompt uso e custo de tokens, divididos por qualquer dimensão | Per-request marcação de metadados, com registros de invocação do modelo |
| Per-user e detalhes por solicitação | Registros de invocação do modelo, com o usuário retirado do identity ARN ou de uma tag de metadados de solicitação |
| Tanto em dólares precisos na fatura quanto em detalhes por solicitação | Combine um método nativo (por exemplo,Atribuição principal do IAM) com Per-request marcação de metadados |
Compare mecanismos
A tabela a seguir compara os mecanismos disponíveis de acordo com o que eles permitem que você atribua, o que eles produzem, a granularidade dessa saída, onde os dados são entregues e quais endpoints eles suportam.
| Mecanismo | Atributo por | Output | Granularity | Destino dos dados | APIs aceitas do : | bedrock-runtime |
bedrock-mantle |
|---|---|---|---|---|---|---|---|
| Atribuição principal do IAM | Identidade do IAM | Dólares faturados | Agregado, por tipo de uso por dia | AWS Cost Explorer/CUR 2.0 | InvokeModel, Converse, Conclusões de bate-papo | ||
| Perfis de inferência de aplicações | Tags de recursos do perfil | Dólares faturados | Agregado, por tipo de uso por dia | AWS Cost Explorer/CUR 2.0 | InvokeModel, Converse, Conclusões de bate-papo | ||
| Projetos | Tags de recursos do projeto | Dólares faturados | Agregado, por tipo de uso por dia | AWS Cost Explorer/CUR 2.0 | Respostas, conclusões de bate-papos | ||
| Espaços de trabalho | Tags de recursos do projeto por meio do cabeçalho do espaço de trabalho | Dólares faturados | Agregado, por tipo de uso por dia | AWS Cost Explorer/CUR 2.0 | Mensagens antrópicas | ||
| Per-request marcação de metadados | Per-request etiquetas de valor-chave | Contagem de tokens (você converte em custo) | Por solicitação | Somente registros de invocação | InvokeModel InvokeModelWithResponseStream, Converse, ConverseStream |
nota
Os métodos nativos (Atribuição principal do IAM,, Perfis de inferência de aplicaçõesProjetos, eEspaços de trabalho) entregam dólares faturados agregados ao AWS Cost Explorer e ao CUR 2.0. A melhor granulação é por tipo de uso por dia, atribuída por identidade ou tag; elas não produzem uma linha por solicitação. Para obter detalhes por solicitação, use registros de invocação do modelo, em que cada chamada é um registro separado com suas próprias contagens de tokens.
Atribuição por trás de um gateway LLM
Quando um gateway ou proxy liga para o Amazon Bedrock em nome de vários usuários, o Amazon Bedrock registra a função do IAM do gateway como a identidade do chamador. Para preservar a atribuição em nível de usuário, escolha com base na saída de que você precisa.
-
Para dólares por usuário em suas ferramentas de cobrança, faça com que o gateway assuma sua função Amazon Bedrock por usuário ou locatário, usando tags por usuário ou por
RoleSessionNamesessão. Armazene em cache as credenciais resultantes durante a vida útil da sessão para evitar uma AWS STS chamada em cada solicitação. Para obter mais informações, consulte Atribuição principal do IAM. -
Para obter detalhes por solicitação, defina o usuário nos metadados da solicitação em cada chamada. Os metadados da solicitação variam de acordo com a solicitação sem AWS STS chamadas adicionais, o que as tags de sessão não podem fazer em uma sessão compartilhada.