View a markdown version of this page

Suivez l'utilisation et les coûts dans Amazon Bedrock - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Suivez l'utilisation et les coûts dans Amazon Bedrock

Amazon Bedrock propose plusieurs méthodes pour attribuer l'utilisation et les coûts de l'inférence des modèles à des utilisateurs, des équipes, des applications, des environnements ou des expériences spécifiques. Vous pouvez utiliser un seul mécanisme ou en combiner plusieurs. Par exemple, utilisez l'attribution principale IAM pour une visibilité par utilisateur aux côtés des projets pour le balisage par application, et demandez des métadonnées pour le suivi des expériences par appel.

Astuce

Si vous ne savez pas quel mécanisme correspond à votre cas d'utilisation, commencez par le Questions fréquentes (FAQ) à la fin de ce chapitre. Il répond à des questions de décision courantes telles que « Je veux une attribution par utilisateur et par invite, quels sont mes choix ? » et « Quelle est la différence entre le CUR classique et le CUR 2.0 ? ».

Choix d’une approche

La méthode d'attribution des coûts que vous choisissez dépend de la dimension que vous souhaitez suivre, des API Amazon Bedrock que vous utilisez et du niveau de granularité dont vous avez besoin. Les deux tableaux suivants présentent des points de vue complémentaires. Utilisez le premier pour rechercher les mécanismes en fonction de votre objectif, et le second pour comparer les mécanismes côte à côte.

Choisissez par objectif

Si vous savez ce que vous attendez du suivi des coûts, commencez ici.

Si votre objectif est... Utilisation
Per-user ou des dollars par équipe sur votre facture Attribution principale de l'IAM
Per-application ou dollars par charge de travail Profils d’inférence d’applications(bedrock-runtime), ou Projets et Espaces de travail (bedrock-mantle)
Per-prompt utilisation et coût des jetons, répartis selon n'importe quelle dimension Per-request balisage des métadonnées, avec des modèles de journaux d'invocation
Per-user et détails par invite Modélisez des journaux d'invocation, avec l'utilisateur extrait de l'identityARN ou d'une balise de métadonnées de demande
À la fois en dollars exacts sur le plan de la facture et des informations détaillées par demande Combinez une méthode native (par exemple,Attribution principale de l'IAM) avec Per-request balisage des métadonnées
Comparez les mécanismes

Le tableau suivant compare les mécanismes disponibles en fonction de ce qu'ils vous permettent d'attribuer, de ce qu'ils produisent, de la granularité de cette sortie, de l'endroit où les données sont fournies et des points de terminaison qu'ils prennent en charge.

Mécanisme Attribuer par Output Granularité Destination des données API prises en charge bedrock-runtime bedrock-mantle
Attribution principale de l'IAM Identité IAM Dollars facturés Agrégé, par type d'utilisation par jour AWS Cost Explorer//CUR 2.0 InvokeModel, Converse, Achèvement du chat Green circle with white checkmark icon. Red circle with white X icon indicating error, cancel, or close action.
Profils d’inférence d’applications Balises de ressources de profil Dollars facturés Agrégé, par type d'utilisation par jour AWS Cost Explorer//CUR 2.0 InvokeModel, Converse, Achèvement du chat Green circle with white checkmark icon. Red circle with white X icon indicating error, cancel, or close action.
Projets Balises de ressources du projet Dollars facturés Agrégé, par type d'utilisation par jour AWS Cost Explorer//CUR 2.0 Réponses, achèvement des discussions Red circle with white X icon indicating error, cancel, or close action. Green circle with white checkmark icon.
Espaces de travail Tags de ressources du projet via l'en-tête de l'espace de travail Dollars facturés Agrégé, par type d'utilisation par jour AWS Cost Explorer//CUR 2.0 Messages anthropiques Red circle with white X icon indicating error, cancel, or close action. Green circle with white checkmark icon.
Per-request balisage des métadonnées Per-request balises clé-valeur Nombre de jetons (vous les convertissez en coût) Par demande Journaux d'invocation uniquement InvokeModel InvokeModelWithResponseStream, Converse, ConverseStream Green circle with white checkmark icon. Red circle with white X icon indicating error, cancel, or close action.
Note

Les méthodes natives (Attribution principale de l'IAM, Profils d’inférence d’applicationsProjets, etEspaces de travail) fournissent des dollars facturés agrégés à AWS Cost Explorer et CUR 2.0. Le grain le plus fin est attribué par type d'utilisation par jour, selon l'identité ou l'étiquette ; ils ne produisent pas de rang par demande. Pour obtenir des informations détaillées par invite, utilisez des modèles de journaux d'invocation, dans lesquels chaque appel est un enregistrement distinct contenant son propre nombre de jetons.

Attribution derrière une passerelle LLM

Lorsqu'une passerelle ou un proxy appelle Amazon Bedrock pour le compte de nombreux utilisateurs, Amazon Bedrock enregistre le rôle IAM de la passerelle comme identité de l'appelant. Pour préserver l'attribution au niveau de l'utilisateur, choisissez en fonction du résultat dont vous avez besoin.

  • Pour les dollars par utilisateur dans vos outils de facturation, demandez à la passerelle d'assumer son rôle Amazon Bedrock par utilisateur ou locataire, en utilisant un tag par utilisateur RoleSessionName ou des balises de session. Mettez en cache les informations d'identification obtenues pendant toute la durée de vie de la session afin d'éviter un AWS STS appel à chaque demande. Pour de plus amples informations, veuillez consulter Attribution principale de l'IAM.

  • Pour obtenir des informations détaillées par invite, définissez l'utilisateur dans les métadonnées de la demande à chaque appel. Les métadonnées des demandes varient d'une demande à l'autre sans AWS STS appels supplémentaires, ce que les balises de session ne peuvent pas faire dans le cadre d'une session partagée.