View a markdown version of this page

Realice un seguimiento del uso y los costes en Amazon Bedrock - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Realice un seguimiento del uso y los costes en Amazon Bedrock

Amazon Bedrock ofrece varias formas de atribuir el uso y los costos de la inferencia de modelos a usuarios, equipos, aplicaciones, entornos o experimentos específicos. Puede utilizar un único mecanismo o combinar varios. Por ejemplo, usa la atribución principal de IAM para la visibilidad por usuario junto con los proyectos para el etiquetado por aplicación, y solicita metadatos para el seguimiento de los experimentos por llamada.

sugerencia

Si no estás seguro de qué mecanismo se adapta a tu caso de uso, comienza con el que aparece Preguntas frecuentes al final de este capítulo. Responde a preguntas de decisión habituales, como «Quiero una atribución por usuario y por mensaje, ¿cuáles son mis opciones?» y «¿Cuál es la diferencia entre el CUR clásico y el CUR 2.0?».

Elección de un enfoque

El método de atribución de costes que elija depende de la dimensión de la que desee realizar el seguimiento, de las API de Amazon Bedrock que utilice y del nivel de granularidad que necesite. En las dos tablas siguientes se presentan vistas complementarias. Utilice la primera para buscar los mecanismos según su objetivo y la segunda para comparar los mecanismos uno al lado del otro.

Elige por objetivo

Si sabe lo que quiere del seguimiento de costes, empiece aquí.

Si tu objetivo es... Uso
Per-user o dólares por equipo en tu factura Atribución principal de IAM
Per-application o dólares por carga de trabajo Perfiles de inferencia de aplicaciones(bedrock-runtime), o Proyectos y Espacios de trabajo () bedrock-mantle
Per-prompt uso y costo de los tokens, divididos en cualquier dimensión Per-request etiquetado de metadatos, con registros de invocación de modelos
Per-user y detalles por mensaje Modele los registros de invocación, con el usuario tomado del identity ARN o de una etiqueta request-metadata
Tanto los dólares exactos de la factura como los detalles por solicitud Combine un método nativo (por ejemplo,) con Atribución principal de IAM Per-request etiquetado de metadatos
Compare los mecanismos

En la siguiente tabla, se comparan los mecanismos disponibles en función de lo que permiten atribuir, el contenido que generan, la granularidad de ese resultado, el lugar donde se entregan los datos y los puntos finales que admiten.

Mecanismo Atribuya por Output Granularity (Grado de detalle) Destino de los datos API de compatibles bedrock-runtime bedrock-mantle
Atribución principal de IAM Identidad de IAM Dólares facturados Agregados, por tipo de uso y día AWS Cost Explorer/CUR 2.0 InvokeModel, Converse, Chat Completions Green circle with white checkmark icon. Red circle with white X icon indicating error, cancel, or close action.
Perfiles de inferencia de aplicaciones Etiquetas de recursos de perfil Dólares facturados Agregados, por tipo de uso y día AWS Cost Explorer/CUR 2.0 InvokeModel, Converse, Chat Completions Green circle with white checkmark icon. Red circle with white X icon indicating error, cancel, or close action.
Proyectos Etiquetas de recursos del proyecto Dólares facturados Agregados, por tipo de uso y día AWS Cost Explorer/CUR 2.0 Respuestas, finalización del chat Red circle with white X icon indicating error, cancel, or close action. Green circle with white checkmark icon.
Espacios de trabajo Proyecta etiquetas de recursos a través del encabezado del espacio de trabajo Dólares facturados Agregados, por tipo de uso y día AWS Cost Explorer/CUR 2.0 Mensajes antrópicos Red circle with white X icon indicating error, cancel, or close action. Green circle with white checkmark icon.
Per-request etiquetado de metadatos Per-request etiquetas de valores clave Los tokens cuentan (se convierten en costes) Por solicitud Solo registros de invocación InvokeModel, InvokeModelWithResponseStream, Converse, ConverseStream Green circle with white checkmark icon. Red circle with white X icon indicating error, cancel, or close action.
nota

Los métodos nativos (Atribución principal de IAM, Perfiles de inferencia de aplicacionesProyectos, yEspacios de trabajo) entregan el total de los dólares facturados a AWS Cost Explorer y CUR 2.0. Lo mejor es por tipo de uso y día, y se asigna por identidad o etiqueta; no generan una fila por solicitud. Para obtener información detallada por solicitud, utilice los registros de invocación del modelo, en los que cada llamada es un registro independiente que contiene sus propios recuentos de símbolos.

Atribución detrás de una pasarela LLM

Cuando una puerta de enlace o un proxy llama a Amazon Bedrock en nombre de varios usuarios, Amazon Bedrock registra la función de IAM de la puerta de enlace como identidad de la persona que llama. Para conservar la atribución a nivel de usuario, elija en función del resultado que necesite.

  • Para el dinero por usuario en sus herramientas de facturación, pida a la pasarela que asuma su función de Amazon Bedrock por usuario o inquilino, utilizando etiquetas por usuario RoleSessionName o sesión. Guarde en caché las credenciales resultantes durante la duración de la sesión para evitar una AWS STS llamada en cada solicitud. Para obtener más información, consulte Atribución principal de IAM.

  • Para obtener detalles por mensaje, configura el usuario en los metadatos de la solicitud de cada llamada. Los metadatos de la solicitud varían según la solicitud sin necesidad de AWS STS llamadas adicionales, algo que las etiquetas de sesión no pueden hacer en una sesión compartida.