Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Realice un seguimiento del uso y los costes en Amazon Bedrock
Amazon Bedrock ofrece varias formas de atribuir el uso y los costos de la inferencia de modelos a usuarios, equipos, aplicaciones, entornos o experimentos específicos. Puede utilizar un único mecanismo o combinar varios. Por ejemplo, usa la atribución principal de IAM para la visibilidad por usuario junto con los proyectos para el etiquetado por aplicación, y solicita metadatos para el seguimiento de los experimentos por llamada.
sugerencia
Si no estás seguro de qué mecanismo se adapta a tu caso de uso, comienza con el que aparece Preguntas frecuentes al final de este capítulo. Responde a preguntas de decisión habituales, como «Quiero una atribución por usuario y por mensaje, ¿cuáles son mis opciones?» y «¿Cuál es la diferencia entre el CUR clásico y el CUR 2.0?».
Elección de un enfoque
El método de atribución de costes que elija depende de la dimensión de la que desee realizar el seguimiento, de las API de Amazon Bedrock que utilice y del nivel de granularidad que necesite. En las dos tablas siguientes se presentan vistas complementarias. Utilice la primera para buscar los mecanismos según su objetivo y la segunda para comparar los mecanismos uno al lado del otro.
Elige por objetivo
Si sabe lo que quiere del seguimiento de costes, empiece aquí.
| Si tu objetivo es... | Uso |
|---|---|
| Per-user o dólares por equipo en tu factura | Atribución principal de IAM |
| Per-application o dólares por carga de trabajo | Perfiles de inferencia de aplicaciones(bedrock-runtime), o Proyectos y Espacios de trabajo () bedrock-mantle |
| Per-prompt uso y costo de los tokens, divididos en cualquier dimensión | Per-request etiquetado de metadatos, con registros de invocación de modelos |
| Per-user y detalles por mensaje | Modele los registros de invocación, con el usuario tomado del identity ARN o de una etiqueta request-metadata |
| Tanto los dólares exactos de la factura como los detalles por solicitud | Combine un método nativo (por ejemplo,) con Atribución principal de IAM Per-request etiquetado de metadatos |
Compare los mecanismos
En la siguiente tabla, se comparan los mecanismos disponibles en función de lo que permiten atribuir, el contenido que generan, la granularidad de ese resultado, el lugar donde se entregan los datos y los puntos finales que admiten.
| Mecanismo | Atribuya por | Output | Granularity (Grado de detalle) | Destino de los datos | API de compatibles | bedrock-runtime |
bedrock-mantle |
|---|---|---|---|---|---|---|---|
| Atribución principal de IAM | Identidad de IAM | Dólares facturados | Agregados, por tipo de uso y día | AWS Cost Explorer/CUR 2.0 | InvokeModel, Converse, Chat Completions | ||
| Perfiles de inferencia de aplicaciones | Etiquetas de recursos de perfil | Dólares facturados | Agregados, por tipo de uso y día | AWS Cost Explorer/CUR 2.0 | InvokeModel, Converse, Chat Completions | ||
| Proyectos | Etiquetas de recursos del proyecto | Dólares facturados | Agregados, por tipo de uso y día | AWS Cost Explorer/CUR 2.0 | Respuestas, finalización del chat | ||
| Espacios de trabajo | Proyecta etiquetas de recursos a través del encabezado del espacio de trabajo | Dólares facturados | Agregados, por tipo de uso y día | AWS Cost Explorer/CUR 2.0 | Mensajes antrópicos | ||
| Per-request etiquetado de metadatos | Per-request etiquetas de valores clave | Los tokens cuentan (se convierten en costes) | Por solicitud | Solo registros de invocación | InvokeModel, InvokeModelWithResponseStream, Converse, ConverseStream |
nota
Los métodos nativos (Atribución principal de IAM, Perfiles de inferencia de aplicacionesProyectos, yEspacios de trabajo) entregan el total de los dólares facturados a AWS Cost Explorer y CUR 2.0. Lo mejor es por tipo de uso y día, y se asigna por identidad o etiqueta; no generan una fila por solicitud. Para obtener información detallada por solicitud, utilice los registros de invocación del modelo, en los que cada llamada es un registro independiente que contiene sus propios recuentos de símbolos.
Atribución detrás de una pasarela LLM
Cuando una puerta de enlace o un proxy llama a Amazon Bedrock en nombre de varios usuarios, Amazon Bedrock registra la función de IAM de la puerta de enlace como identidad de la persona que llama. Para conservar la atribución a nivel de usuario, elija en función del resultado que necesite.
-
Para el dinero por usuario en sus herramientas de facturación, pida a la pasarela que asuma su función de Amazon Bedrock por usuario o inquilino, utilizando etiquetas por usuario
RoleSessionNameo sesión. Guarde en caché las credenciales resultantes durante la duración de la sesión para evitar una AWS STS llamada en cada solicitud. Para obtener más información, consulte Atribución principal de IAM. -
Para obtener detalles por mensaje, configura el usuario en los metadatos de la solicitud de cada llamada. Los metadatos de la solicitud varían según la solicitud sin necesidad de AWS STS llamadas adicionales, algo que las etiquetas de sesión no pueden hacer en una sesión compartida.