よくある質問

このセクションでは、Amazon Bedrock のコスト帰属メカニズムの選択と組み合わせに関する一般的な質問に回答します。

メソッドの選択

Q: ユーザーごと、プロンプトごとの属性が必要です。選択内容

A: 請求ベースのメソッドではなく、モデル呼び出しログを使用します。ネイティブメソッド (IAM プリンシパル属性、プロジェクト、アプリケーション推論プロファイル、) は、AWSCost Explorer と CUR で集計されたドルWorkSpacesのみを生成するため、リクエストごとの行は生成されません。プロンプトごとのビューはログにのみ存在し、ユーザーは 2 つの場所のいずれかから取得できます。

最初のオプションは、呼び出しごとに request-metadata タグを設定することです。


client.converse(
    modelId=...,
    messages=[...],
    requestMetadata={"user": "alice@example.com"},
)

2 つ目は、自動キャプチャされたに依存することです。これはidentity.arn、発信者がユーザーごとので IAM ロールを引き受ける場合に機能しますRoleSessionName。ログに記録されたトークン数からコストを計算します。ユーザーあたりの請求書精度ドルも必要な場合は、 IAM プリンシパル属性と一緒に実行します。

Q: 特定のシナリオがあります。どの方法を使用すればよいですか?

A: 次の表を使用して、シナリオをメソッドに一致させます。

シナリオ	使用アイテム
毎月の請求には、各チームの支出が必要です。	IAM プリンシパル属性 (チーム別のタグ）、またはタグ付けされたプロジェクトまたはアプリケーション推論プロファイル
機能ごとに、個々のプロンプトあたりのコストが必要です。	リクエストごとのメタデータのタグ付けモデル呼び出しログを使用する
多くのモデルを実行し、アプリケーションごとに 1 つのコストバケットが必要です。	プロジェクト on `bedrock-mantle` — 1 つのプロジェクトで多くのモデルにまたがることができます
InvokeModel または Converse で、アプリケーションあたりのドルが必要です。	アプリケーション推論プロファイル
Amazon Bedrock の前には、多くのユーザーにサービスを提供するゲートウェイがあります。	ユーザーあたりの`sts:AssumeRole`請求額とプロンプトリクエストごとのメタデータのタグ付けごとの詳細

Q: プロジェクトまたはアプリケーション推論プロファイルを使用する必要がありますか?

A: どちらもAWSCost Explorer と CUR で集計されたドルを提供します。エンドポイントとスケールで選択します。

アプリケーション推論プロファイルはbedrock-runtimeエンドポイント (InvokeModel と Converse) で動作しますが、モデル固有です。モデルごとに 1 つのプロファイルを作成するため、モデルやチームを追加するとリソース数が増加します。
プロジェクトはbedrock-mantleエンドポイント (応答とチャットの完了) で作業し、1 つのプロジェクトが多くのモデルにまたがることができます。ワークロードごとに多くのモデルがある場合、スケールは向上しますが、マントルのみになります。

ユーザーごとの詳細には、いずれか 1 つIAM プリンシパル属性と一緒にを使用します。

コストと使用状況レポートの質問

Q: コスト属性のクラシック CUR と CUR 2.0 の違いは何ですか?

A: プロジェクト、、アプリケーション推論プロファイル、IAM プリンシパルタグからアクティブ化されたコスト配分タグはWorkSpaces、従来の CUR と CUR 2.0 の両方に表示されます。違いは、がタグ付けなしでIAM プリンシパル属性機能する自動発信者 ID 列です。その列 — 「呼び出しを行ったユーザー」データは、発信者 ID オプションが選択された CUR 2.0 (AWSデータエクスポート) エクスポートにのみ存在します。明細項目データにユーザーごとのネイティブ属性が必要な場合は、CUR 2.0 が必要です。

Q: 個々のプロンプトのコストはAWSCost Explorer または CUR で確認できますか?

A: いいえ。従来の CUR と CUR 2.0 の両方が 1 時間または 1 日の使用タイプごとにコストを集計し、どちらも明細項目にリクエストごとの識別子を持ちません。プロンプトごとの詳細は、モデル呼び出しログにのみ存在します。調整のために、プロンプトごとのコストではなく、モデルと使用状況タイプの粒度でログを CUR に結合します。

Q: コストは CUR にありますが、タグとトークンはログにあります。組み合わせるにはどうすればよいですか?

A: パターンは 2 つあります。請求書精度の合計については、モデル/使用量タイプ/日単位の CUR にログを結合します。プロンプトごとのコストについては、ログに記録されたトークン数とトークンごとの発行レートから計算します。次の CloudWatch Logs Insights クエリは、計算にフィードするユーザーごと、モデルごとのトークンの合計を生成します。


fields requestMetadata.user as user, modelId,
       input.inputTokenCount as inTokens,
       output.outputTokenCount as outTokens
| stats sum(inTokens) as totalInput,
        sum(outTokens) as totalOutput,
        count() as calls
        by user, modelId

計算された数値は推定値です。モデル化しない限り、割引、コミットメント、バッチ料金、無料利用枠、プロビジョニングされたスループットは反映されません。詳細については、「ログからのコストの取得」を参照してください。

メカニズムの違い

Q: IAM セッションタグとリクエストメタデータの違いは何ですか?

A: バインドと送信先。セッションタグはに 1 回設定sts:AssumeRoleされ、そのセッションの認証情報を使用して行われた呼び出しごとに一定です。AWSCost Explorer と CUR (従来の CUR と CUR 2.0 の両方) の集計請求データとしてのみ表示されます。リクエストメタデータは呼び出しごとに設定され、リクエストごとに異なり、呼び出しログに記録されます。

ユーザーごと、プロンプトごとの属性については、リクエストメタデータを使用します。ユーザーあたりの請求額については、セッションタグを使用するか、発信者 ID ARN に依存します。

Q: リクエストメタデータは請求書に表示されますか?

A: いいえ。リクエストメタデータはコスト配分タグではありません。これはモデル呼び出しログにのみ書き込まれ、AWSCost Explorer や CUR には表示されません。運用分析やプロンプトごとの分析に使用し、請求額にはネイティブメソッド ( IAM プリンシパル属性やなどプロジェクト) を使用します。

実装

Q: 属性は LLM ゲートウェイの背後でどのように機能しますか?

A: Amazon Bedrock は、ゲートウェイのロールを発信者の ID として記録します。ユーザーレベルの属性を保持するには、ユーザーごとにロールを引き受け、セッションの有効期間の認証情報をキャッシュし、ユーザーをセッションタグ (請求金額) またはとして RoleSessionName (ユーザーがログidentity.arnに入るように) 渡します。


sts.assume_role(
    RoleArn=GATEWAY_ROLE,
    RoleSessionName="alice",
    Tags=[{"Key": "user", "Value": "alice@example.com"}],
)

リクエストごとのAWS STS呼び出しがないプロンプトごとの詳細については、代わりに各呼び出しのリクエストメタデータでユーザーを設定します。

Q: すべての呼び出しにタグを付けるように要求できますか?

A: Amazon Bedrock 側からではありません。リクエストメタデータは呼び出しごとにオプトインされ、Amazon Bedrock はそれを省略する呼び出しを拒否しません。リソースのみを管理するAWSタグポリシーではありません。すべてのリクエストでスタンプする共有クライアントまたは LLM ゲートウェイにタグ付けを適用します。呼び出し元 ID が自動的にキャプチャされるため、常にコールごとのコードがない属性の場合はIAM プリンシパル属性、を使用します。

Q: 各通話で設定するフィールドと自動のフィールドはどれですか?

A: ログレコードのほとんどすべてが Amazon Bedrock によって自動的にキャプチャされます: accountId、region、modelIdrequestId、、identity.arn、、入出力トークン数、スキーマメタデータ。呼び出しごとに指定するフィールドはのみですrequestMetadata。タグmodelIdとしてを設定するのではなく、呼び出したモデルまたは推論プロファイルです。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

ベストプラクティス

その他の機能