View a markdown version of this page

Nutzung und Kosten in Amazon Bedrock verfolgen - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Nutzung und Kosten in Amazon Bedrock verfolgen

Amazon Bedrock bietet mehrere Möglichkeiten, die Nutzung und Kosten von Modellinferenzen bestimmten Benutzern, Teams, Anwendungen, Umgebungen oder Experimenten zuzuordnen. Sie können einen einzelnen Mechanismus verwenden oder mehrere kombinieren. Verwenden Sie beispielsweise die IAM-Prinzipalzuweisung für die Sichtbarkeit pro Benutzer zusammen mit Projekten für das Tagging pro Anwendung und fordern Sie Metadaten für die Nachverfolgung von Experimenten pro Anruf an.

Tipp

Wenn Sie sich nicht sicher sind, welcher Mechanismus zu Ihrem Anwendungsfall passt, beginnen Sie mit dem Häufig gestellte Fragen am Ende dieses Kapitels. Es beantwortet häufig gestellte Entscheidungsfragen wie „Ich möchte eine Zuordnung pro Benutzer und pro Eingabeaufforderung — welche Möglichkeiten habe ich?“ und „Was ist der Unterschied zwischen klassischem CUR und CUR 2.0?“.

Auswahl des Ansatzes

Welche Methode zur Kostenzuweisung Sie wählen, hängt davon ab, welche Dimension Sie verfolgen möchten, welche Amazon Bedrock-APIs Sie verwenden und welche Granularität Sie benötigen. Die folgenden beiden Tabellen enthalten ergänzende Ansichten. Verwenden Sie die erste, um die Mechanismen anhand Ihres Ziels nachzuschlagen, und die zweite, um die Mechanismen nebeneinander zu vergleichen.

Wähle nach Ziel

Wenn Sie wissen, was Sie von der Kostenverfolgung erwarten, beginnen Sie hier.

Wenn dein Ziel ist... Verwenden Sie
Per-user oder Dollar pro Team auf Ihrer Rechnung IAM-Hauptzuweisung
Per-application oder Dollar pro Workload Anwendungsinferenzprofile(bedrock-runtime), oder Projekte und Arbeitsbereiche () bedrock-mantle
Per-prompt Token-Nutzung und Kosten, aufgeteilt nach beliebigen Dimensionen Per-request Tagging von Metadaten, mit Protokollen zum Aufrufen von Modellen
Per-user und Details pro Eingabeaufforderung Modellieren Sie Aufrufprotokolle, wobei der Benutzer aus dem identity ARN oder einem Request-Metadaten-Tag stammt
Sowohl rechnungstechnische Angaben als auch detaillierte Angaben pro Aufforderung Kombinieren Sie eine native Methode (z. B.) mit IAM-Hauptzuweisung Per-request Tagging von Metadaten
Vergleichen Sie die Mechanismen

In der folgenden Tabelle werden die verfügbaren Mechanismen danach verglichen, was Sie mit ihnen zuordnen können, was sie ausgeben, wie detailliert die Ausgabe ist, wo die Daten geliefert werden und welche Endpunkte sie unterstützen.

Mechanismus Attribut von Ausgabe Granularity Datenziel Unterstützte APIs bedrock-runtime bedrock-mantle
IAM-Hauptzuweisung IAM-Identität In Rechnung gestellte Dollar Aggregiert, pro Nutzungstyp und Tag AWS Cost Explorer//CUR 2.0 InvokeModel, Converse, Chat-Abschlüsse Green circle with white checkmark icon. Red circle with white X icon indicating error, cancel, or close action.
Anwendungsinferenzprofile Ressourcen-Tags für Profile In Rechnung gestellte Dollar Aggregiert, pro Nutzungstyp und Tag AWS Cost Explorer//CUR 2.0 InvokeModel, Converse, Chat-Abschlüsse Green circle with white checkmark icon. Red circle with white X icon indicating error, cancel, or close action.
Projekte Tags für Projektressourcen In Rechnung gestellte Dollar Aggregiert, pro Nutzungstyp und Tag AWS Cost Explorer//CUR 2.0 Antworten, Chat-Abschlüsse Red circle with white X icon indicating error, cancel, or close action. Green circle with white checkmark icon.
Arbeitsbereiche Tags für Projektressourcen über den Workspace-Header In Rechnung gestellte Dollar Aggregiert, pro Nutzungstyp und Tag AWS Cost Explorer//CUR 2.0 Anthropische Botschaften Red circle with white X icon indicating error, cancel, or close action. Green circle with white checkmark icon.
Per-request Tagging von Metadaten Per-request Schlüssel-Wert-Tags Token-Anzahl (Sie rechnen in Kosten um) Pro Anfrage Nur Aufruf-Logs InvokeModel, Converse InvokeModelWithResponseStream, ConverseStream Green circle with white checkmark icon. Red circle with white X icon indicating error, cancel, or close action.
Anmerkung

Die systemeigenen Methoden (IAM-Hauptzuweisung, AnwendungsinferenzprofileProjekte, undArbeitsbereiche) liefern aggregierte in Rechnung gestellte Dollar an AWS Cost Explorer und CUR 2.0. Die beste Verteilung erfolgt pro Nutzungstyp und Tag, zugeordnet nach Identität oder Tag. Sie erzeugen keine Zeile pro Anfrage. Verwenden Sie Modellaufrufprotokolle, bei denen es sich bei jedem Aufruf um einen separaten Datensatz handelt, der seine eigene Token-Anzahl enthält, um Informationen zu den einzelnen Eingabeaufforderungen zu erhalten.

Zuordnung hinter einem LLM-Gateway

Wenn ein Gateway oder Proxy Amazon Bedrock im Namen vieler Benutzer aufruft, zeichnet Amazon Bedrock die IAM-Rolle des Gateways als Identität des Anrufers auf. Um die Zuordnung auf Benutzerebene beizubehalten, wählen Sie auf der Grundlage der benötigten Ausgabe.

  • Lassen Sie das Gateway für Ihre Abrechnungstools pro Benutzer seine Amazon Bedrock-Rolle pro Benutzer oder Mandant übernehmen, indem Sie Tags pro Benutzer RoleSessionName oder Sitzung verwenden. Zwischenspeichern Sie die resultierenden Anmeldeinformationen für die Dauer der Sitzung, um zu vermeiden, dass bei jeder Anfrage ein AWS STS Anruf erfolgt. Weitere Informationen finden Sie unter IAM-Hauptzuweisung.

  • Für Details pro Aufforderung legen Sie bei jedem Anruf den Benutzer in den Anforderungsmetadaten fest. Die Metadaten der Anfrage variieren je nach Anforderung ohne zusätzliche AWS STS Aufrufe, was Sitzungs-Tags in einer gemeinsamen Sitzung nicht tun können.