Auswahl des Ansatzes Zuordnung hinter einem LLM-Gateway

Nutzung und Kosten in Amazon Bedrock verfolgen

Amazon Bedrock bietet mehrere Möglichkeiten, die Nutzung und Kosten von Modellinferenzen bestimmten Benutzern, Teams, Anwendungen, Umgebungen oder Experimenten zuzuordnen. Sie können einen einzelnen Mechanismus verwenden oder mehrere kombinieren. Verwenden Sie beispielsweise die IAM-Prinzipalzuweisung für die Sichtbarkeit pro Benutzer zusammen mit Projekten für das Tagging pro Anwendung und fordern Sie Metadaten für die Nachverfolgung von Experimenten pro Anruf an.

Tipp

Wenn Sie sich nicht sicher sind, welcher Mechanismus zu Ihrem Anwendungsfall passt, beginnen Sie mit dem Häufig gestellte Fragen am Ende dieses Kapitels. Es beantwortet häufig gestellte Entscheidungsfragen wie „Ich möchte eine Zuordnung pro Benutzer und pro Eingabeaufforderung — welche Möglichkeiten habe ich?“ und „Was ist der Unterschied zwischen klassischem CUR und CUR 2.0?“.

Auswahl des Ansatzes

Welche Methode zur Kostenzuweisung Sie wählen, hängt davon ab, welche Dimension Sie verfolgen möchten, welche Amazon Bedrock-APIs Sie verwenden und welche Granularität Sie benötigen. Die folgenden beiden Tabellen enthalten ergänzende Ansichten. Verwenden Sie die erste, um die Mechanismen anhand Ihres Ziels nachzuschlagen, und die zweite, um die Mechanismen nebeneinander zu vergleichen.

Wähle nach Ziel

Wenn Sie wissen, was Sie von der Kostenverfolgung erwarten, beginnen Sie hier.

Wenn dein Ziel ist...	Verwenden Sie
Per-user oder Dollar pro Team auf Ihrer Rechnung	IAM-Hauptzuweisung
Per-application oder Dollar pro Workload	Anwendungsinferenzprofile(`bedrock-runtime`), oder Projekte und Arbeitsbereiche () `bedrock-mantle`
Per-prompt Token-Nutzung und Kosten, aufgeteilt nach beliebigen Dimensionen	Per-request Tagging von Metadaten, mit Protokollen zum Aufrufen von Modellen
Per-user und Details pro Eingabeaufforderung	Modellieren Sie Aufrufprotokolle, wobei der Benutzer aus dem `identity` ARN oder einem Request-Metadaten-Tag stammt
Sowohl rechnungstechnische Angaben als auch detaillierte Angaben pro Aufforderung	Kombinieren Sie eine native Methode (z. B.) mit IAM-Hauptzuweisung Per-request Tagging von Metadaten

Vergleichen Sie die Mechanismen

In der folgenden Tabelle werden die verfügbaren Mechanismen danach verglichen, was Sie mit ihnen zuordnen können, was sie ausgeben, wie detailliert die Ausgabe ist, wo die Daten geliefert werden und welche Endpunkte sie unterstützen.

Mechanismus	Attribut von	Ausgabe	Granularity	Datenziel	Unterstützte APIs
IAM-Hauptzuweisung	IAM-Identität	In Rechnung gestellte Dollar	Aggregiert, pro Nutzungstyp und Tag	AWS Cost Explorer//CUR 2.0	InvokeModel, Converse, Chat-Abschlüsse
Anwendungsinferenzprofile	Ressourcen-Tags für Profile	In Rechnung gestellte Dollar	Aggregiert, pro Nutzungstyp und Tag	AWS Cost Explorer//CUR 2.0	InvokeModel, Converse, Chat-Abschlüsse
Projekte	Tags für Projektressourcen	In Rechnung gestellte Dollar	Aggregiert, pro Nutzungstyp und Tag	AWS Cost Explorer//CUR 2.0	Antworten, Chat-Abschlüsse
Arbeitsbereiche	Tags für Projektressourcen über den Workspace-Header	In Rechnung gestellte Dollar	Aggregiert, pro Nutzungstyp und Tag	AWS Cost Explorer//CUR 2.0	Anthropische Botschaften
Per-request Tagging von Metadaten	Per-request Schlüssel-Wert-Tags	Token-Anzahl (Sie rechnen in Kosten um)	Pro Anfrage	Nur Aufruf-Logs	InvokeModel, Converse InvokeModelWithResponseStream, ConverseStream

Anmerkung

Die systemeigenen Methoden (IAM-Hauptzuweisung, Anwendungsinferenzprofile Projekte, undArbeitsbereiche) liefern aggregierte in Rechnung gestellte Dollar an AWS Cost Explorer und CUR 2.0. Die beste Verteilung erfolgt pro Nutzungstyp und Tag, zugeordnet nach Identität oder Tag. Sie erzeugen keine Zeile pro Anfrage. Verwenden Sie Modellaufrufprotokolle, bei denen es sich bei jedem Aufruf um einen separaten Datensatz handelt, der seine eigene Token-Anzahl enthält, um Informationen zu den einzelnen Eingabeaufforderungen zu erhalten.

Zuordnung hinter einem LLM-Gateway

Wenn ein Gateway oder Proxy Amazon Bedrock im Namen vieler Benutzer aufruft, zeichnet Amazon Bedrock die IAM-Rolle des Gateways als Identität des Anrufers auf. Um die Zuordnung auf Benutzerebene beizubehalten, wählen Sie auf der Grundlage der benötigten Ausgabe.

Lassen Sie das Gateway für Ihre Abrechnungstools pro Benutzer seine Amazon Bedrock-Rolle pro Benutzer oder Mandant übernehmen, indem Sie Tags pro Benutzer RoleSessionName oder Sitzung verwenden. Zwischenspeichern Sie die resultierenden Anmeldeinformationen für die Dauer der Sitzung, um zu vermeiden, dass bei jeder Anfrage ein AWS STS Anruf erfolgt. Weitere Informationen finden Sie unter IAM-Hauptzuweisung.
Für Details pro Aufforderung legen Sie bei jedem Anruf den Benutzer in den Anforderungsmetadaten fest. Die Metadaten der Anfrage variieren je nach Anforderung ohne zusätzliche AWS STS Aufrufe, was Sitzungs-Tags in einer gemeinsamen Sitzung nicht tun können.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Best Practices

IAM-Hauptzuweisung