

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Pertanyaan umum
<a name="cost-mgmt-faq"></a>

Bagian ini menjawab pertanyaan umum tentang memilih dan menggabungkan mekanisme atribusi biaya Amazon Bedrock.

## Memilih metode
<a name="cost-mgmt-faq-choosing"></a>

**T: Saya ingin atribusi per pengguna, per-prompt. Apa pilihan saya?**

J: Gunakan [log pemanggilan model](model-invocation-logging.md), bukan metode berbasis penagihan. Metode asli ([Atribusi utama IAM](cost-mgmt-iam-principal-tracking.md),, [Proyek](cost-mgmt-projects.md)[Profil inferensi aplikasi](cost-mgmt-application-inference-profiles.md), dan[Workspace](cost-mgmt-workspaces.md)) hanya menghasilkan dolar gabungan di AWS Cost Explorer dan CUR — tidak pernah baris per permintaan. Tampilan per-prompt hanya ada di log Anda, di mana pengguna dapat berasal dari salah satu dari dua tempat.

Opsi pertama adalah mengatur tag permintaan-metadata pada setiap panggilan:

```
client.converse(
    modelId=...,
    messages=[...],
    requestMetadata={"user": "alice@example.com"},
)
```

Yang kedua adalah mengandalkan tangkapan otomatis`identity.arn`, yang berfungsi jika penelepon Anda mengasumsikan peran IAM-nya dengan per pengguna. `RoleSessionName` Anda menghitung biaya dari jumlah token yang dicatat. Jika Anda juga ingin dolar akurat faktur per pengguna, jalankan bersama. [Atribusi utama IAM](cost-mgmt-iam-principal-tracking.md)

**Q: Saya memiliki skenario tertentu. Metode mana yang harus saya gunakan?**

A: Cocokkan skenario Anda dengan metode menggunakan tabel berikut.


| Skenario | Gunakan | 
| --- | --- | 
| Anda membutuhkan pengeluaran setiap tim untuk tagihan bulanan Anda. | [Atribusi utama IAM](cost-mgmt-iam-principal-tracking.md)(tag oleh tim), atau ditandai [Proyek](cost-mgmt-projects.md) atau [Profil inferensi aplikasi](cost-mgmt-application-inference-profiles.md) | 
| Anda memerlukan biaya per prompt individu, berdasarkan fitur. | [Per-request penandaan metadata](cost-mgmt-request-metadata.md)dengan log [pemanggilan model](model-invocation-logging.md) | 
| Anda menjalankan banyak model dan menginginkan satu bucket biaya per aplikasi. | [Proyek](cost-mgmt-projects.md)on bedrock-mantle — satu proyek dapat menjangkau banyak model | 
| Anda berada di InvokeModel atau Converse dan menginginkan dolar per aplikasi. | [Profil inferensi aplikasi](cost-mgmt-application-inference-profiles.md) | 
| Anda berada di depan Amazon Bedrock dengan gateway yang melayani banyak pengguna. | Per-user sts:AssumeRoleuntuk penagihan dolar, ditambah [Per-request penandaan metadata](cost-mgmt-request-metadata.md) untuk detail per prompt | 

**T: Haruskah saya menggunakan Project atau profil inferensi aplikasi?**

J: Keduanya mengirimkan dolar agregat di AWS Cost Explorer dan CUR. Pilih berdasarkan titik akhir dan skala.
+ [Profil inferensi aplikasi](cost-mgmt-application-inference-profiles.md)bekerja pada `bedrock-runtime` titik akhir (InvokeModel dan Converse), tetapi mereka spesifik model. Anda membuat satu profil per model, sehingga jumlah sumber daya bertambah saat Anda menambahkan model atau tim.
+ [Proyek](cost-mgmt-projects.md)bekerja pada `bedrock-mantle` titik akhir (Respons dan Penyelesaian Obrolan), dan satu proyek dapat menjangkau banyak model. Mereka berskala lebih baik ketika Anda memiliki banyak model per beban kerja, tetapi hanya mantel.

Gunakan [Atribusi utama IAM](cost-mgmt-iam-principal-tracking.md) bersama salah satu untuk detail per pengguna.

## Pertanyaan Laporan Biaya dan Penggunaan
<a name="cost-mgmt-faq-cur"></a>

**T: Apa perbedaan antara CUR klasik dan CUR 2.0 untuk atribusi biaya?**

J: Tag alokasi biaya aktif dari[Proyek](cost-mgmt-projects.md),[Profil inferensi aplikasi](cost-mgmt-application-inference-profiles.md),[Workspace](cost-mgmt-workspaces.md), dan tag utama IAM muncul di CUR klasik dan CUR 2.0. Perbedaannya adalah kolom identitas penelepon otomatis yang [Atribusi utama IAM](cost-mgmt-iam-principal-tracking.md) berfungsi tanpa penandaan. Kolom itu - data “siapa yang membuat panggilan” - hanya ada dalam ekspor CUR 2.0 (Ekspor AWS Data) dengan opsi identitas pemanggil dipilih. Jika Anda menginginkan atribusi asli per pengguna dalam data item baris Anda, Anda memerlukan CUR 2.0.

**T: Dapatkah saya melihat biaya untuk prompt individu di AWS Cost Explorer atau CUR?**

A: Tidak. Baik CUR klasik dan CUR 2.0 agregat biaya berdasarkan jenis penggunaan lebih dari satu jam atau sehari, dan tidak ada yang membawa pengenal per permintaan pada item barisnya. Per-prompt detail hanya tinggal di log [pemanggilan model](model-invocation-logging.md) Anda. Gabungkan log ke CUR pada model dan butir tipe penggunaan untuk rekonsiliasi, bukan untuk biaya per prompt.

**T: Biaya saya ada di CUR tetapi tag dan token saya ada di log. Bagaimana cara menggabungkannya?**

A: Ada dua pola. Untuk total faktur yang akurat, gabungkan log ke CUR di - grain. model/usage type/day Untuk biaya per prompt, hitung dari jumlah token yang dicatat dan tarif per token yang dipublikasikan. Kueri Wawasan CloudWatch Log berikut menghasilkan total token per pengguna per model yang memberi makan perhitungan:

```
fields requestMetadata.user as user, modelId,
       input.inputTokenCount as inTokens,
       output.outputTokenCount as outTokens
| stats sum(inTokens) as totalInput,
        sum(outTokens) as totalOutput,
        count() as calls
        by user, modelId
```

Angka yang dihitung adalah perkiraan. Ini tidak mencerminkan diskon, komitmen, harga batch, tingkat gratis, atau throughput yang disediakan kecuali Anda memodelkannya. Lihat perinciannya di [Mendapatkan biaya dari log Anda](cost-mgmt-request-metadata.md#cost-mgmt-request-metadata-getting-cost).

## Bagaimana mekanismenya berbeda
<a name="cost-mgmt-faq-differences"></a>

**T: Apa perbedaan antara tag sesi IAM dan metadata permintaan?**

A: Binding dan tujuan. Tag sesi disetel sekali `sts:AssumeRole` dan konstan untuk setiap panggilan yang dibuat dengan kredensi sesi itu; tag ini hanya muncul sebagai data penagihan agregat di AWS Cost Explorer dan CUR (CUR klasik dan CUR 2.0). Metadata permintaan disetel per panggilan, bervariasi per permintaan, dan mendarat di log pemanggilan Anda.

Untuk atribusi per pengguna, per-prompt, gunakan metadata permintaan. Untuk dolar per pengguna pada tagihan, gunakan tag sesi atau mengandalkan ARN identitas penelepon.

**T: Apakah metadata permintaan muncul di tagihan saya?**

A: Tidak. Metadata permintaan bukan tag alokasi biaya. Ini ditulis hanya untuk [log pemanggilan model](model-invocation-logging.md) Anda dan tidak pernah muncul di AWS Cost Explorer atau CUR. Gunakan untuk analisis operasional dan per-prompt, dan gunakan metode asli (seperti [Atribusi utama IAM](cost-mgmt-iam-principal-tracking.md) atau[Proyek](cost-mgmt-projects.md)) untuk dolar yang ditagih.

## Implementasi
<a name="cost-mgmt-faq-implementation"></a>

**T: Bagaimana cara kerja atribusi di belakang gateway LLM?**

J: Amazon Bedrock mencatat peran gateway sebagai identitas penelepon. Untuk mempertahankan atribusi tingkat pengguna, ambil peran per pengguna, cache kredenal untuk masa pakai sesi, dan berikan pengguna sebagai tag sesi (untuk menagih dolar) and/or sebagai `RoleSessionName` (sehingga pengguna masuk di log Anda): `identity.arn`

```
sts.assume_role(
    RoleArn=GATEWAY_ROLE,
    RoleSessionName="alice",
    Tags=[{"Key": "user", "Value": "alice@example.com"}],
)
```

Untuk detail per-prompt tanpa AWS STS panggilan per permintaan, tetapkan [metadata permintaan](cost-mgmt-request-metadata.md) pengguna pada setiap panggilan sebagai gantinya.

**T: Dapatkah saya mengharuskan setiap panggilan diberi tag?**

A: Bukan dari sisi Amazon Bedrock. Metadata permintaan adalah opt-in per panggilan, dan Amazon Bedrock tidak menolak panggilan yang menghilangkannya. Ini bukan Kebijakan AWS Tag, yang hanya mengatur sumber daya. Menegakkan penandaan di klien bersama atau gateway LLM yang mencetaknya pada setiap permintaan. Untuk atribusi yang selalu ada tanpa kode per panggilan, gunakan[Atribusi utama IAM](cost-mgmt-iam-principal-tracking.md), karena identitas pemanggil ditangkap secara otomatis.

**T: Bidang mana yang saya tetapkan pada setiap panggilan, dan mana yang otomatis?**

J: Hampir semua yang ada di catatan log ditangkap secara otomatis oleh Amazon Bedrock:`accountId`,,`region`,`modelId`,`requestId`,`identity.arn`, jumlah token input dan output, dan metadata skema. Satu-satunya bidang yang Anda berikan per panggilan adalah`requestMetadata`. Anda tidak menetapkan `modelId` sebagai tag; itu adalah model atau profil inferensi yang Anda panggil.