

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 應用程式推論設定檔
<a name="cost-mgmt-application-inference-profiles"></a>

應用程式推論設定檔 (AIPs) 可讓您根據應用程式、團隊或工作負載，將 Amazon Bedrock 成本歸因於`bedrock-runtime`端點上的 Amazon Bedrock [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html) 和 [Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html) APIs。每個 AIP 都是模型特定的，並帶有成本分配標籤，這些標籤流向 AWS Cost Explorer 和 AWS 成本和用量報告 (CUR 2.0)。

對於在`bedrock-mantle`端點上使用回應和聊天完成的工作負載，請[專案](cost-mgmt-projects.md)改用 。

## 成本歸因的運作方式
<a name="cost-mgmt-aip-how-it-works"></a>

應用程式推論設定檔是參考特定 Amazon Bedrock 模型的資源。您可以建立設定檔、連接成本分配標籤，然後在 API 呼叫中使用設定檔 ARN 取代模型 ID。設定檔的標籤會連接到每個請求的帳單記錄。

下列範例顯示如何在呼叫 Converse API 時使用應用程式推論設定檔 ARN 而非模型 ID：

```
import boto3

client = boto3.client("bedrock-runtime")

response = client.converse(
    modelId="arn:aws:bedrock:us-east-1:123456789012:inference-profile/my-team-profile",
    messages=[
        {"role": "user", "content": [{"text": "Hello"}]}
    ]
)
```

如需建立設定檔的詳細資訊，請參閱 [建立應用程式推論設定檔](inference-profiles-create.md)。

## 檢視設定檔成本
<a name="cost-mgmt-aip-viewing-costs"></a>

建立和標記設定檔後，在 AWS Billing and Cost Management 主控台中將標籤啟用為成本分配標籤：

1. 開啟 AWS Billing and Cost Management 主控台。

1. 在導覽窗格中，選擇 **Cost allocation tags** (成本分配標籤)。

1. 選取您套用至設定檔的標籤。

1. 選擇 **Activate (啟用)**。

啟用後，標籤最多可能需要 24 小時才會出現在 Cost Explorer 和 CUR 中。成本分配標籤不追溯。只有啟用後產生的成本才會加上標籤。如需詳細資訊，請參閱[啟用使用者定義的成本分配標籤](https://docs.aws.amazon.com/awsaccountbilling/latest/aboutv2/activating-tags.html)。

啟用標籤後，您可以在下列工具中依應用程式推論設定檔分析 Amazon Bedrock 成本：
+ **AWS Cost Explorer** – 依設定檔標籤篩選，以檢視一段時間內的成本趨勢。依標籤分組，以比較跨設定檔的成本。
+ **AWS 成本和用量報告 (CUR 2.0)** – 依設定檔標籤查詢明細項目成本明細的 CUR 資料。

## 擴展考量
<a name="cost-mgmt-aip-scaling"></a>

每個應用程式推論設定檔都繫結至特定模型。這表示您需要模型、團隊和標籤集的每個唯一組合都有個別的設定檔。隨著組織的成長，設定檔計數可能會快速增加，尤其是當新的模型版本需要新的設定檔時。

若要減少設定檔擴散：
+ **建議：**使用 [專案](cost-mgmt-projects.md) 可在成本追蹤時提高彈性和輕鬆。
+ 在團隊或成本中心層級標記，而不是每位使用者。
+ 對於未建立其他設定檔的每個使用者成本屬性，請使用 [IAM 主體屬性](cost-mgmt-iam-principal-tracking.md)。IAM 主體追蹤會在身分層級自動與應用程式推論設定檔和屬性成本搭配使用。