

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 使用推論設定檔設定模型調用資源
<a name="inference-profiles"></a>

*推論設定檔*是 Amazon Bedrock 中的資源，可定義模型以及一或多個區域，而推論設定檔可將模型調用請求路由到這些區域。您可以針對下列任務使用推論設定檔：
+ **追蹤用量指標** – 設定 CloudWatch 日誌，並使用應用程式推論設定檔提交模型調用請求，以收集模型調用的用量指標。您可以在檢視推論設定檔的相關資訊時檢查這些指標，並使用它們來通知您的決策。如需有關如何設定 CloudWatch 日誌的詳細資訊，請參閱 [使用 CloudWatch Logs 和 Amazon S3 監控模型調用](model-invocation-logging.md)。
+ **使用標籤來監控成本** – 將標籤連接至應用程式推論設定檔，以便在提交隨需模型調用請求時追蹤成本。如需如何使用標籤進行成本分配的詳細資訊，請參閱《 AWS Billing 使用者指南》中的[使用成本分配標籤組織和追蹤 AWS 成本](https://docs.aws.amazon.com/awsaccountbilling/latest/aboutv2/cost-alloc-tags.html)。
+ **跨區域推論** – 使用包含多個 AWS 區域的推論設定檔來提高輸送量。推論設定檔會將模型調用請求分散到這些區域，以提高輸送量和效能。如需跨區域推論的詳細資訊，請參閱 [透過跨區域推論增加輸送量](cross-region-inference.md)。

Amazon Bedrock 提供下列類型的推論設定檔：
+ **跨區域 (系統定義) 推論設定檔** – 在 Amazon Bedrock 中預先定義的推論設定檔，並包含多個可路由模型請求的區域。
+ **應用程式推論設定檔** – 使用者為追蹤成本和模型用量而建立的推論設定檔。您可以建立推論設定檔，將模型調用請求路由到一個區域或多個區域：
  + 若要建立推論設定檔來追蹤某個區域中模型的成本和用量，請在您要推論設定檔路由請求的區域中指定基礎模型。
  + 若要建立追蹤跨多個區域之模型的成本和用量的推論設定檔，請指定跨區域 (系統定義) 推論設定檔，以定義您需要推論設定檔路由請求的模型和區域。

您可以使用推論設定檔搭配下列功能，將請求路由到多個區域，並追蹤使用這些功能發出的調用請求的用量和成本：
+ 模型推論 – 在 Amazon Bedrock 主控台的遊樂場中選擇推論設定檔，或在呼叫 [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html)、[InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html)、[Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html) 和 [ConverseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html) 操作時指定推論設定檔的 ARN，以在執行模型調用時使用推論設定檔。如需詳細資訊，請參閱[提出推論請求](inference.md)。
+ 知識庫向量內嵌和回應產生 – 在查詢知識庫或剖析資料來源中的非文字資訊之後產生回應時，使用推論設定檔。如需詳細資訊，請參閱[使用查詢和回應測試您的知識庫](knowledge-base-test.md)及[剖析資料來源的選項](kb-advanced-parsing.md)。
+ 模型評估 – 您可以提交推論設定檔作為模型，以在提交模型評估任務時進行評估。如需詳細資訊，請參閱[評估 Amazon Bedrock 資源的效能](evaluation.md)。
+ 提示管理 – 您可以在為提示管理中建立的提示產生回應時，使用推論設定檔。如需詳細資訊，請參閱[在 Amazon Bedrock 中使用提示管理來建構和存放可重複使用的提示](prompt-management.md)
+ 流程 – 您可以在為在流程中的提示節點中定義內嵌的提示產生回應時，使用推論設定檔。如需詳細資訊，請參閱[使用 Amazon Bedrock 流程建置端對端生成式 AI 工作流程](flows.md)。

使用推論設定檔的價格是根據您呼叫推論設定檔之區域中模型的價格來計算。如需定價的資訊，請參閱 [Amazon Bedrock 定價](https://aws.amazon.com/bedrock/pricing/)。

如需跨區域推論設定檔可提供之輸送量的詳細資訊，請參閱 [透過跨區域推論增加輸送量](cross-region-inference.md)。

**Topics**
+ [推論設定檔支援的區域和模型](inference-profiles-support.md)
+ [推論設定檔的必要條件](inference-profiles-prereq.md)
+ [建立應用程式推論設定檔](inference-profiles-create.md)
+ [修改應用程式推論設定檔的標籤](inference-profiles-modify.md)
+ [檢視推論設定檔的相關資訊](inference-profiles-view.md)
+ [在模型調用中使用推論設定檔](inference-profiles-use.md)
+ [刪除應用程式推論設定檔](inference-profiles-delete.md)