

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 規劃您的部署
<a name="plan-your-deployment"></a>

本節說明規劃部署[的成本](cost.md)、[安全性](security-1.md)、[區域](#supported-aws-regions)和[配額](quotas.md)考量。

**重要**  
此解決方案利用 Amazon Bedrock 作為存取 AI 產生模型的主要服務。您必須先請求存取模型，才能在解決方案中使用模型。如需詳細資訊，請參閱《*Amazon Bedrock 使用者指南*》中的[模型存取](https://docs.aws.amazon.com/bedrock/latest/userguide/model-access.html)。

## 支援的 AWS 區域
<a name="supported-aws-regions"></a>

**重要**  
此解決方案可選擇性地使用 Amazon Bedrock 和 Amazon Kendra 服務，但目前尚未在所有 AWS 區域提供。您必須在提供這些服務的 AWS 區域中啟動此解決方案。如需各區域 AWS 服務的最新可用性，請參閱 [AWS 區域服務清單](https://aws.amazon.com/about-aws/global-infrastructure/regional-product-services/)。

下列 AWS 區域支援 AWS 上的生成式 AI 應用程式建置器：


| 區域名稱 |  | 
| --- | --- | 
|  美國東部 (俄亥俄)  |  加拿大 (中部)  | 
|  美國東部 (維吉尼亞北部)  |  歐洲 (法蘭克福)  | 
|  美國西部 (加利佛尼亞北部)  |  歐洲 (愛爾蘭)  | 
|  美國西部 (奧勒岡)  |  歐洲 (倫敦)  | 
|  亞太地區 (孟買)  |  歐洲 (米蘭)  | 
|  亞太地區 (首爾)  |  Europe (Paris)  | 
|  亞太地區 (新加坡)  |  歐洲 (斯德哥爾摩)  | 
|  亞太地區 (悉尼)  |  Middle East (Bahrain)  | 
|  亞太地區 (東京)  |  南美洲 (聖保羅)  | 

**注意**  
如果在部署中使用在 AWS 外部存取的基礎模型，請洽詢模型提供者其 APIs 可使用的區域。如果其 APIs僅適用於某些區域，您可能會遇到高延遲或甚至逾時形式的不穩定。與您組織的法務和合規團隊進行檢查，以評估資料跨區域界限的考量也很重要。

# Cost
<a name="cost"></a>

使用此 AWS 解決方案，您只需為使用的資源付費，而且沒有最低費用或設定費用。使用者支付用於啟動生成式 AI 使用案例的儀表板，以及部署的任何使用案例的費用。部署的使用案例成本取決於組態。範例組態：

1. 簡單的部署儀表板，每月大約 20 USD。

1. 一種簡單的生產就緒聊天機器人使用案例，使用執行於美國東部 （維吉尼亞北部） 的預設設定進行部署，由 Amazon Bedrock 提供支援，無法存取文件，每月大約 200 USD。

1. Amazon VPC 使用案例中的擴展系統，每天支援 8，000 個查詢，超過數萬份文件，每月約 1，500 USD。使用案例的成本會根據組態而有所不同，例如不同模型提供者的文字使用案例、是否啟用擷取增強生成 (RAG)，以此類推。


| 工作負載說明 | 預估成本 （美元/月） | 
| --- | --- | 
|   [部署儀表板的範例成本](#sample-deployment-dashboard-cost)   |  每月 20 美元  | 
|   [文字型概念驗證的範例成本](#sample-costs-for-a-text-based-proof-of-concept)  （包括部署儀表板和 1 個文字使用案例，每天約 100 個互動）  |  每月 40 美元  | 
|   [高可擴展性生成式 AI 查詢引擎的範例成本](#sample-costs-for-a-highly-scalable-generative-ai-query-engine)  （包括部署儀表板、1 個文字使用案例，以及 RAG 的 Amazon Kendra 索引，每天最多 100K份具有 \$18K 個查詢的文件，且[已啟用 VPC](#incremental-cost-of-enabling-amazon-vpc-for-a-use-case)   |  每月 1，500 美元  | 
|   [代理程式型概念驗證的範例成本](#sample-costs-for-an-agent-based-proof-of-concept)  （包括部署儀表板、1 個已啟用 Amazon Bedrock 知識庫和 Amazon Bedrock 護欄的 Bedrock 代理程式使用案例、每天約 100 個互動）  |  每月 840 美元  | 
|   [MCP 伺服器的範例成本](#sample-costs-for-mcp-server)  （包括部署儀表板、1 個具有 Lambda 整合閘道方法的 MCP 伺服器使用案例、每天約 100 個工具調用）  |  每月 22 美元  | 
|   [客服人員建置器的範例成本](#sample-costs-for-agent-builder)  （包括部署儀表板、1 個啟用 MCP 整合和長期記憶體的客服人員建置器使用案例、每天約 100 個互動）  |  每月 55 美元  | 
|   [工作流程建置器的範例成本](#sample-costs-for-workflow-builder)  （包括部署儀表板、具有 3 個客服人員建置器代理程式的 1 個工作流程、每天約 100 個互動）  |  每月 109 美元  | 

**重要**  
這些範例僅用於協助您預估特定工作負載的成本。使用不同的 LLMs、組態或 AWS 服務可以變更您的成本 （例如，無伺服器/隨需計費與佈建/定時計費）。若要管理成本，建議您透過 [AWS Cost Explorer](https://aws.amazon.com/aws-cost-management/aws-cost-explorer/) [建立預算](https://docs.aws.amazon.com/cost-management/latest/userguide/budgets-create.html)。價格可能變動。如需完整詳細資訊，請參閱此解決方案中使用的每個 AWS 服務的定價網頁。

## 執行部署儀表板的範例成本
<a name="sample-deployment-dashboard-cost"></a>

下表提供一個月美國東部 （維吉尼亞北部） 區域中具有預設參數和 100 個作用中使用者之部署儀表板的成本明細，約每月 20 美元。


| AWS 服務 | 維度 | 成本 【美元】 | 
| --- | --- | --- | 
|  API Gateway、DynamoDB、CloudFront、Amazon S3、Lambda、Systems Manager 參數存放區  |  每月 5，000 個 512 KB REST API 呼叫，未啟用快取  |  1.97 美元  | 
|  Amazon Cognito  |  每月 100 個啟用進階安全功能且沒有透過 SAML 或 OIDC 聯合身分登入的使用者  |  5.55 美元  | 
|  AWS WAF  |  跨 1 個 Web ACL 和 7 個定義規則的 10，000 個 Web 請求，而沒有任何規則群組  |  12.60 美元  | 
|  部署儀表板總成本  |  |   **20.12 美元**   | 

## 文字型概念驗證的範例成本
<a name="sample-costs-for-a-text-based-proof-of-concept"></a>

部署儀表板可以在指定時間部署許多使用案例。下表顯示使用 LLM 每天執行 100 個查詢的 1 個商業使用者在沒有 RAG 的情況下部署的使用案例的成本明細。查詢會以 WebSocket 上的文字訊息傳送，回應會以字符的形式串流回，並假設已啟用串流。使用 Amazon Bedrock Nova Pro 模型，執行此使用案例的成本約為每月 20 美元。


| AWS 服務 | 維度 | 成本 【美元】 | 
| --- | --- | --- | 
|  API Gateway (WebSocket)、CloudFront、Lambda、Amazon S3、AWS Systems Manager 參數存放區  |  每天 100 次聊天互動。每個訊息的平均訊息大小為 32 KB，每個連線為 5 分鐘。  |  0.61 美元  | 
|  CloudWatch  |  在 上使用詳細模式的 1.5 GB CloudWatch 日誌進行實驗  |  7.23 美元  | 
|  Amazon DynamoDB  |  對話歷史記錄表、1 GB 儲存體 LLM 組態資料表、1 GB 儲存體  |  3.05 美元  | 
|   **使用案例成本的小計 （不包括 LLMs)**   |  |   **10.89 美元**   | 
|  Amazon Bedrock (Nova Pro)  |  每天 100 次互動的假設： \$1 每天 190K個輸入字符的每月成本 = \$10.152 × 30 \$1 每天 16K個輸出字符的每月成本 = \$10.0512 × 30  |  6.10 美元  | 
|   **Amazon Bedrock (Nova Pro) 的應用程式總成本**   |   **10.89 美元 （使用案例成本） \$1 6.10 美元 (Amazon Bedrock 成本）**   |   **17.00 美元**   | 

**注意**  
這些預估值不包含對 AWS 網路外部服務進行的推論呼叫成本。如果您未使用 AWS 模型提供者，請參閱 LLM 提供者的定價指南。  
如需 AWS 服務的定價指南，請參閱：[Amazon Bedrock 定價](https://aws.amazon.com/bedrock/pricing/)和 [Amazon SageMaker AI 定價](https://aws.amazon.com/sagemaker/pricing/)。

## 高可擴展性生成式 AI 查詢引擎的範例成本
<a name="sample-costs-for-a-highly-scalable-generative-ai-query-engine"></a>

下表提供啟用 RAG 的使用案例的成本明細，並以 Amazon Bedrock 的 Nova Pro 模型做為 LLM。新增 Bedrock 知識庫時，此使用案例的費用約為每月 1300 美元


| AWS 服務 | 維度 | 成本 【美元】 | 
| --- | --- | --- | 
|  API Gateway (WebSocket)  |  每天 8000 次聊天互動。每個訊息的平均訊息大小為 32 KB，每個連線為 5 分鐘。  |  38.89 美元  | 
|  CloudFront  |  每月 240，000 個請求，100 GB 資料傳輸到網際網路，1 GB 資料傳輸到原始伺服器  |  8.76 美元  | 
|  Amazon Bedrock (Nova Pro)  |  假設： 輸入字符 = promptTemplate (400) \$1 內容 (400)\$1 chatHistory (1080) \$1 查詢 輸入字符 (20)= 1，900 輸出字符 = 160 （平均） 每天有 8，000 筆交易， 每日輸入字符成本 (1，900 x 8，000 = 15，200，000 個字符 x 每個字符 0.0008/1000 價格） 每日輸出權杖成本 (160 x 8，000 = 1，280，000 個權杖 x 每個權杖 0.0032/1000 價格） 每月成本 ((\$112.16 \$1 \$14.10) x 30)  |  487.80 美元  | 
|  CloudWatch  |  使用 5 GB 資料擷取日誌和 1 個儀表板的 24 個指標  |  9.72 美元  | 
|  DynamoDB  |  DynamoDB 資料表可追蹤每個記錄的對話歷史記錄，每天最多 1 KB 資料、8，000 次讀取和寫入  |  11.70 美元  | 
|  Lambda  |  容器大小 - 128 MB、512 MB 暫時性 儲存，2 個用於授權的 Lambda 函數 容器大小 - 256 MB、512 MB 暫時性儲存、每秒 5 個請求與 20 秒平均運算時間  |  20.89 美元  | 
|   **總使用案例成本**   |  |   **每月 577.76 美元 \$1 知識庫成本 （請參閱下文）**   | 

**注意**  
對 AWS 網路外的任何服務發出的 API 呼叫成本不包含在這些預估值中。如果未使用 Amazon Bedrock，請參閱 LLM 供應商的定價指南。

## 新增知識庫的成本
<a name="cost-of-adding-a-knowledge-base"></a>

知識庫成本會根據使用的知識庫類型，以及 （在 Bedrock 的情況下） 知識庫使用的後端向量存放區而有所不同。佈建和管理知識庫不在解決方案的範圍內。

 **Amazon Bedrock 知識庫** 

解決方案不會管理或佈建任何與 Amazon Bedrock 知識庫相關的資源。Amazon Bedrock 使用知識庫功能本身不會產生費用，但每次查詢使用案例所使用的內嵌模型，都會向您收取費用。此外，您知識庫的後端向量存放區 （例如，[Amazon OpenSearch Service](https://aws.amazon.com/opensearch-service) 中的索引，或 Amazon Relational Database Service 內的資料庫） 將產生無法在此處提供或計算的相關費用。

對於上述高度可擴展的生成式 AI 查詢引擎案例，此服務呼叫 Amazon Bedrock 內嵌模型所產生的成本如下：


| AWS 服務 | 維度 | 成本 【美元】 | 
| --- | --- | --- | 
|  Amazon Bedrock (Amazon Titan Text Embeddings V2)  |  每天 8，000 個查詢，每個查詢 1，900 個輸入字符 = 15，200，000 個字符 = 每天 0.30 USD。 每日成本 x 30 天 = 每月成本 9.00 USD  |  9.00 美元  | 
|  Amazon OpenSearch Service (Serverless) 範例用量  |  使用 4 x OpenSearch 運算單位 (OCU) 的基本無伺服器組態 （最低計費） = 每天 23.04 USD 每日費用 x 30 天 = 691.20 USD  這可提供粗略的預估，因為某些工作負載將需要更多 OCUs，而具有現有佈建 OpenSearch 資源的客戶將在此產生較低的成本。   |  691.20 美元  | 
|   **總額外成本**   |  |  700.20 美元  | 

 **Amazon Kendra** 

解決方案可以為您佈建 Kendra 索引，也可以自備。執行適用於上述高可擴展性生成式 AI 查詢引擎的組態的成本如下：


| AWS 服務 | 維度 | 成本 【美元】 | 
| --- | --- | --- | 
|  Amazon Kendra  |  每天 0-8，000 個查詢，以及最多 100，000 個具有 0-50 個資料來源的 Amazon Kendra Enterprise Edition 文件  |  1，008.00 美元  | 

**注意**  
您可以在使用案例之間共用 Amazon Kendra 索引，但這可能會增加每個索引的查詢數量。如果這不屬於 Amazon Kendra Enterprise Edition，則會收取額外費用。

## 為使用案例啟用 Amazon VPC 的成本增加
<a name="incremental-cost-of-enabling-amazon-vpc-for-a-use-case"></a>

下表提供在兩個 AZs 中部署的使用案例啟用 Amazon VPC 的成本明細。


| AWS 服務 | 維度 | 成本 【美元】 | 
| --- | --- | --- | 
|  Amazon NAT 閘道  |  假設：2 個可用區域部署，每個可用區域都有 NAT Gateway。透過 NAT Gateway 處理的 100 GB 資料 730 小時，每月處理 100 GB 資料  |  74.70 美元  | 
|  AWS PrivateLink (VPC 端點）  |  假設：2 個 AZ 部署，每個 AZ 具有 1 個私有子網路，1 個 VPC 端點具有 2 個彈性網路介面 (ENIs)。 6 個 VPC 端點，每個 VPC 端點 2 ENIs，730 小時，每月處理 1，024 GB 的資料  |  97.84 美元  | 
|  公有 IPv4 地址  |  假設：2 個可用區域部署，每個可用區域 1 個公有子網路，每個公有子網路都有 NAT Gateway。每個使用 1 個作用中公有 IPv4 設定的 NAT 閘道。 2 個作用中公有 IPv4 地址 x 每月 730 小時 x 0.005 美元每小時費用 = 7.3 美元  |  7.30 美元  | 
|  額外費用 （適用於 Amazon VPC)  |  |   **179.93 美元**   | 

## 使用佈建輸送量的成本影響
<a name="cost-implications-when-using-provisioned-throughput"></a>

佈建輸送量成本會根據您已佈建的模型類型和承諾期間，以及承諾期間選取的模型單位而有所不同。使用佈建輸送量會產生額外費用。

如需詳細資訊和up-to-date定價，請參閱 [Bedrock 定價](https://aws.amazon.com/bedrock/pricing/)。

## 使用跨區域推論的成本
<a name="cost-for-using-cross-region-inference"></a>

使用[跨區域推論](https://docs.aws.amazon.com/bedrock/latest/userguide/cross-region-inference.html)的路由或資料傳輸無需額外費用。您為模型支付的價格與來源或主要區域中的模型相同。

## 代理程式型概念驗證的範例成本
<a name="sample-costs-for-an-agent-based-proof-of-concept"></a>

當您使用 Amazon Bedrock 代理程式時，系統會根據包含代理程式的元件向您收費，例如後端模型和知識庫 （如果已啟用 RAG)，以及您新增的其他功能。下表顯示使用隨需 Claude 3.5 Sonnet 模型、Amazon Bedrock 知識庫和 Amazon Bedrock 護欄設定的 Bedrock 代理程式使用案例的成本明細。

與[新增 Amazon Bedrock 知識庫的成本](#cost-of-adding-a-knowledge-base)類似，此解決方案不會管理或佈建與 Amazon Bedrock 代理程式相關的資源。此解決方案也不會產生使用 Amazon Bedrock 知識庫的成本，但會產生下列成本：
+ 針對傳送給它的每個查詢使用內嵌模型
+ 知識庫的後端向量存放區 （例如，Amazon OpenSearch Service 中的索引，或 Amazon RDS 內的資料庫）

下表假設每天有 100 個互動，每個查詢有 1，900 個輸入字符和 160 個輸出字符。

**注意**  
對於此範例 Bedrock 代理程式使用案例，如果有設定為使用外部 API 的動作群組，則這些成本會是額外的。它們超出此資料表中計算的範圍。


| AWS 服務 | 維度 | 成本 【美元】 | 
| --- | --- | --- | 
|  API Gateway (WebSocket)、CloudFront、Lambda、Amazon S3、Systems Manager 參數存放區  |  每天 100 次聊天互動，每則訊息平均大小 32 KB，每條連線 5 分鐘  |  0.61 美元  | 
|  CloudWatch  |  在 上使用詳細模式的 1.5 GB CloudWatch Logs 進行實驗  |  7.23 美元  | 
|  DynamoDB  |  1KB 記錄大小和 1 GB 儲存體的 LLM 組態資料表  |  0.25 美元  | 
|   **成本小計 （不包括 LLMs)**   |  |   **8.09 美元**   | 
|  Anthropic Claude 3.5 Sonnet  |  \$1 每天 190K個輸入字符的每日成本 (0.003/1，000 個字符） = 0.57 美元 \$1 每日成本 × 30 天 = 17.10 美元 \$1 每天 16K 個輸出字符的每日成本 (0.015/1，000 個字符） = 0.24 美元 \$1 每日成本 × 30 天 = 7.20 美元  |  24.30 美元  | 
|  適用於 Amazon Bedrock 知識庫的 Amazon Bedrock (Amazon Titan Text Embeddings V2)  |  每天 190K個輸入字符的每日成本 (0.00002/1000 字符） = 0.004 每日成本 × 30 天 = 0.12 美元  |  0.12 美元  | 
|  Amazon OpenSearch Service (Serverless) 範例用量  |  使用 4 × OpenSearch 運算單位 (OCU) 的基本無伺服器組態 （最低計費） = 每天 23.04 美元 每日成本 × 30 天 = 691.20 美元  |  691.20 美元  | 
|  Amazon Bedrock 防護機制  |  190K 權杖大約等同於 760K (190，000 × 4) 字元和 3，800 個文字單位 (760K 字元/200) 考慮使用內容篩選條件、個人身分識別資訊 (PII) 篩選條件、敏感資訊篩選條件 （規則表達式） 和單字篩選條件設定的護欄 每日內容篩選條件成本 (0.75/1000 文字單位） \$1 PII 篩選條件成本 (0.1/1000 文字單位） \$1 敏感資訊篩選條件 (regex) \$1 文字篩選條件 = \$12.85 \$1 \$10.38 \$1 \$10 \$1 \$10 每月成本 = 每日成本 × 30 天 = 96.90 美元  |  96.90 美元  | 
|   **Anthropic Claude 3.5 Sonnet 支援的代理程式應用程式總成本**   |   *\$18.09 （使用案例成本） \$1* **\$1812.52 （其他代理程式組態）**   |  820.61 美元  | 

**注意**  
如果您未使用 AWS 模型提供者，請參閱 LLM 提供者的定價指南。如需 AWS 服務的定價指南，請參閱：[Amazon Bedrock 定價](https://aws.amazon.com/bedrock/pricing/)和 [Amazon SageMaker AI 定價](https://aws.amazon.com/sagemaker/pricing/)。

## MCP 伺服器的範例成本
<a name="sample-costs-for-mcp-server"></a>

MCP 伺服器使用案例可在 Amazon Bedrock AgentCore 上部署和管理模型內容通訊協定伺服器。下表顯示使用 Gateway 方法來包裝現有 Lambda 函數的 MCP Server 使用案例的成本明細。

解決方案會管理 AgentCore Gateway 部署和組態。您需要支付以下費用：
+ 基礎設施成本 (API Gateway、Lambda、DynamoDB、CloudWatch、S3)
+ AgentCore Gateway 使用量 （每個工具調用）
+ Lambda 函數執行成本 （適用於具有 Lambda 目標的閘道方法）
+ 外部 API 成本 （適用於具有 API 或 MCP 伺服器目標的閘道方法，如適用）


| 項目 | 計算 | Cost | 
| --- | --- | --- | 
|  Amazon API Gateway (REST API)  |  每天 100 個工具呼叫 × 30 天 = 每月 3，000 個請求  |  0.05 USD  | 
|  AWS Lambda （協同運作）  |  每天 100 次叫用 × 30 天 × 1 秒平均 × 512 MB = 每月 3，000 GB-秒  |  0.05 USD  | 
|  Amazon DynamoDB  |  每月 3，000 個讀取/寫入請求 \$1 1 GB 儲存  |  0.15 美元  | 
|  Amazon CloudWatch  |  3，000 個調用的標準監控和記錄  |  1.00 美元  | 
|  Amazon S3  |  組態儲存和日誌 （最低用量）  |  0.25 美元  | 
|  Amazon Bedrock AgentCore Gateway  |  每月 3，000 個工具叫用  |  0.05 USD  | 
|  目標 Lambda 函數  |  每天 100 次叫用 × 30 天 × 0.5 秒 × 128 MB = 每月 1，500 GB 秒  |  0.25 美元  | 
|   **每月成本總計**   |   *1.75 美元 （基礎設施） \$1 0.05 美元 (AgentCore Gateway)*   |  1.80 美元  | 

**注意**  
成本會根據部署方法 （閘道與執行時間）、目標類型和用量模式而有所不同。執行期方法部署會產生 AgentCore 執行期費用，而不是 Gateway 費用。外部 API 成本和自訂容器託管成本是額外的。

## 客服人員建置器的範例成本
<a name="sample-costs-for-agent-builder"></a>

Agent Builder 可讓您在 Amazon Bedrock AgentCore 上建立和部署自訂代理程式。下表顯示使用 Claude 3.5 Sonnet、MCP 伺服器整合和啟用長期記憶體設定的 Agent Builder 使用案例的成本明細。

解決方案會管理 AgentCore 執行期部署和組態。您需要支付以下費用：
+ 基礎設施成本 (API Gateway、Lambda、DynamoDB、CloudWatch、S3)
+ AgentCore 執行期耗用 （根據實際代理程式執行時間的 CPU 和記憶體時數）
+ 基礎模型推論 （輸入和輸出字符）
+ AgentCore 記憶體 （短期事件和長期儲存/擷取）

下表假設每天有 100 個互動，每個查詢有 1，900 個輸入字符和 160 個輸出字符，每個互動的平均客服人員執行時間為 5 秒。


| AWS 服務 | 維度 | 成本 【美元】 | 
| --- | --- | --- | 
|  API Gateway (WebSocket)、CloudFront、Lambda、Amazon S3、Systems Manager 參數存放區  |  每天 100 次聊天互動，平均訊息大小每則訊息 32 KB，每則連線 5 分鐘  |  0.61 美元  | 
|  CloudWatch  |  在 上使用詳細模式的 1.5 GB CloudWatch Logs 進行實驗  |  7.23 美元  | 
|  DynamoDB  |  1KB 記錄大小和 1 GB 儲存體的 LLM 組態資料表  |  0.25 美元  | 
|   **基礎設施成本的小計**   |  |   **8.09 美元**   | 
|  Amazon Bedrock AgentCore 執行期  |  \$1 CPU：1 個 vCPU × 5 秒 × 100 個互動 = 125 個 vCPU-秒/天 = 0.140 個 vCPU-小時/天 \$1 每日成本：0.140 × \$10.0895 = \$10.013 \$1 每月成本：\$10.013 × 30 = \$10.38 \$1 記憶體：512 MB (0.5 GB) × 5 秒 × 100 次互動 = 250 GB-秒/天 = 0.069 GB-小時/天 \$1 每日成本：0.069 × \$10.00945 = \$10.0007 \$1 每月成本：\$10.0007 × 30 = \$10.02  |  0.40 美元  | 
|  Anthropic Claude 3.5 Sonnet  |  \$1 每天 190K個輸入字符的每日成本 (0.003/1，000 個字符） = \$10.57 \$1 每日成本 × 30 天 = \$117.10 \$1 每天 16K000 個輸出字符的每日成本 (0.015/1，000 個字符） = \$10.24 \$1 每日成本 × 30 天 = \$17.20  |  24.30 美元  | 
|  Amazon Bedrock AgentCore 記憶體  |  \$1 短期記憶體：100 個新事件/天 × 0.25/1，000 美元事件 = 0.025 美元/天 \$1 每月成本：0.025 美元 × 30 = 0.75 美元 \$1 長期記憶體儲存 （內建策略）：100 筆記錄 × \$10.75/1，000 筆記錄/月 = \$10.075/月 \$1 長期記憶體擷取：100 次擷取/天 × 0.50 美元/1，000 次擷取 = 0.05 美元/天 \$1 每月成本：0.05 美元 × 30 = 1.50 美元  |  2.33 美元  | 
|   **搭配 Claude 3.5 Sonnet 的 Agent Builder 應用程式總成本**   |   *\$18.09 （基礎設施） \$1 \$10.40 (AgentCore 執行期） \$1 \$124.30 （模型） \$1 \$12.33 （記憶體）*   |   **35.12 美元**   | 

**注意**  
AgentCore 執行期定價以耗用量為基礎。實際成本取決於：  
代理程式執行時間 （作用中處理期間的 CPU 和記憶體用量）
互動次數及其複雜性
MCP 工具用量 （用於工具執行的額外 CPU/記憶體）
記憶體組態 （啟用短期與長期記憶體）
如需 AgentCore 定價的詳細資訊，請參閱 [Amazon Bedrock 定價](https://aws.amazon.com/bedrock/agentcore/pricing/)。

**注意**  
如果使用叫用外部 APIs或服務的 MCP 伺服器，則這些成本是額外成本，且超出此計算的範圍。同樣地，如果使用 AgentCore 瀏覽器或 Code Interpreter 工具，每 vCPU 小時收費 0.0895 美元，每 GB 小時收費 0.00945 美元。

## 工作流程建置器的範例成本
<a name="sample-costs-for-workflow-builder"></a>

工作流程建置器會建立協調多個客服人員建置器客服人員的主管客服人員。下表顯示具有 1 個主管代理程式和 3 個專業代理程式建置器代理程式的工作流程的成本明細，所有設定都已啟用 Claude 3.5 Sonnet 和長期記憶體。

假設：每天 100 次互動，每次互動平均 2 次客服人員委派，每個客服人員 5 秒執行時間。


| AWS 服務 | 維度 | 成本 【美元】 | 
| --- | --- | --- | 
|  API Gateway (WebSocket)、CloudFront、Lambda、Amazon S3、Systems Manager 參數存放區  |  每天 100 次聊天互動，平均訊息大小每則訊息 32 KB，每則連線 5 分鐘  |  0.61 美元  | 
|  CloudWatch  |  在 上使用詳細模式的 1.5 GB CloudWatch Logs 進行實驗  |  7.23 美元  | 
|  DynamoDB  |  1KB 記錄大小和 1 GB 儲存體的 LLM 組態資料表  |  0.25 美元  | 
|   **基礎設施成本的小計**   |  |   **8.09 美元**   | 
|  Amazon Bedrock AgentCore 執行期 （主管代理程式）  |  \$1 CPU：1 個 vCPU × 5 秒 × 100 個互動 = 0.140 個 vCPU 小時/天 × 30 = \$10.38 \$1 記憶體：0.5 GB × 5 秒 × 100 個互動 = 0.069 GB 小時/天 × 30 = \$10.02  |  0.40 美元  | 
|  Amazon Bedrock AgentCore 執行期 (3 個專用代理程式）  |  \$1 平均每次互動 2 次委派 = 200 次客服人員執行/天 \$1 CPU：1 次 vCPU × 5 秒 × 200 = 0.278 次 vCPU-小時/天 × 30 = \$10.75 \$1 記憶體：0.5 GB × 5 秒 × 200 = 0.139 GB-小時/天 × 30 = \$10.04  |  0.79 美元  | 
|  Anthropic Claude 3.5 Sonnet （主管代理程式）  |  \$1 輸入：190K 權杖/天 × \$10.003/1K = \$10.57/天 × 30 = \$117.10 \$1 輸出：16K 權杖/天 × \$10.015/1K = \$10.24/天 × 30 = \$17.20  |  24.30 美元  | 
|  Anthropic Claude 3.5 Sonnet （專用代理程式）  |  \$1 每次互動平均 2 次委派 \$1 輸入：380K 權杖/天 × 0.003/1K = 1.14 美元/天 × 30 = 34.20 美元 \$1 輸出：32K 權杖/天 × 0.015/1K = 0.48 美元/天 × 30 = 14.40 美元  |  48.60 美元  | 
|  Amazon Bedrock AgentCore 記憶體 （主管代理程式）  |  \$1 短期：100 個事件/天 × \$10.25/1K × 30 = \$10.75 \$1 長期儲存：100 個記錄 × \$10.75/1K = \$10.08 \$1 長期擷取：100 個擷取/天 × \$10.50/1K × 30 = \$11.50  |  2.33 美元  | 
|  Amazon Bedrock AgentCore 記憶體 （專用代理程式）  |  \$1 短期：200 個事件/天 × \$10.25/1K × 30 = \$11.50 \$1 長期儲存：200 個記錄 × \$10.75/1K = \$10.15 \$1 長期擷取：200 個擷取/天 × \$10.50/1K × 30 = \$13.00  |  4.65 美元  | 
|   **具有 3 個代理程式之工作流程建置器的應用程式總成本**   |   *\$18.09 （基礎設施） \$1 \$11.19 (AgentCore 執行期） \$1 \$172.90 （模型） \$1 \$16.98 （記憶體）*   |   **89.16 美元**   | 

**注意**  
較高的委派率會按比例增加字符消耗
如需 AgentCore 定價的詳細資訊，請參閱 [Amazon Bedrock 定價](https://aws.amazon.com/bedrock/pricing/)。

# 安全
<a name="security-1"></a>

當您在 AWS 基礎設施上建置系統時，安全責任將由您與 AWS 共同承擔。此[共同責任模型](https://aws.amazon.com/compliance/shared-responsibility-model/)可減輕您的營運負擔，因為 AWS 會操作、管理和控制元件，包括主機作業系統、虛擬化層，以及服務營運所在設施的實體安全性。如需 AWS 安全性的詳細資訊，請造訪 [AWS Cloud Security](https://aws.amazon.com/security/)。

## 在 Amazon Bedrock 上使用基礎模型
<a name="using-third-party-models-on-amazon-bedrock"></a>

Amazon Bedrock 託管從 Amazon Nova 模型到其他主要基礎模型 (FMs) 的一系列模型。使用 Amazon Bedrock 時，所有模型都會託管在 AWS 基礎設施中。這表示使用 Amazon Bedrock 做為 LLM 提供者時，所有推論請求都會保留在 AWS 網路中，網路流量也不會離開您的區域。

**注意**  
透過 Amazon Bedrock 提供的所有基礎模型 (FMs) 都直接託管在 AWS 管理和擁有的 AWS 基礎設施上。模型提供者無法存取客戶資料，例如提示和接續，或 Amazon Bedrock 服務日誌。如需有關 Amazon Bedrock 安全狀態的其他資訊，請參閱《[Amazon Bedrock 使用者指南》中的 Amazon Bedrock 中的資料保護](https://docs.aws.amazon.com/bedrock/)。 **

## IAM 角色
<a name="iam-roles"></a>

IAM 角色可讓客戶將精細存取政策和許可指派給 AWS 雲端上的服務和使用者。此解決方案會建立 IAM 角色，授予解決方案的 Lambda 函數建立區域資源的存取權。

## CloudWatch Logs
<a name="cloudwatch-logs"></a>

您可以在使用部署儀表板模型選擇頁面，在其他設定下部署使用案例時啟用詳細模式。詳細模式可啟用詳細的 CloudWatch 日誌，有助於偵錯和快速實驗。

**注意**  
啟用詳細模式時，也會記錄從知識庫擷取的文件 （如果啟用 RAG) 和提示，其中可能包含敏感資訊。

# VPC
<a name="vpc"></a>

解決方案提供兩種 Amazon VPC 組態選項：

1. 讓解決方案為您建置 Amazon VPC。

1. 管理和攜帶您自己的 Amazon VPC 以在解決方案中使用。

## 讓解決方案為您建置 Amazon VPC
<a name="let-the-solution-build-an-amazon-vpc-for-you"></a>

如果您選擇讓解決方案建置 Amazon VPC 的選項，預設會部署為 2-AZ 架構，CIDR 範圍為 10.10.0.0/20。您可以選擇使用 [Amazon VPC IP Address Manager (IPAM)](https://docs.aws.amazon.com/vpc/latest/ipam/what-it-is-ipam.html)，在每個 AZ 中具有 1 個公有子網路和 1 個私有子網路。解決方案會在每個公有子網路中建立 NAT Gateway，並設定 Lambda 函數在私有子網路中建立 [ENIs](https://docs.aws.amazon.com/Lambda/latest/dg/foundation-networking.html)。此外，此組態會建立路由表及其項目、安全群組及其規則、網路 ACLs、VPC 端點 （閘道和介面端點）。

## 管理您自己的 Amazon VPC
<a name="managing-your-own-amazon-vpc"></a>

使用 Amazon VPC 部署解決方案時，您可以選擇在 AWS 帳戶和區域中使用現有的 Amazon VPC。我們建議您在至少兩個可用區域中提供 VPC，以確保高可用性。您的 VPC 也必須具有下列 VPC 端點，以及 VPC 和路由表組態的相關 IAM 政策。

### 對於部署儀表板 Amazon VPC
<a name="deployment-dashboard-2"></a>

1.  [DynamoDB 的閘道端點](https://docs.aws.amazon.com/vpc/latest/privatelink/vpc-endpoints-ddb.html)。

1.  [S3 的閘道端點](https://docs.aws.amazon.com/vpc/latest/privatelink/vpc-endpoints-s3.html)。

1.  [CloudWatch 的界面端點](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CloudWatch-logs-and-interface-VPC.html)。

1.  [AWS CloudFormation 的界面端點](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/cfn-vpce-bucketnames.html)。

### 對於使用案例 Amazon VPC
<a name="use-cases-2"></a>

1.  [DynamoDB 的閘道端點](https://docs.aws.amazon.com/vpc/latest/privatelink/vpc-endpoints-ddb.html)。

1.  [S3 的閘道端點](https://docs.aws.amazon.com/vpc/latest/privatelink/vpc-endpoints-s3.html)。

1.  [CloudWatch 的界面端點](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CloudWatch-logs-and-interface-VPC.html)。

1.  [Systems Manager 參數存放區的界面端點](https://docs.aws.amazon.com/systems-manager/latest/userguide/setup-create-vpc.html)。
**注意**  
解決方案只需要 `com.amazonaws.region.ssm`。

1.  [Amazon Bedrock 的界面端點 (bedrock-runtime、agent-runtime、bedrock-agent-runtime)](https://docs.aws.amazon.com/bedrock/latest/userguide/vpc-interface-endpoints.html)。

1. 選用：如果部署將使用 Amazon Kendra 作為知識庫，則需要 [Amazon Kendra 的介面端點](https://docs.aws.amazon.com/kendra/latest/dg/vpc-interface-endpoints.html)。

1. 選用：如果部署將使用 Amazon Bedrock 下的任何 LLM，則需要 [Amazon Bedrock 的介面端點](https://docs.aws.amazon.com/bedrock/latest/userguide/vpc-interface-endpoints.html)。
**注意**  
解決方案只需要 `com.amazonaws.region.bedrock-runtime`。

1. 選用：如果部署將針對 LLM 使用 Amazon SageMaker AI，則需要 [Amazon SageMaker AI 的介面端點](https://docs.aws.amazon.com/sagemaker/latest/dg/interface-vpc-endpoint.html)。

**注意**  
使用**自備 VPC 部署選項時，解決方案不會刪除或修改 VPC** 組態。不過，它會刪除解決方案在為我建立 VPCs選項中建立的任何 VPC。 ****因此，在堆疊/部署之間共用解決方案管理的 VPC 時，您必須小心。  
例如，部署 A 使用**為我建立 VPC** 選項。部署 B 使用使用部署 A 建立的 **VPC 自帶 VPC**。如果部署 A 在部署 B 之前遭到刪除，則部署 B 將無法再運作，因為已刪除 VPC。此外，由於部署 B 使用 Lambda 函數建立的 ENIs，刪除部署 A 可能會發生錯誤並保留剩餘資源。

# Amazon CloudFront
<a name="amazon-cloudfront"></a>

此解決方案會部署[託管](https://docs.aws.amazon.com/AmazonS3/latest/dev/WebsiteHosting.html)在 Amazon S3 儲存貯體中的 Web 主控台。為了協助減少延遲並改善安全性，此解決方案包含具有原始存取身分的 CloudFront 分佈，這是提供對解決方案網站儲存貯體內容公開存取的 CloudFront 使用者。如需詳細資訊，請參閱《Amazon CloudFront 開發人員指南》中的[使用原始存取身分限制對 Amazon S3 內容的存取](https://docs.aws.amazon.com/AmazonCloudFront/latest/DeveloperGuide/private-content-restricting-access-to-s3.html)。

**注意**  
CloudFront 的帳戶層級軟配額限制為 20 個回應標頭政策。基於安全考量，此解決方案會建立自訂回應標頭政策。如果您在 AWS 或其使用案例上有 20 個以上的生成式 AI 應用程式建置器部署，新部署可能會因為達到配額限制而失敗。

若要解決此問題，您可以依照下列步驟，在 AWS Service Quotas 主控台中請求增加**回應標頭政策**配額：

1. 開啟 AWS Service Quotas 主控台。

1. 在導覽窗格中，選擇 **AWS services** (AWS 服務)。

1. 搜尋並選取 **Amazon CloudFront**。

1. 捲動至**回應標頭政策**配額，然後選擇**請求配額增加**。

1. 按照提示請求提高 AWS 帳戶的配額限制。

透過增加**回應標頭政策**配額，您可以確保 AWS 上的生成式 AI 應用程式建置器或其使用案例的新部署不會因為配額限制而失敗。

# 配額
<a name="quotas"></a>

服務配額 (也稱為限制) 是您 AWS 帳戶的服務資源或操作數目最大值。

## 此解決方案中 AWS 服務的配額
<a name="quotas-for-aws-services-in-this-solution"></a>

請確定您為此[解決方案中實作的每個服務](architecture-details.md#aws-services-in-this-solution)有足夠的配額。如需詳細資訊，請參閱 [AWS 服務配額](https://docs.aws.amazon.com/general/latest/gr/aws_service_limits.html)。

使用以下連結前往該服務的 頁面。若要在不切換頁面的情況下檢視文件中所有 AWS 服務的服務配額，請改為檢視 PDF 中[服務端點和配額](https://docs.aws.amazon.com/general/latest/gr/aws-general.pdf#aws-service-information)頁面中的資訊。

## Amazon Bedrock AgentCore 配額
<a name="agentcore-quotas"></a>

對於 Agent Builder 部署，請注意下列 Amazon [Bedrock AgentCore 服務配額](https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/bedrock-agentcore-limits.html)：


| 配額 | 美國東部 (維吉尼亞北部) | 其他區域 | 
| --- | --- | --- | 
|  每個帳戶的作用中工作階段工作負載  |  1000  |  500  | 
|  每個帳戶的客服人員總數  |  1,000  |  1,000  | 
|  每個帳戶的版本  |  1,000  |  1,000  | 