View a markdown version of this page

Cost - AWS 上的生成式 AI 應用程式建置器

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Cost

使用此 AWS 解決方案,您只需為使用的資源付費,而且沒有最低費用或設定費用。使用者支付用於啟動生成式 AI 使用案例的儀表板,以及部署的任何使用案例的費用。部署的使用案例成本取決於組態。範例組態:

  1. 簡單的部署儀表板,每月大約 20 USD。

  2. 一種簡單的生產就緒聊天機器人使用案例,使用執行於美國東部 (維吉尼亞北部) 的預設設定進行部署,由 Amazon Bedrock 提供支援,無法存取文件,每月大約 200 USD。

  3. Amazon VPC 使用案例中的擴展系統,每天支援 8,000 個查詢,超過數萬份文件,每月約 1,500 USD。使用案例的成本會根據組態而有所不同,例如不同模型提供者的文字使用案例、是否啟用擷取增強生成 (RAG),以此類推。

工作負載說明 預估成本 (美元/月)

部署儀表板的範例成本

每月 20 美元

文字型概念驗證的範例成本

(包括部署儀表板和 1 個文字使用案例,每天約 100 個互動)

每月 40 美元

高可擴展性生成式 AI 查詢引擎的範例成本

(包括部署儀表板、1 個文字使用案例,以及 RAG 的 Amazon Kendra 索引,每天最多 100K份具有 ~8K 個查詢的文件,且已啟用 VPC

每月 1,500 美元

代理程式型概念驗證的範例成本

(包括部署儀表板、1 個已啟用 Amazon Bedrock 知識庫和 Amazon Bedrock 護欄的 Bedrock 代理程式使用案例、每天約 100 個互動)

每月 840 美元

MCP 伺服器的範例成本

(包括部署儀表板、1 個具有 Lambda 整合閘道方法的 MCP 伺服器使用案例、每天約 100 個工具調用)

每月 22 美元

客服人員建置器的範例成本

(包括部署儀表板、1 個啟用 MCP 整合和長期記憶體的客服人員建置器使用案例、每天約 100 個互動)

每月 55 美元

工作流程建置器的範例成本

(包括部署儀表板、具有 3 個客服人員建置器代理程式的 1 個工作流程、每天約 100 個互動)

每月 109 美元

重要

這些範例僅用於協助您預估特定工作負載的成本。使用不同的 LLMs、組態或 AWS 服務可以變更您的成本 (例如,無伺服器/隨需計費與佈建/定時計費)。若要管理成本,建議您透過 AWS Cost Explorer 建立預算。價格可能變動。如需完整詳細資訊,請參閱此解決方案中使用的每個 AWS 服務的定價網頁。

執行部署儀表板的範例成本

下表提供一個月美國東部 (維吉尼亞北部) 區域中具有預設參數和 100 個作用中使用者之部署儀表板的成本明細,約每月 20 美元。

AWS 服務 維度 成本 【美元】

API Gateway、DynamoDB、CloudFront、Amazon S3、Lambda、Systems Manager 參數存放區

每月 5,000 個 512 KB REST API 呼叫,未啟用快取

1.97 美元

Amazon Cognito

每月 100 個啟用進階安全功能且沒有透過 SAML 或 OIDC 聯合身分登入的使用者

5.55 美元

AWS WAF

跨 1 個 Web ACL 和 7 個定義規則的 10,000 個 Web 請求,而沒有任何規則群組

12.60 美元

部署儀表板總成本

20.12 美元

文字型概念驗證的範例成本

部署儀表板可以在指定時間部署許多使用案例。下表顯示使用 LLM 每天執行 100 個查詢的 1 個商業使用者在沒有 RAG 的情況下部署的使用案例的成本明細。查詢會以 WebSocket 上的文字訊息傳送,回應會以字符的形式串流回,並假設已啟用串流。使用 Amazon Bedrock Nova Pro 模型,執行此使用案例的成本約為每月 20 美元。

AWS 服務 維度 成本 【美元】

API Gateway (WebSocket)、CloudFront、Lambda、Amazon S3、AWS Systems Manager 參數存放區

每天 100 次聊天互動。每個訊息的平均訊息大小為 32 KB,每個連線為 5 分鐘。

0.61 美元

CloudWatch

在 上使用詳細模式的 1.5 GB CloudWatch 日誌進行實驗

7.23 美元

Amazon DynamoDB

對話歷史記錄表、1 GB 儲存體

LLM 組態資料表、1 GB 儲存體

3.05 美元

使用案例成本的小計 (不包括 LLMs)

10.89 美元

Amazon Bedrock (Nova Pro)

每天 100 次互動的假設:

* 每天 190K個輸入字符的每月成本 = $0.152 × 30 * 每天 16K個輸出字符的每月成本 = $0.0512 × 30

6.10 美元

Amazon Bedrock (Nova Pro) 的應用程式總成本

10.89 美元 (使用案例成本) + 6.10 美元 (Amazon Bedrock 成本)

17.00 美元

注意

這些預估值不包含對 AWS 網路外部服務進行的推論呼叫成本。如果您未使用 AWS 模型提供者,請參閱 LLM 提供者的定價指南。

如需 AWS 服務的定價指南,請參閱:Amazon Bedrock 定價Amazon SageMaker AI 定價

高可擴展性生成式 AI 查詢引擎的範例成本

下表提供啟用 RAG 的使用案例的成本明細,並以 Amazon Bedrock 的 Nova Pro 模型做為 LLM。新增 Bedrock 知識庫時,此使用案例的費用約為每月 1300 美元

AWS 服務 維度 成本 【美元】

API Gateway (WebSocket)

每天 8000 次聊天互動。每個訊息的平均訊息大小為 32 KB,每個連線為 5 分鐘。

38.89 美元

CloudFront

每月 240,000 個請求,100 GB 資料傳輸到網際網路,1 GB 資料傳輸到原始伺服器

8.76 美元

Amazon Bedrock (Nova Pro)

假設:

輸入字符 = promptTemplate (400) + 內容 (400)+ chatHistory (1080) + 查詢 輸入字符 (20)= 1,900

輸出字符 = 160 (平均)

每天有 8,000 筆交易,

每日輸入字符成本 (1,900 x 8,000 = 15,200,000 個字符 x 每個字符 0.0008/1000 價格)

每日輸出權杖成本 (160 x 8,000 = 1,280,000 個權杖 x 每個權杖 0.0032/1000 價格)

每月成本 (($12.16 + $4.10) x 30)

487.80 美元

CloudWatch

使用 5 GB 資料擷取日誌和 1 個儀表板的 24 個指標

9.72 美元

DynamoDB

DynamoDB 資料表可追蹤每個記錄的對話歷史記錄,每天最多 1 KB 資料、8,000 次讀取和寫入

11.70 美元

Lambda

容器大小 - 128 MB、512 MB 暫時性

儲存,2 個用於授權的 Lambda 函數

容器大小 - 256 MB、512 MB 暫時性儲存、每秒 5 個請求與 20 秒平均運算時間

20.89 美元

總使用案例成本

每月 577.76 美元 + 知識庫成本 (請參閱下文)

注意

對 AWS 網路外的任何服務發出的 API 呼叫成本不包含在這些預估值中。如果未使用 Amazon Bedrock,請參閱 LLM 供應商的定價指南。

新增知識庫的成本

知識庫成本會根據使用的知識庫類型,以及 (在 Bedrock 的情況下) 知識庫使用的後端向量存放區而有所不同。佈建和管理知識庫不在解決方案的範圍內。

Amazon Bedrock 知識庫

解決方案不會管理或佈建任何與 Amazon Bedrock 知識庫相關的資源。Amazon Bedrock 使用知識庫功能本身不會產生費用,但每次查詢使用案例所使用的內嵌模型,都會向您收取費用。此外,您知識庫的後端向量存放區 (例如,Amazon OpenSearch Service 中的索引,或 Amazon Relational Database Service 內的資料庫) 將產生無法在此處提供或計算的相關費用。

對於上述高度可擴展的生成式 AI 查詢引擎案例,此服務呼叫 Amazon Bedrock 內嵌模型所產生的成本如下:

AWS 服務 維度 成本 【美元】

Amazon Bedrock (Amazon Titan Text Embeddings V2)

每天 8,000 個查詢,每個查詢 1,900 個輸入字符 = 15,200,000 個字符 = 每天 0.30 USD。

每日成本 x 30 天 = 每月成本 9.00 USD

9.00 美元

Amazon OpenSearch Service (Serverless) 範例用量

使用 4 x OpenSearch 運算單位 (OCU) 的基本無伺服器組態 (最低計費) = 每天 23.04 USD

每日費用 x 30 天 = 691.20 USD

注意

這可提供粗略的預估,因為某些工作負載將需要更多 OCUs,而具有現有佈建 OpenSearch 資源的客戶將在此產生較低的成本。

691.20 美元

總額外成本

700.20 美元

Amazon Kendra

解決方案可以為您佈建 Kendra 索引,也可以自備。執行適用於上述高可擴展性生成式 AI 查詢引擎的組態的成本如下:

AWS 服務 維度 成本 【美元】

Amazon Kendra

每天 0-8,000 個查詢,以及最多 100,000 個具有 0-50 個資料來源的 Amazon Kendra Enterprise Edition 文件

1,008.00 美元

注意

您可以在使用案例之間共用 Amazon Kendra 索引,但這可能會增加每個索引的查詢數量。如果這不屬於 Amazon Kendra Enterprise Edition,則會收取額外費用。

為使用案例啟用 Amazon VPC 的成本增加

下表提供在兩個 AZs 中部署的使用案例啟用 Amazon VPC 的成本明細。

AWS 服務 維度 成本 【美元】

Amazon NAT 閘道

假設:2 個可用區域部署,每個可用區域都有 NAT Gateway。透過 NAT Gateway 處理的 100 GB 資料 730 小時,每月處理 100 GB 資料

74.70 美元

AWS PrivateLink (VPC 端點)

假設:2 個 AZ 部署,每個 AZ 具有 1 個私有子網路,1 個 VPC 端點具有 2 個彈性網路介面 (ENIs)。

6 個 VPC 端點,每個 VPC 端點 2 ENIs,730 小時,每月處理 1,024 GB 的資料

97.84 美元

公有 IPv4 地址

假設:2 個可用區域部署,每個可用區域 1 個公有子網路,每個公有子網路都有 NAT Gateway。每個使用 1 個作用中公有 IPv4 設定的 NAT 閘道。

2 個作用中公有 IPv4 地址 x 每月 730 小時 x 0.005 美元每小時費用 = 7.3 美元

7.30 美元

額外費用

(適用於 Amazon VPC)

179.93 美元

使用佈建輸送量的成本影響

佈建輸送量成本會根據您已佈建的模型類型和承諾期間,以及承諾期間選取的模型單位而有所不同。使用佈建輸送量會產生額外費用。

如需詳細資訊和up-to-date定價,請參閱 Bedrock 定價

使用跨區域推論的成本

使用跨區域推論的路由或資料傳輸無需額外費用。您為模型支付的價格與來源或主要區域中的模型相同。

代理程式型概念驗證的範例成本

當您使用 Amazon Bedrock 代理程式時,系統會根據包含代理程式的元件向您收費,例如後端模型和知識庫 (如果已啟用 RAG),以及您新增的其他功能。下表顯示使用隨需 Claude 3.5 Sonnet 模型、Amazon Bedrock 知識庫和 Amazon Bedrock 護欄設定的 Bedrock 代理程式使用案例的成本明細。

新增 Amazon Bedrock 知識庫的成本類似,此解決方案不會管理或佈建與 Amazon Bedrock 代理程式相關的資源。此解決方案也不會產生使用 Amazon Bedrock 知識庫的成本,但會產生下列成本:

  • 針對傳送給它的每個查詢使用內嵌模型

  • 知識庫的後端向量存放區 (例如,Amazon OpenSearch Service 中的索引,或 Amazon RDS 內的資料庫)

下表假設每天有 100 個互動,每個查詢有 1,900 個輸入字符和 160 個輸出字符。

注意

對於此範例 Bedrock 代理程式使用案例,如果有設定為使用外部 API 的動作群組,則這些成本會是額外的。它們超出此資料表中計算的範圍。

AWS 服務 維度 成本 【美元】

API Gateway (WebSocket)、CloudFront、Lambda、Amazon S3、Systems Manager 參數存放區

每天 100 次聊天互動,每則訊息平均大小 32 KB,每條連線 5 分鐘

0.61 美元

CloudWatch

在 上使用詳細模式的 1.5 GB CloudWatch Logs 進行實驗

7.23 美元

DynamoDB

1KB 記錄大小和 1 GB 儲存體的 LLM 組態資料表

0.25 美元

成本小計 (不包括 LLMs)

8.09 美元

Anthropic Claude 3.5 Sonnet

* 每天 190K個輸入字符的每日成本 (0.003/1,000 個字符) = 0.57 美元 +

每日成本 × 30 天 = 17.10 美元 * 每天 16K 個輸出字符的每日成本 (0.015/1,000 個字符) = 0.24 美元 +

每日成本 × 30 天 = 7.20 美元

24.30 美元

適用於 Amazon Bedrock 知識庫的 Amazon Bedrock (Amazon Titan Text Embeddings V2)

每天 190K個輸入字符的每日成本 (0.00002/1000 字符) = 0.004

每日成本 × 30 天 = 0.12 美元

0.12 美元

Amazon OpenSearch Service (Serverless) 範例用量

使用 4 × OpenSearch 運算單位 (OCU) 的基本無伺服器組態 (最低計費) = 每天 23.04 美元

每日成本 × 30 天 = 691.20 美元

691.20 美元

Amazon Bedrock 防護機制

190K 權杖大約等同於 760K (190,000 × 4) 字元和 3,800 個文字單位 (760K 字元/200)

考慮使用內容篩選條件、個人身分識別資訊 (PII) 篩選條件、敏感資訊篩選條件 (規則表達式) 和單字篩選條件設定的護欄

每日內容篩選條件成本 (0.75/1000 文字單位) + PII 篩選條件成本 (0.1/1000 文字單位) + 敏感資訊篩選條件 (regex) + 文字篩選條件 = $2.85 + $0.38 + $0 + $0

每月成本 = 每日成本 × 30 天 = 96.90 美元

96.90 美元

Anthropic Claude 3.5 Sonnet 支援的代理程式應用程式總成本

$8.09 (使用案例成本) + $812.52 (其他代理程式組態)

820.61 美元

注意

如果您未使用 AWS 模型提供者,請參閱 LLM 提供者的定價指南。如需 AWS 服務的定價指南,請參閱:Amazon Bedrock 定價Amazon SageMaker AI 定價

MCP 伺服器的範例成本

MCP 伺服器使用案例可在 Amazon Bedrock AgentCore 上部署和管理模型內容通訊協定伺服器。下表顯示使用 Gateway 方法來包裝現有 Lambda 函數的 MCP Server 使用案例的成本明細。

解決方案會管理 AgentCore Gateway 部署和組態。您需要支付以下費用:

  • 基礎設施成本 (API Gateway、Lambda、DynamoDB、CloudWatch、S3)

  • AgentCore Gateway 使用量 (每個工具調用)

  • Lambda 函數執行成本 (適用於具有 Lambda 目標的閘道方法)

  • 外部 API 成本 (適用於具有 API 或 MCP 伺服器目標的閘道方法,如適用)

項目 計算 Cost

Amazon API Gateway (REST API)

每天 100 個工具呼叫 × 30 天 = 每月 3,000 個請求

0.05 USD

AWS Lambda (協同運作)

每天 100 次叫用 × 30 天 × 1 秒平均 × 512 MB = 每月 3,000 GB-秒

0.05 USD

Amazon DynamoDB

每月 3,000 個讀取/寫入請求 + 1 GB 儲存

0.15 美元

Amazon CloudWatch

3,000 個調用的標準監控和記錄

1.00 美元

Amazon S3

組態儲存和日誌 (最低用量)

0.25 美元

Amazon Bedrock AgentCore Gateway

每月 3,000 個工具叫用

0.05 USD

目標 Lambda 函數

每天 100 次叫用 × 30 天 × 0.5 秒 × 128 MB = 每月 1,500 GB 秒

0.25 美元

每月成本總計

1.75 美元 (基礎設施) + 0.05 美元 (AgentCore Gateway)

1.80 美元

注意

成本會根據部署方法 (閘道與執行時間)、目標類型和用量模式而有所不同。執行期方法部署會產生 AgentCore 執行期費用,而不是 Gateway 費用。外部 API 成本和自訂容器託管成本是額外的。

客服人員建置器的範例成本

Agent Builder 可讓您在 Amazon Bedrock AgentCore 上建立和部署自訂代理程式。下表顯示使用 Claude 3.5 Sonnet、MCP 伺服器整合和啟用長期記憶體設定的 Agent Builder 使用案例的成本明細。

解決方案會管理 AgentCore 執行期部署和組態。您需要支付以下費用:

  • 基礎設施成本 (API Gateway、Lambda、DynamoDB、CloudWatch、S3)

  • AgentCore 執行期耗用 (根據實際代理程式執行時間的 CPU 和記憶體時數)

  • 基礎模型推論 (輸入和輸出字符)

  • AgentCore 記憶體 (短期事件和長期儲存/擷取)

下表假設每天有 100 個互動,每個查詢有 1,900 個輸入字符和 160 個輸出字符,每個互動的平均客服人員執行時間為 5 秒。

AWS 服務 維度 成本 【美元】

API Gateway (WebSocket)、CloudFront、Lambda、Amazon S3、Systems Manager 參數存放區

每天 100 次聊天互動,平均訊息大小每則訊息 32 KB,每則連線 5 分鐘

0.61 美元

CloudWatch

在 上使用詳細模式的 1.5 GB CloudWatch Logs 進行實驗

7.23 美元

DynamoDB

1KB 記錄大小和 1 GB 儲存體的 LLM 組態資料表

0.25 美元

基礎設施成本的小計

8.09 美元

Amazon Bedrock AgentCore 執行期

* CPU:1 個 vCPU × 5 秒 × 100 個互動 = 125 個 vCPU-秒/天 = 0.140 個 vCPU-小時/天 + 每日成本:0.140 × $0.0895 = $0.013 + 每月成本:$0.013 × 30 = $0.38

* 記憶體:512 MB (0.5 GB) × 5 秒 × 100 次互動 = 250 GB-秒/天 = 0.069 GB-小時/天 + 每日成本:0.069 × $0.00945 = $0.0007 + 每月成本:$0.0007 × 30 = $0.02

0.40 美元

Anthropic Claude 3.5 Sonnet

* 每天 190K個輸入字符的每日成本 (0.003/1,000 個字符) = $0.57 + 每日成本 × 30 天 = $17.10

* 每天 16K000 個輸出字符的每日成本 (0.015/1,000 個字符) = $0.24 + 每日成本 × 30 天 = $7.20

24.30 美元

Amazon Bedrock AgentCore 記憶體

* 短期記憶體:100 個新事件/天 × 0.25/1,000 美元事件 = 0.025 美元/天 + 每月成本:0.025 美元 × 30 = 0.75 美元

* 長期記憶體儲存 (內建策略):100 筆記錄 × $0.75/1,000 筆記錄/月 = $0.075/月

* 長期記憶體擷取:100 次擷取/天 × 0.50 美元/1,000 次擷取 = 0.05 美元/天 + 每月成本:0.05 美元 × 30 = 1.50 美元

2.33 美元

搭配 Claude 3.5 Sonnet 的 Agent Builder 應用程式總成本

$8.09 (基礎設施) + $0.40 (AgentCore 執行期) + $24.30 (模型) + $2.33 (記憶體)

35.12 美元

注意

AgentCore 執行期定價以耗用量為基礎。實際成本取決於:

  • 代理程式執行時間 (作用中處理期間的 CPU 和記憶體用量)

  • 互動次數及其複雜性

  • MCP 工具用量 (用於工具執行的額外 CPU/記憶體)

  • 記憶體組態 (啟用短期與長期記憶體)

如需 AgentCore 定價的詳細資訊,請參閱 Amazon Bedrock 定價

注意

如果使用叫用外部 APIs或服務的 MCP 伺服器,則這些成本是額外成本,且超出此計算的範圍。同樣地,如果使用 AgentCore 瀏覽器或 Code Interpreter 工具,每 vCPU 小時收費 0.0895 美元,每 GB 小時收費 0.00945 美元。

工作流程建置器的範例成本

工作流程建置器會建立協調多個客服人員建置器客服人員的主管客服人員。下表顯示具有 1 個主管代理程式和 3 個專業代理程式建置器代理程式的工作流程的成本明細,所有設定都已啟用 Claude 3.5 Sonnet 和長期記憶體。

假設:每天 100 次互動,每次互動平均 2 次客服人員委派,每個客服人員 5 秒執行時間。

AWS 服務 維度 成本 【美元】

API Gateway (WebSocket)、CloudFront、Lambda、Amazon S3、Systems Manager 參數存放區

每天 100 次聊天互動,平均訊息大小每則訊息 32 KB,每則連線 5 分鐘

0.61 美元

CloudWatch

在 上使用詳細模式的 1.5 GB CloudWatch Logs 進行實驗

7.23 美元

DynamoDB

1KB 記錄大小和 1 GB 儲存體的 LLM 組態資料表

0.25 美元

基礎設施成本的小計

8.09 美元

Amazon Bedrock AgentCore 執行期 (主管代理程式)

* CPU:1 個 vCPU × 5 秒 × 100 個互動 = 0.140 個 vCPU 小時/天 × 30 = $0.38 * 記憶體:0.5 GB × 5 秒 × 100 個互動 = 0.069 GB 小時/天 × 30 = $0.02

0.40 美元

Amazon Bedrock AgentCore 執行期 (3 個專用代理程式)

* 平均每次互動 2 次委派 = 200 次客服人員執行/天 * CPU:1 次 vCPU × 5 秒 × 200 = 0.278 次 vCPU-小時/天 × 30 = $0.75 * 記憶體:0.5 GB × 5 秒 × 200 = 0.139 GB-小時/天 × 30 = $0.04

0.79 美元

Anthropic Claude 3.5 Sonnet (主管代理程式)

* 輸入:190K 權杖/天 × $0.003/1K = $0.57/天 × 30 = $17.10 * 輸出:16K 權杖/天 × $0.015/1K = $0.24/天 × 30 = $7.20

24.30 美元

Anthropic Claude 3.5 Sonnet (專用代理程式)

* 每次互動平均 2 次委派 * 輸入:380K 權杖/天 × 0.003/1K = 1.14 美元/天 × 30 = 34.20 美元 * 輸出:32K 權杖/天 × 0.015/1K = 0.48 美元/天 × 30 = 14.40 美元

48.60 美元

Amazon Bedrock AgentCore 記憶體 (主管代理程式)

* 短期:100 個事件/天 × $0.25/1K × 30 = $0.75 * 長期儲存:100 個記錄 × $0.75/1K = $0.08 * 長期擷取:100 個擷取/天 × $0.50/1K × 30 = $1.50

2.33 美元

Amazon Bedrock AgentCore 記憶體 (專用代理程式)

* 短期:200 個事件/天 × $0.25/1K × 30 = $1.50 * 長期儲存:200 個記錄 × $0.75/1K = $0.15 * 長期擷取:200 個擷取/天 × $0.50/1K × 30 = $3.00

4.65 美元

具有 3 個代理程式之工作流程建置器的應用程式總成本

$8.09 (基礎設施) + $1.19 (AgentCore 執行期) + $72.90 (模型) + $6.98 (記憶體)

89.16 美元

注意
  • 較高的委派率會按比例增加字符消耗

如需 AgentCore 定價的詳細資訊,請參閱 Amazon Bedrock 定價