成本 - AWS 上的生成式人工智能应用程序构建者

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

成本

使用此 AWS 解决方案,您只需为使用的资源付费,没有最低费用或安装费。用户需要为用于启动生成式人工智能用例的仪表板以及部署的任何用例付费。部署用例的成本取决于配置。配置示例:

  1. 一个简单的部署控制面板,每月费用约为20美元。

  2. 一个简单的生产就绪聊天机器人用例,使用默认设置在美国东部(弗吉尼亚北部)运行,由Amazon Bedrock提供支持,无法访问文档,每月的费用也约为200美元。

  3. Amazon VPC 用例中的一个扩展系统,每天支持对成千上万个文档进行 8,000 次查询,每月费用约为 1,500 美元。用例的成本将因配置而异,例如使用不同模型提供者的文本用例,启用或不启用检索增强生成 (RAG),等等。

工作负载说明 预计成本(美元/月)

部署控制面板的费用示例

每月 20 美元

基于文本的概念验证的样本成本

(包括部署仪表板和 1 个文本用例,每天大约 100 次互动)

40 美元/月

高度可扩展的生成式 AI 查询引擎的成本示例

(包括部署控制面板、1 个文本用例和一个 Amazon Kendra 索引,用于存放 RAG 多达 10 万个文档,在启用 VPC 的情况下,每天查询量约为 8000 次

每月 1,500 美元

基于代理的概念验证的样本成本

(包括部署控制面板、1 个启用 Amazon Bedrock 知识库和亚马逊 Bedrock Guardrails 的 Bedrock Agent 用例,每天大约 100 次互动)

840 美元/月

MCP 服务器的费用示例

(包括部署控制面板、1 个 MCP 服务器用例,其中包含用于 Lambda 集成的网关方法,每天大约 100 次工具调用)

22美元/月

代理生成器的费用示例

(包括部署仪表板、1 个启用 MCP 集成和长期内存的 Agent Builder 用例,每天大约 100 次交互)

55 美元/月

工作流生成器的费用示例

(包括部署控制面板、1 个包含 3 个 Agent Builder 代理的工作流程、每天约 100 次交互)

每月 109 美元

重要

这些示例仅用于帮助您估算特定工作负载的成本。使用不同的 LLMs配置或 AWS 服务可能会改变您的成本(例如,已serverless/on-demand billing vs. provisioned/time计费)。为了管理成本,我们建议通过 AWS Cost Explorer 创建预算。价格可能会发生变化。有关完整详情,请参阅本解决方案中使用的每项 AWS 服务的定价网页。

运行部署控制面板的费用示例

下表提供了具有默认参数的部署控制面板的成本明细,在美国东部(弗吉尼亚北部)地区有 100 个活跃用户,为期一个月,费用约为 20 美元。

AWS 服务 Dimensions 成本 [美元]

API Gateway、DynamoDB、、 CloudFront亚马逊 S3、Lambda、Systems Manager 参数存储

在未启用缓存的情况下,每月调用 5,000 次 512 KB 的 REST

1.97 美元

Amazon Cognito

每月 100 个活跃用户启用了高级安全功能,且没有用户通过 SAML 或 OIDC 联合登录

5.55 美元

AWS WAF

通过 1 个 Web ACL 和 7 个已定义的规则(不含任何规则组)发出 10,000 个 Web 请求

12.60 美元

部署控制面板总成本

20.12 美元

基于文本的概念验证的样本成本

部署仪表板可以在给定时间部署许多用例。下表显示了在没有 RAG 的情况下部署的用例的成本明细,该用例针对 1 个企业用户每天使用 LLM 执行 100 次查询。假设已启用流式传输,查询在 WebSocket 上以短信形式发送,响应以令牌的形式流式传回。使用亚马逊 Bedrock Nova Pro 型号,运行此用例的成本约为 20 美元/月。

AWS 服务 Dimensions 成本 [美元]

API Gateway (WebSocket)、Lambda CloudFront、亚马逊 S3、AWS Systems Manager Parameter Systems Store

每天 100 次聊天互动。每条消息的平均消息大小为 32 KB,每次连接 5 分钟。

0.61 美元

CloudWatch

开启详细模式的 1.5 GB CloudWatch 日志,用于实验

7.23 美元

Amazon DynamoDB

对话历史记录表,1 GB 存储空间

LLM 配置表,1 GB 存储空间

3.05 美元

用例成本小计(不包括 LLMs)

10.89 美元

亚马逊 Bedrock (Nova Pro)

假设每天 100 次互动:

* 每天 19 万个输入代币的月度成本 = 0.152 美元 × 30 美元 * 每天 1.6 万个输出代币的每月成本 = 0.0512 美元 × 30

6.10 美元

使用 Amazon Bedrock(Nova Pro)的总申请费用

10.89 美元(用例成本)+ 6.10 美元(亚马逊 Bedrock 成本)

17.00 美元

注意

这些估算中不包括对 AWS 网络之外的服务进行推理调用的费用。如果您不使用 AWS 模型提供商,请参阅 LLM 提供商的定价指南。

AWS 服务的定价指南可在以下网址找到:亚马逊 Bedrock 定价亚马逊 A SageMaker I 定价

高度可扩展的生成式 AI 查询引擎的成本示例

下表提供了支持 RAG 的用例的成本明细,其中亚马逊 Bedrock 的 Nova Pro 机型作为 LLM。添加 Bedrock 知识库后,此用例的费用约为 1300 美元/月

AWS 服务 Dimensions 成本 [美元]

API Gateway (WebSocket)

每天有 8000 次聊天互动。每条消息的平均消息大小为 32 KB,每次连接 5 分钟。

38.89 美元

CloudFront

每月 240,000 个请求,其中 100 GB 的数据传输到互联网,1 GB 的数据传输到源站

8.76 美元

亚马逊 Bedrock (Nova Pro)

假设:

输入标记 = promptTemplate (400) + 上下文 (400) + ChathiStory (1080) + 查询输入标记 (20) = 1,900

输出代币 = 160(平均值)

每天有8,000笔交易,

每日输入代币成本(1,900 x 8,000 = 15,200,000 个代币 x 每个代币的价格为 0.0008/1000)

每日产出代币成本(160 x 8,000 = 1,280,000 个代币 x 每个代币的价格为 0.0032/1000)

每月费用((12.16 美元 + 4.10 美元)x 30)

487.80 美元

CloudWatch

24 个指标,使用为日志提取的 5 GB 数据和 1 个控制面板

9.72 美元

DynamoDB

DynamoDB 表用于跟踪对话历史记录,每条记录最多 1 KB 数据,每天读取和写入 8,000 次

11.70 美元

Lambda

容器大小——128 MB,512 MB 临时性

存储,2 个 Lambda 函数用于授权

容器大小-256 MB,512 MB 临时存储空间,每秒 5 个请求,平均计算时间 20 秒

20.89 美元

用例总成本

577.76 美元/月 + 知识库成本(见下文)

注意

这些估算中不包括对 AWS 网络以外的任何服务进行 API 调用的费用。如果不使用 Amazon Bedrock,请参阅您的法学硕士提供商的定价指南。

添加知识库的成本

知识库成本将根据所使用的知识库类型以及(对于 Bedrock 而言)知识库使用的支持向量存储而有所不同。配置和管理知识库超出了解决方案的范围。

Amazon 基岩知识库

该解决方案不管理或预配置与 Amazon Bedrock 知识库相关的任何资源。Amazon Bedrock 不会因为使用知识库功能本身而产生费用,但是您需要为使用案例在每次查询中使用的嵌入模型的使用付费。此外,您的知识库的支持向量存储(例如,亚马逊 OpenSearch 服务中的索引或亚马逊关系数据库服务中的数据库)将产生相关成本,此处无法提供或计算。

对于上述高度可扩展的生成式 AI 查询引擎场景,此服务调用 Amazon Bedrock 嵌入模型所产生的成本如下:

AWS 服务 Dimensions 成本 [美元]

亚马逊 Bedrock(亚马逊 Titan 文本嵌入 V2)

每天 8,000 次查询,每次查询 1,900 个输入令牌 = 15,200,000 个代币 = 每天 0.30 美元。

每日费用 x 30 天 = 每月费用 9.00 美元

9.00 美元

亚马逊 OpenSearch 服务(无服务器)使用示例

带有 4 x OpenSearch 计算单元 (OCU)(最低计费)的基本无服务器配置 = 每天 23.04 美元

每日费用 x 30 天 = 691.20 美元

注意

这提供了一个粗略的估计,因为某些工作负载将需要更多的工作负载 OCUs,而拥有现有预配置 OpenSearch 资源的客户在此处花费的成本会更少。

691.20 美元

额外费用总额

700.20 美元

Amazon Kendra

该解决方案可以为您配置 Kendra 索引,也可以自带索引。运行适合上述高度可扩展的生成式 AI 查询引擎的配置的成本如下:

AWS 服务 Dimensions 成本 [美元]

Amazon Kendra

使用具有 0-50 个数据源的亚马逊 Kendra 企业版,每天 0-8,000 次查询,多达 100,000 个文档

1,008.00 美元

注意

您可以在用例之间共享 Amazon Kendra 索引,但这可能会增加每个索引的查询数量。如果这不属于亚马逊 Kendra Enterprise 版,则将收取额外费用。

为用例启用 Amazon VPC 的增量成本

下表提供了为一分为二的使用案例启用 Amazon VPC 的成本明细 AZs。

AWS 服务 Dimensions 成本 [美元]

亚马逊 NAT 网关

假设:2 个可用区部署,每个可用区中有一个 NAT 网关。通过 NAT Gateway 处理 100 GB 的数据 730 小时,每月处理 100 GB 的数据

74.70 美元

AWS PrivateLink (VPC 终端节点)

假设:2 个可用区部署,每个可用区中有 1 个私有子网,1 个 VPC 终端节点有 2 个弹性网络接口 (ENIs)。

6 个 VPC 终端节点, ENIs 每个 VPC 终端节点 2 个,730 小时,一个月内处理 1,024 GB 的数据

97.84 美元

公共 IPv4 地址

假设:2 个可用区部署,每个可用区中有 1 个公有子网,每个公有子网中有一个 NAT 网关。每个 NAT 网关配置有 1 个活跃的公共网关 IPv4。

2 个活跃的公共 IPv4 地址 x 一个月 730 个小时 x 每小时 0.005 美元的费用 = 7.3 美元

7.30 美元

额外费用

(适用于亚马逊 VPC)

179.93 美元

使用预置吞吐量时的成本影响

预配置吞吐量成本将根据您预配置的模型类型、承诺期以及为承诺期选择的模型单位而有所不同。使用预置吞吐量会产生额外费用。

如需了解更多信息和最 up-to-date优惠的价格,您可以参阅 B edrock 定价

使用跨区域推理的成本

使用跨区域推理不会产生额外的路由或数据传输费用。您为模型支付的每个代币价格与来源地区或主要区域相同。

基于代理的概念验证的样本成本

当您使用 Amazon Bedrock Agents 时,将根据构成代理的组件(例如支持模型和知识库(如果启用了 RAG)以及您添加的其他功能向您收费。下表显示了配置按需 Claude 3.5 Sonnet 模型、Amazon Bedrock 知识库和亚马逊 Bedrock Guardrails 的 Bedrock Agent 用例的成本明细。

添加 Amazon Bedrock 知识库的成本类似,此解决方案不管理或配置与 Amazon Bedrock Agents 相关的资源。该解决方案也不会因使用 Amazon Bedrock 知识库而产生费用,但会产生以下费用:

  • 对发送给它的每个查询使用嵌入模型

  • 您的知识库的支持向量存储(例如,亚马逊 OpenSearch 服务中的索引或 Amazon RDS 中的数据库)

下表假设每天有 100 次互动,每次查询 1,900 个输入令牌和 160 个输出令牌。

注意

对于此示例 Bedrock Agent 用例,如果将操作组配置为使用外部 API,则这些成本将是额外的。它们不在本表的计算范围之内。

AWS 服务 Dimensions 成本 [美元]

API Gateway (WebSocket) CloudFront、Lambda、亚马逊 S3、Systems Manager 参数存储

每天 100 次聊天互动,每条消息的平均大小为 32 KB,每次连接 5 分钟

0.61 美元

CloudWatch

1.5 GB 开启详细模式的 CloudWatch 日志,用于实验

7.23 美元

DynamoDB

适用于 1KB 记录大小和 1 GB 存储空间的 LLM 配置表

0.25 美元

费用小计(不包括 LLMs)

8.09 美元

Anthropic Claude 3.5

* 每天 19 万个输入代币(0.003/1,000 个代币)的每日费用 = 0.57 美元以上

每日成本 × 30 天 = 17.10 美元 * 每天 1.6 万个输出代币(0.015/1,000 个代币)的每日成本 = 0.24 美元以上

每日费用 × 30 天 = 7.20 美元

24.30 美元

适用于亚马逊 Bedrock 知识库的 Amazon Bedrock(亚马逊 Titan 文本嵌入 V2)

每天 19 万个输入代币(0.00002/1000 个代币)的每日费用 = 0.004

每日费用 × 30 天 = 0.12 美元

0.12 美元

亚马逊 OpenSearch 服务(无服务器)使用示例

基本无服务器配置,4 × OpenSearch 计算单位 (OCU)(最低计费)= 每天 23.04 美元

每日费用 × 30 天 = 691.20 美元

691.20 美元

Amazon Bedrock 护栏

19 万个代币大致相当于 76 万(190,000 × 4)个字符和 3,800 个文本单元(76 万个字符/200 个)

考虑配置有内容过滤器、个人身份信息 (PII) 过滤器、敏感信息过滤器(正则表达式)和单词过滤器的护栏

每日内容过滤器成本(0.75/1000 个文本单位)+ PII 过滤器成本(0.1/1000 个文本单位)+ 敏感信息过滤器(正则表达式)+ 单词过滤器 = 2.85 美元 + 0.38 美元 + 0 美元 + 0 美元 + 0 美元

每月费用 = 每日费用 × 30 天 = 96.90 美元

96.90 美元

由 Anthropic Claude 3.5 Sonnet 支持的代理的总申请成本

8.09 美元(用例成本)+ 812.52 美元(其他代理配置)

820.61 美元

注意

如果您不使用 AWS 模型提供商,请参阅 LLM 提供商的定价指南。AWS 服务的定价指南可在以下网址找到:亚马逊 Bedrock 定价亚马逊 A SageMaker I 定价

MCP 服务器的费用示例

MCP 服务器用例允许在 Amazon Bedro AgentCore ck 上部署和管理模型上下文协议服务器。下表显示了使用网关方法封装现有 Lambda 函数的 MCP 服务器用例的成本明细。

该解决方案管理 AgentCore 网关的部署和配置。您需要支付以下费用:

  • 基础设施成本(API Gateway、Lambda、DynamoDB、S3) CloudWatch

  • AgentCore 网关消耗(每次工具调用)

  • Lambda 函数执行成本(适用于具有 Lambda 目标的网关方法)

  • 外部 API 成本(适用于具有 API 或 MCP 服务器目标的网关方法,如果适用)

Item 计算 成本

亚马逊 API Gateway (REST API)

每天 100 次工具调用 × 30 天 = 每月 3,000 次请求

0.05 美元

AWS Lambda(编排)

每天 100 次调用 × 30 天 × 平均值 1 秒 × 512 MB = 每月 3,000 GB 秒

0.05 美元

Amazon DynamoDB

每月 3,000 个 read/write 请求 + 1 GB 存储空间

0.15 美元

Amazon CloudWatch

3,000 次调用的标准监控和日志记录

1.00 美元

Amazon S3

配置存储和日志(使用量最小)

0.25 美元

Amazon 基岩网关 AgentCore

每月 3,000 次工具调用

0.05 美元

目标 Lambda 函数

每天 100 次调用 × 30 天 × 0.5 秒 × 128 MB = 每月 1,500 GB 秒

0.25 美元

每月总费用

1.75 美元(基础架构)+ 0.05 美元(AgentCore 网关)

1.80 美元

注意

成本因部署方法(网关与运行时)、目标类型和使用模式而异。运行时方法部署会产生 AgentCore 运行时费用,而不是网关费用。外部 API 费用和自定义容器托管费用是额外的。

代理生成器的费用示例

代理生成器允许您在 Amazon Bedrock AgentCore 上创建和部署自定义代理。下表显示了配置了 Claude 3.5 Sonnet、MCP 服务器集成和启用长期内存的 Agent Builder 用例的成本明细。

该解决方案管理 AgentCore 运行时部署和配置。您需要支付以下费用:

  • 基础设施成本(API Gateway、Lambda、DynamoDB、S3) CloudWatch

  • AgentCore 运行时消耗(CPU 和内存小时数基于实际代理执行时间)

  • 基础模型推断(输入和输出标记)

  • AgentCore 记忆(短期事件和长期存储/检索)

下表假设每天 100 次交互,每次查询 1,900 个输入令牌和 160 个输出令牌,每次交互的平均代理执行时间为 5 秒。

AWS 服务 Dimensions 成本 [美元]

API Gateway (WebSocket) CloudFront、Lambda、亚马逊 S3、Systems Manager 参数存储

每天 100 次聊天互动,每条消息的平均大小为 32 KB,每次连接 5 分钟

0.61 美元

CloudWatch

1.5 GB 开启详细模式的 CloudWatch 日志,用于实验

7.23 美元

DynamoDB

适用于 1KB 记录大小和 1 GB 存储空间的 LLM 配置表

0.25 美元

基础设施成本小计

8.09 美元

亚马逊 Bedrock 运行 AgentCore 时

* CPU:1 vCPU × 5 秒 × 100 次互动 = 125 个 vCPU-seconds/day = 0.140 vCPU-hours/day + 每日成本:0.140 × 0.0895 美元 = 0.013 美元 + 每月成本:0.013 美元 × 30 = 0.38 美元

* 内存:512 MB (0.5 GB) × 5 秒 × 100 次互动 = 250 GB-seconds/day = 0.069 GB-hours/day + 每日费用:0.069 × 0.00945 = 0.0007 美元 + 每月费用:0.0007 × 30 = 0.02 美元

0.40 美元

Anthropic Claude 3.5

* 每天 19 万个输入代币(0.003/1,000 个代币)的每日费用 = 0.57 美元 + 每日费用 × 30 天 = 17.10 美元

* 每天 1.6 万个输出代币(0.015/1,000 个代币)的每日成本 = 0.24 美元 + 每日成本 × 30 天 = 7.20 美元

24.30 美元

亚马逊 Bedrock AgentCore Memory

* 短期记忆:100 个新 events/day × 0.25美元/1,000 个事件 = 0.025 美元/天 + 每月成本:0.025 美元 × 30 = 0.75 美元

* 长期内存存储(内置策略):100 条记录 × 0.75/1,000 美元 = 0.075 records/month 美元/月

* 长期内存检索:100 retrievals/day × 0.50美元/1,000 美元检索 = 0.05 美元/天 + 每月费用:0.05 美元 × 30 = 1.50 美元

2.33 美元

带有 Claude 3.5 Sonnet 的 Agent Builder

8.09 美元(基础架构)+ 0.40 美元(AgentCore 运行时)+ 24.30 美元(模型)+ 2.33 美元(内存)

35.12 美元

注意

AgentCore 运行时定价是基于消耗量的。实际成本取决于:

  • 代理执行时间(活动处理期间的 CPU 和内存使用情况)

  • 交互次数及其复杂性

  • MCP 工具使用情况(工具执行额外 CPU/memory 使用)

  • 内存配置(启用短期内存与长期内存)

有关详细 AgentCore 定价,请参阅 Amazon Bedrock 定价

注意

如果使用调用外部 APIs 或服务的 MCP 服务器,则这些费用是额外的,不在此计算范围内。同样,如果使用 AgentCore 浏览器或代码解释器工具,则基于消耗的费用为每 vCPU 小时 0.0895 美元,每 GB 小时 0.00945 美元。

工作流生成器的费用示例

Workflow Builder 创建了一个主管代理,用于协调多个代理生成器代理。下表显示了包含 1 个主管代理和 3 个专门的 Agent Builder 代理的工作流程的成本明细,所有这些代理都配置了 Claude 3.5 Sonnet 并启用了长期内存。

假设:每天 100 次互动,平均每次互动 2 次代理委托,每个代理执行时间 5 秒。

AWS 服务 Dimensions 成本 [美元]

API Gateway (WebSocket) CloudFront、Lambda、亚马逊 S3、Systems Manager 参数存储

每天 100 次聊天互动,每条消息的平均大小为 32 KB,每次连接 5 分钟

0.61 美元

CloudWatch

1.5 GB 开启详细模式的 CloudWatch 日志,用于实验

7.23 美元

DynamoDB

适用于 1KB 记录大小和 1 GB 存储空间的 LLM 配置表

0.25 美元

基础设施成本小计

8.09 美元

Amazon Bedrock AgentCore Runtime(主管代理)

* CPU:1 vCPU × 5 秒 × 100 次互动 = 0.140 vCP hours/day × 30 = $0.38 * Memory: 0.5 GB × 5 seconds × 100 interactions = 0.069 GB-hours/day U-× 30 = 0.02 美元

0.40 美元

Amazon Bedrock AgentCore Runtime(3 个专业代理)

* 平均每次互动 2 个委托 = 200 个代理人 executions/day * CPU: 1 vCPU × 5 seconds × 200 = 0.278 vCPU-hours/day × 30 = $0.75 * Memory: 0.5 GB × 5 seconds × 200 = 0.139 GB-hours/day × 30 = 0.04 美元

0.79 美元

Anthropic Claude 3.5 Sonnet(主管

* 输入:19万 tokens/day × 0.003/1K = 0.57 美元/天 × 30 = 17.10 美元 * 产出:1.6K × 0.015/1K = 0.24美元/天 × 30 = 7.20 美元 tokens/day

24.30 美元

Anthropic Claude 3.5 十四行诗(特工)

* 平均每次互动 2 个代表团 * 投入:38 万 tokens/day × 0.003/1K = 1.14 美元/天 × 30 = 34.20 美元 * 产出:32K × 0.015/1K = 0.48 美元/天 × 30 = 14.40 美元 tokens/day

48.60 美元

Amazon Bedrock AgentCore Memory(主管代理)

* 短期:100 events/day × 0.25美元/1K × 30 = 0.75 美元 * 长期存储:100 条记录 × 0.75/1K = 0.08 美元 * 长期检索:100 × 0.50美元/1K × 30 = 1.50 美元 = 1.50 美元 retrievals/day

2.33 美元

Amazon Bedrock AgentCore Memory(专业代理)

* 短期:200 events/day × 0.25美元/1K × 30 = 1.50 美元 * 长期存储:200 条记录 × 0.75/1K = 0.15 美元 * 长期检索:200 × 0.50美元/1K × 30 = 3.00 美元 retrievals/day

4.65 美元

包含 3 个代理的工作流生成器的应用程序总成本

8.09 美元(基础设施)+ 1.19 美元(AgentCore 运行时)+ 72.90 美元(模型)+ 6.98 美元(内存)

89.16 美元

注意
  • 较高的委托率会按比例增加代币消耗

有关详细 AgentCore 定价,请参阅 Amazon Bedrock 定价