

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Planificación de la implementación
<a name="plan-your-deployment"></a>

En esta sección se describen las consideraciones de [costo](cost.md), [seguridad](security-1.md), [región](#supported-aws-regions) y [cuota](quotas.md) a la hora de planificar la implementación.

**importante**  
Esta solución aprovecha Amazon Bedrock como el servicio principal para acceder a los modelos generados por IA. Primero debe solicitar el acceso a los modelos antes de que estén disponibles para su uso en la solución. Para obtener más información, consulte [Model access](https://docs.aws.amazon.com/bedrock/latest/userguide/model-access.html) en la *Guía del usuario de Amazon Bedrock*.

## Regiones de AWS admitidas
<a name="supported-aws-regions"></a>

**importante**  
Esta solución utiliza opcionalmente los servicios Amazon Bedrock y Amazon Kendra, que actualmente no están disponibles en todas las regiones de AWS. Debe lanzar esta solución en una región de AWS en la que estén disponibles estos servicios. Para obtener la disponibilidad más reciente de los servicios de AWS por región, consulte la [lista de servicios regionales de AWS](https://aws.amazon.com/about-aws/global-infrastructure/regional-product-services/).

El generador de aplicaciones de IA generativa en AWS es compatible con las siguientes regiones de AWS:


| Nombre de la región |  | 
| --- | --- | 
|  Este de EE. UU. (Ohio)  |  Canadá (centro)  | 
|  Este de EE. UU. (Norte de Virginia)  |  Europa (Fráncfort)  | 
|  EE.UU. Oeste (Norte de California)  |  Europa (Irlanda)  | 
|  Oeste de EE. UU. (Oregón)  |  Europa (Londres)  | 
|  Asia-Pacífico (Mumbai)  |  Europa (Milán)  | 
|  Asia-Pacífico (Seúl)  |  Europa (París)  | 
|  Asia-Pacífico (Singapur)  |  Europa (Estocolmo)  | 
|  Asia-Pacífico (Sídney)  |  Middle East (Bahrain)  | 
|  Asia-Pacífico (Tokio)  |  América del Sur (São Paulo)  | 

**nota**  
Si en sus implementaciones utiliza un modelo básico al que se accede desde fuera de AWS, consulte con el proveedor del modelo en qué regiones APIs están disponibles. Si solo APIs están disponibles en determinadas regiones, es posible que experimente inestabilidad en forma de alta latencia o incluso de tiempos de espera. También es importante que consultes con los equipos legales y de cumplimiento de tu organización para evaluar las posibles consecuencias de que los datos sobrepasen las fronteras regionales.

# Costo
<a name="cost"></a>

Con esta solución de AWS, solo paga por los recursos que utilice y no hay tarifas mínimas ni cargos de configuración. Los usuarios pagan por el panel de control utilizado para lanzar los casos de uso de IA generativa y por cualquier caso de uso que se implemente. El coste de los casos de uso implementados depende de las configuraciones. Ejemplos de configuraciones:

1. Un sencillo panel de implementación que cuesta aproximadamente 20 USD al mes.

1. Un sencillo caso de uso de un chatbot listo para la producción que se implementa con la configuración predeterminada y se ejecuta en EE. UU. Este (Virginia del Norte), con la tecnología Amazon Bedrock sin acceso a los documentos, lo que también cuesta alrededor de 200 dólares al mes.

1. Un sistema escalado en un caso de uso de Amazon VPC que admite 8000 consultas al día en decenas de miles de documentos, lo que cuesta alrededor de 1500 USD al mes. El coste del caso de uso variará en función de la configuración, por ejemplo, en los casos de uso de texto con distintos proveedores de modelos, con o sin la generación aumentada de recuperación (RAG) activada o no, etc.


| Descripción de la carga de trabajo | Coste estimado (USD/mes) | 
| --- | --- | 
|   [Ejemplo de costo del panel de implementación](#sample-deployment-dashboard-cost)   |  20\$1 al mes  | 
|   [Ejemplo de costos de una prueba de concepto basada en texto](#sample-costs-for-a-text-based-proof-of-concept)  (incluye un panel de implementación y un caso de uso de texto, aproximadamente 100 interacciones por día)  |  40\$1 al mes  | 
|   [Ejemplo de costos de un motor de consultas generativas de IA altamente escalable](#sample-costs-for-a-highly-scalable-generative-ai-query-engine)  [(Incluye un panel de implementación, un caso de uso de texto y un índice de Amazon Kendra para RAG de hasta 100 000 documentos con unas 8 000 consultas al día, con VPC habilitada)](#incremental-cost-of-enabling-amazon-vpc-for-a-use-case)   |  1500\$1 al mes  | 
|   [Ejemplo de costos de una prueba de concepto basada en un agente](#sample-costs-for-an-agent-based-proof-of-concept)  (Incluye un panel de implementación, 1 caso de uso de Bedrock Agent con las bases de conocimiento de Amazon Bedrock y Amazon Bedrock Guardrails habilitadas, aproximadamente 100 interacciones por día)  |  840\$1 al mes  | 
|   [Ejemplo de costos del servidor MCP](#sample-costs-for-mcp-server)  (Incluye un panel de implementación, 1 caso de uso de un servidor MCP con el método Gateway para la integración con Lambda, aproximadamente 100 invocaciones de herramientas por día)  |  22\$1 al mes  | 
|   [Ejemplos de costos de Agent Builder](#sample-costs-for-agent-builder)  (Incluye un panel de implementación, 1 caso de uso de Agent Builder con integración MCP y memoria de larga duración habilitada, aproximadamente 100 interacciones por día)  |  55\$1 al mes  | 
|   [Ejemplos de costos de Workflow Builder](#sample-costs-for-workflow-builder)  (Incluye un panel de implementación, 1 flujo de trabajo con 3 agentes de Agent Builder y unas 100 interacciones por día)  |  109\$1 al mes  | 

**importante**  
Estos ejemplos solo pretenden ayudarlo a estimar los costos de sus cargas de trabajo específicas. El uso de diferentes LLMs configuraciones o servicios de AWS puede cambiar sus costos (por ejemplo, serverless/on-demand billing vs. provisioned/time facturados). Para administrar los costos, recomendamos [crear un presupuesto](https://docs.aws.amazon.com/cost-management/latest/userguide/budgets-create.html) a través de [AWS Cost Explorer](https://aws.amazon.com/aws-cost-management/aws-cost-explorer/). Los precios están sujetos a cambios. Para obtener más información, consulte la página web de precios de cada servicio de AWS utilizado en esta solución.

## Ejemplo de costos para ejecutar el panel de implementación
<a name="sample-deployment-dashboard-cost"></a>

En la siguiente tabla se muestra el desglose de los costes de un panel de despliegue con los parámetros predeterminados y 100 usuarios activos en la región de EE. UU. del Este (Virginia del Norte) durante un mes, lo que costará unos 20 dólares al mes.


| Servicio de AWS | Dimensiones | Coste [USD] | 
| --- | --- | --- | 
|  API Gateway, DynamoDB, CloudFront Amazon S3, Lambda, Systems Manager Parameter Store  |  5000 llamadas a la API REST de 512 KB al mes sin tener activado el almacenamiento en caché  |  1,97\$1  | 
|  Amazon Cognito  |  100 usuarios activos al mes con funciones de seguridad avanzadas habilitadas y sin que los usuarios inicien sesión mediante la federación de SAML o OIDC  |  5,55\$1  | 
|  AWS WAF  |  10 000 solicitudes web en 1 ACL web y 7 reglas definidas sin ningún grupo de reglas  |  12,60\$1  | 
|  Coste total del panel de implementación  |  |   **20,12\$1**   | 

## Ejemplo de costos de una prueba de concepto basada en texto
<a name="sample-costs-for-a-text-based-proof-of-concept"></a>

Un panel de implementación puede tener muchos casos de uso implementados en un momento dado. La siguiente tabla muestra el desglose de los costes de un caso de uso implementado sin RAG para 1 usuario empresarial que realiza 100 consultas al día con el LLM. Las consultas se envían como un mensaje de texto WebSocket y la respuesta se transmite en forma de símbolos, suponiendo que la transmisión esté habilitada. Con el modelo Amazon Bedrock Nova Pro, el costo de ejecutar este caso de uso es de unos 20 dólares al mes.


| Servicio de AWS | Dimensiones | Coste [USD] | 
| --- | --- | --- | 
|  API Gateway (WebSocket) CloudFront, Lambda, Amazon S3, AWS Systems Manager Parameter Store  |  100 interacciones de chat por día. Tamaño medio de los mensajes: 32 KB por mensaje y 5 minutos por conexión.  |  0,61\$1  | 
|  CloudWatch  |   CloudWatch Registros de 1,5 GB con el modo detallado activado para experimentar  |  7,23\$1  | 
|  Amazon DynamoDB  |  Tabla de historial de conversaciones, 1 GB de almacenamiento Tabla de configuración LLM, 1 GB de almacenamiento  |  3,05\$1  | 
|   **Subtotal de los costos de los casos de uso (no incluidos) LLMs**   |  |   **10,89\$1**   | 
|  Amazon Bedrock (Nova Pro)  |  Supuestos para 100 interacciones por día: \$1 Coste mensual de 190 000 fichas de entrada al día = 0,152 USD × 30 \$1 Coste mensual de 16 000 fichas de salida al día = 0,0512 × 30 USD  |  6,10\$1  | 
|   **Coste total de la aplicación con Amazon Bedrock (Nova Pro)**   |   **10,89\$1 (coste del caso de uso) \$1 6,10\$1 (coste de Amazon Bedrock)**   |   **17,00\$1**   | 

**nota**  
Los costos de las llamadas de inferencia realizadas a servicios fuera de la red de AWS no se incluyen en estas estimaciones. Consulte la guía de precios de su proveedor de LLM si no utiliza un proveedor de modelos de AWS.  
Las guías de precios de los servicios de AWS se encuentran en: precios de [Amazon Bedrock y precios](https://aws.amazon.com/bedrock/pricing/) de [Amazon SageMaker AI](https://aws.amazon.com/sagemaker/pricing/).

## Ejemplos de costos de un motor de consultas generativas de IA altamente escalable
<a name="sample-costs-for-a-highly-scalable-generative-ai-query-engine"></a>

La siguiente tabla proporciona el desglose de costos de un caso de uso compatible con RAG con el modelo Nova Pro de Amazon Bedrock como LLM. Si se añade una base de conocimientos de Bedrock, este caso de uso cuesta unos 1300\$1 al mes


| Servicio de AWS | Dimensiones | Coste [USD] | 
| --- | --- | --- | 
|  API Gateway (WebSocket)  |  8000 interacciones de chat por día. Tamaño medio de los mensajes: 32 KB por mensaje y 5 minutos por conexión.  |  38,89\$1  | 
|  CloudFront  |  240 000 solicitudes al mes, con 100 GB de datos transferidos a Internet y 1 GB de datos transferidos al origen  |  8,76\$1  | 
|  Amazon Bedrock (Nova Pro)  |  Supuestos: Símbolos de entrada = PromptTemplate (400) \$1 contexto (400) \$1 ChatHistory (1080) \$1 símbolos de entrada de consulta (20) = 1900 Tokens de salida = 160 (promedio) Con 8.000 transacciones al día, Coste de los tokens de entrada diarios (1900 x 8000 = 15 200 000 fichas x 0,0008/1000 de precio por ficha) Coste de los tokens de producción diaria (160 x 8000 = 1,280,000 tokens x 0,0032/1000 de precio por token) Coste mensual ((12,16\$1 \$1 4,10\$1) x 30)  |  487,80 DÓLARES  | 
|  CloudWatch  |  24 métricas que utilizan 5 GB de datos ingeridos para los registros y 1 panel  |  9,72\$1  | 
|  DynamoDB  |  Tabla DynamoDB para realizar un seguimiento del historial de conversaciones con cada registro de hasta 1 KB de datos, 8000 lecturas y escrituras por día  |  11,70\$1  | 
|  Lambda  |  Tamaño del contenedor: 128 MB, 512 MB efímero almacenamiento, 2 funciones Lambda utilizadas para la autorización Tamaño del contenedor: 256 MB, 512 MB de almacenamiento efímero, 5 solicitudes por segundo con un tiempo de procesamiento promedio de 20 segundos  |  20,89\$1  | 
|   **Coste total del caso de uso**   |  |   **577,76\$1 al mes más el coste de la base de conocimientos (véase más abajo)**   | 

**nota**  
Los costos de las llamadas a la API realizadas a cualquier servicio fuera de la red de AWS no se incluyen en estas estimaciones. Consulte la guía de precios de su proveedor de LLM si no utiliza Amazon Bedrock.

## Costos de añadir una base de conocimientos
<a name="cost-of-adding-a-knowledge-base"></a>

Los costes de la base de conocimientos variarán en función del tipo de base de conocimientos utilizada y (en el caso de Bedrock) del almacén vectorial de apoyo utilizado por la base de conocimientos. El aprovisionamiento y la gestión de las bases de conocimiento están fuera del alcance de la solución.

 **Bases de conocimiento de Amazon Bedrock** 

La solución no administra ni aprovisiona ningún recurso relacionado con las bases de conocimiento de Amazon Bedrock. Amazon Bedrock no incurre en costes por el uso de la función de base de conocimientos en sí, pero se le cobrará por el uso del modelo de incrustación utilizado en su caso de uso en cada consulta. Además, el almacén vectorial de respaldo de su base de conocimientos (por ejemplo, un índice de [Amazon OpenSearch Service](https://aws.amazon.com/opensearch-service) o una base de datos de Amazon Relational Database Service) tendrá un coste asociado que no se puede proporcionar ni calcular aquí.

Para el escenario de motor de consultas de IA generativa de alta escalabilidad anterior, los costos incurridos por este servicio para llamar al modelo de incrustaciones de Amazon Bedrock son los siguientes:


| Servicio de AWS | Dimensiones | Coste [USD] | 
| --- | --- | --- | 
|  Amazon Bedrock (Amazon Titan Text Embeddings V2)  |  8000 consultas al día con 1900 fichas de entrada por consulta = 15 200 000 fichas = 0,30 USD al día. Coste diario x 30 días = coste mensual de 9 USD  |  9,00\$1  | 
|  Ejemplo OpenSearch de uso de Amazon Service (Serverless)  |  Configuración básica sin servidor con 4 unidades de OpenSearch cómputo (OCU) (mínimo facturable) = 23,04 USD por día Coste diario x 30 días = 691,20 USD  Esto proporciona una estimación aproximada, ya que algunas cargas de trabajo requerirán más OCUs, mientras que los clientes con OpenSearch recursos aprovisionados existentes incurrirán en menos costos en este caso.   |  691,20\$1  | 
|   **Coste adicional total**   |  |  700,20\$1  | 

 **Amazon Kendra** 

La solución puede proporcionarle un índice de Kendra o puede traer el suyo propio. El costo de ejecutar una configuración adecuada para el motor de consultas generativas de IA altamente escalable mencionado anteriormente es el siguiente:


| Servicio de AWS | Dimensiones | Coste [USD] | 
| --- | --- | --- | 
|  Amazon Kendra  |  De 0 a 8 000 consultas al día y hasta 100 000 documentos con Amazon Kendra Enterprise Edition con 0 a 50 fuentes de datos  |  1.008,00\$1  | 

**nota**  
Puede compartir el índice de Amazon Kendra entre casos de uso, pero esto puede aumentar el número de consultas por índice. Si no está incluido en la edición Amazon Kendra Enterprise, se aplicarán cargos adicionales.

## Coste incremental de habilitar Amazon VPC para un caso de uso
<a name="incremental-cost-of-enabling-amazon-vpc-for-a-use-case"></a>

La siguiente tabla proporciona el desglose de los costos de habilitar Amazon VPC para un caso de uso implementado en dos. AZs


| Servicio de AWS | Dimensiones | Coste [USD] | 
| --- | --- | --- | 
|  Puerta de enlace Amazon NAT  |  Supuesto: implementación de 2 zonas de disponibilidad, con una puerta de enlace NAT en cada zona de disponibilidad. 100 GB de datos procesados a través de NAT Gateway durante 730 horas, 100 GB de datos procesados por mes  |  74,70\$1  | 
|  AWS PrivateLink (puntos de enlace de VPC)  |  Supuestos: implementación de 2 zonas de disponibilidad, con 1 subred privada en cada zona de disponibilidad y 1 punto final de VPC con 2 interfaces ENIs de red elásticas (). 6 puntos de enlace de VPC, 2 por punto de enlace de ENIs VPC, 730 horas con 1024 GB de datos procesados en un mes  |  97,84\$1  | 
|  Dirección pública IPv4   |  Supuesto: implementación de 2 zonas de disponibilidad, 1 subred pública en cada zona de disponibilidad con una puerta de enlace NAT en cada subred pública. Cada puerta de enlace NAT está configurada con 1 puerta pública activa. IPv4 2 IPv4 direcciones públicas activas x 730 horas en un mes x 0,005\$1 por hora = 7,3 USD  |  7,30\$1  | 
|  costos adicionales (para Amazon VPC)  |  |   **179,93 DÓLARES**   | 

## Implicaciones en materia de costos al utilizar el rendimiento aprovisionado
<a name="cost-implications-when-using-provisioned-throughput"></a>

Los costes del rendimiento aprovisionado variarán en función del tipo de modelo que haya aprovisionado y del período de compromiso, así como de las unidades modelo seleccionadas para el período de compromiso. El uso del rendimiento aprovisionado conlleva un coste adicional.

Para obtener más información y obtener la mayor cantidad up-to-date de precios, consulta los precios de [Bedrock](https://aws.amazon.com/bedrock/pricing/).

## Coste del uso de la inferencia entre regiones
<a name="cost-for-using-cross-region-inference"></a>

El uso de la inferencia [entre](https://docs.aws.amazon.com/bedrock/latest/userguide/cross-region-inference.html) regiones no conlleva ningún coste adicional de enrutamiento o transferencia de datos. Pagas el mismo precio por token por los modelos que en tu región de origen o principal.

## Muestra los costes de una prueba de concepto basada en un agente
<a name="sample-costs-for-an-agent-based-proof-of-concept"></a>

Cuando utiliza Amazon Bedrock Agents, se le cobra en función de los componentes que componen el agente, como el modelo de respaldo y la base de conocimientos (si RAG está habilitado), además de las capacidades adicionales que añada. La siguiente tabla muestra el desglose de costos de un caso de uso de Bedrock Agent configurado con un modelo Claude 3.5 Sonnet bajo demanda, Amazon Bedrock Knowledge Bases y Amazon Bedrock Guardrails.

Al igual que el [costo de añadir las bases de conocimiento de Amazon Bedrock](#cost-of-adding-a-knowledge-base), esta solución no administra ni aprovisiona los recursos relacionados con los agentes de Amazon Bedrock. La solución tampoco implica costes por el uso de las bases de conocimiento de Amazon Bedrock, pero sí los costes de:
+ Utilizar el modelo de incrustación para cada consulta que se le envíe
+ El almacén de vectores de respaldo de su base de conocimientos (por ejemplo, un índice de Amazon OpenSearch Service o una base de datos de Amazon RDS)

En la siguiente tabla se presuponen 100 interacciones por día con 1900 tokens de entrada y 160 tokens de salida por consulta.

**nota**  
En este ejemplo de caso de uso de Bedrock Agent, si hubiera un grupo de acción configurado para usar una API externa, esos costos serían adicionales. Están fuera del ámbito de los cálculos de esta tabla.


| Servicio de AWS | Dimensiones | Coste [USD] | 
| --- | --- | --- | 
|  API Gateway (WebSocket) CloudFront, Lambda, Amazon S3, almacén de parámetros de Systems Manager  |  100 interacciones de chat al día, tamaño medio de los mensajes: 32 KB por mensaje, 5 minutos por conexión  |  0,61\$1  | 
|  CloudWatch  |   CloudWatch Registros de 1,5 GB con el modo detallado activado para experimentar  |  7,23\$1  | 
|  DynamoDB  |  Tabla de configuración LLM para un tamaño de registro de 1 KB y 1 GB de almacenamiento  |  0,25\$1  | 
|   **Subtotal de los costos (no incluidos) LLMs**   |  |   **8,09\$1**   | 
|  Soneto antrópico Claude 3.5  |  \$1 El coste diario de 190 000 fichas de entrada al día (0,003/1000 fichas) = 0,57\$1 \$1 Coste diario × 30 días = 17,10\$1 \$1 Coste diario de 16 000 fichas de salida por día (0,015 €/1 000 fichas) = 0,24\$1 \$1 Coste diario × 30 días = 7,20\$1  |  24,30\$1  | 
|  Amazon Bedrock (Amazon Titan Text Embeddings V2) para las bases de conocimiento de Amazon Bedrock  |  Coste diario de 190 000 fichas de entrada al día (0,00002/1000 fichas) = 0,004 Coste diario × 30 días = 0,12\$1  |  0,12\$1  | 
|  Ejemplo OpenSearch de uso de Amazon Service (Serverless)  |  Configuración básica sin servidor con 4 unidades de OpenSearch cómputo (OCU) (mínimo facturable) = 23,04\$1 por día Coste diario × 30 días = 691,20\$1  |  691,20\$1  | 
|  Barreras de protección para Amazon Bedrock  |  190 000 fichas equivalen aproximadamente a 760 000 (190 000 × 4) caracteres y 3 800 unidades de texto (760 000 caracteres/200) Pensemos en una barandilla configurada con filtros de contenido, filtro de información de identificación personal (PII), filtro de información confidencial (expresión regular) y filtros de palabras Coste diario del filtro de contenido (0,75 €/1000 unidades de texto) más coste del filtro de PII (0,1/1000 unidades de texto) \$1 filtro de información confidencial (expresiones regulares) \$1 filtros de palabras = 2,85\$1 \$1 0,38\$1 \$1 0\$1 Coste mensual = coste diario × 30 días = 96,90\$1  |  96,90\$1  | 
|   **Coste total de la solicitud de un agente respaldado por Anthropic Claude 3.5 Sonnet**   |   *8,09\$1 (coste por caso de uso) \$1* **812,52\$1** (otras configuraciones de agentes)   |  820,61\$1  | 

**nota**  
Consulte la guía de precios de su proveedor de LLM si no utiliza un proveedor de modelos de AWS. Las guías de precios de los servicios de AWS se encuentran en: precios de [Amazon Bedrock y precios](https://aws.amazon.com/bedrock/pricing/) de [Amazon SageMaker AI](https://aws.amazon.com/sagemaker/pricing/).

## Ejemplos de costos del servidor MCP
<a name="sample-costs-for-mcp-server"></a>

Los casos de uso del servidor MCP permiten la implementación y la administración de servidores del Model Context Protocol en Amazon Bedrock AgentCore. La siguiente tabla muestra el desglose de costos de un caso de uso de un servidor MCP que utiliza el método Gateway para empaquetar las funciones Lambda existentes.

La solución administra la implementación y la AgentCore configuración de Gateway. Se le cobrará por:
+ Costes de infraestructura (API Gateway, Lambda, DynamoDB, S3) CloudWatch
+ AgentCore Consumo de gateway (por invocación de herramienta)
+ Costes de ejecución de la función Lambda (para el método Gateway con objetivos Lambda)
+ Costes de API externas (para el método Gateway con destinos de API o servidor MCP, si corresponde)


| Elemento | Cálculos | Costo | 
| --- | --- | --- | 
|  Amazon API Gateway (API REST)  |  100 invocaciones de herramientas por día × 30 días = 3000 solicitudes al mes  |  0,05 USD  | 
|  AWS Lambda (orquestación)  |  100 invocaciones al día × 30 días × 1 segundo de media × 512 MB = 3000 GB-segundos al mes  |  0,05 USD  | 
|  Amazon DynamoDB  |  3000 read/write solicitudes al mes más 1 GB de almacenamiento  |  0,15\$1  | 
|  Amazon CloudWatch  |  Supervisión y registro estándar para 3000 invocaciones  |  1,00\$1  | 
|  Amazon S3  |  Almacenamiento de configuración y registros (uso mínimo)  |  0,25\$1  | 
|  Amazon Bedrock Gateway AgentCore   |  3000 invocaciones de herramientas al mes  |  0,05 USD  | 
|  Función Lambda objetivo  |  100 invocaciones por día × 30 días × 0,5 segundos × 128 MB = 1500 GB-segundos por mes  |  0,25\$1  | 
|   **Coste mensual total**   |   *1,75\$1 (infraestructura) \$1 0,05\$1 (puerta de enlace) AgentCore *   |  1,80\$1  | 

**nota**  
Los costos varían según el método de implementación (Gateway o Runtime), los tipos de objetivos y los patrones de uso. Las implementaciones del método Runtime incurren en cargos AgentCore de tiempo de ejecución en lugar de cargos de Gateway. Los costos de las API externas y los costos de alojamiento de contenedores personalizados son adicionales.

## Ejemplo de costos de Agent Builder
<a name="sample-costs-for-agent-builder"></a>

Agent Builder le permite crear e implementar agentes personalizados en Amazon Bedrock AgentCore. La siguiente tabla muestra el desglose de costos de un caso de uso de Agent Builder configurado con Claude 3.5 Sonnet, integración de servidores MCP y memoria de larga duración habilitada.

La solución gestiona el despliegue y la configuración del AgentCore entorno de ejecución. Se le cobrará por:
+ Costes de infraestructura (API Gateway, Lambda, DynamoDB, S3) CloudWatch
+ AgentCore Consumo de tiempo de ejecución (horas de CPU y memoria en función del tiempo real de ejecución del agente)
+ Inferencia del modelo básico (fichas de entrada y salida)
+ AgentCore Memoria (eventos a corto plazo y almacenamiento/recuperación a largo plazo)

En la siguiente tabla se presuponen 100 interacciones por día con 1900 símbolos de entrada y 160 símbolos de salida por consulta, con un tiempo medio de ejecución del agente de 5 segundos por interacción.


| Servicio de AWS | Dimensiones | Coste [USD] | 
| --- | --- | --- | 
|  API Gateway (WebSocket) CloudFront, Lambda, Amazon S3, almacén de parámetros de Systems Manager  |  100 interacciones de chat al día, tamaño medio de los mensajes: 32 KB por mensaje, 5 minutos por conexión  |  0,61\$1  | 
|  CloudWatch  |   CloudWatch Registros de 1,5 GB con el modo detallado activado para experimentar  |  7,23\$1  | 
|  DynamoDB  |  Tabla de configuración LLM para un tamaño de registro de 1 KB y 1 GB de almacenamiento  |  0,25\$1  | 
|   **Subtotal de los costos de infraestructura**   |  |   **8,09\$1**   | 
|  Tiempo de ejecución de Amazon Bedrock AgentCore   |  \$1 CPU: 1 vCPU × 5 segundos × 100 interacciones = 125 vCPU- seconds/day = 0.140 vCPU-hours/day \$1 Coste diario: 0,140 × 0,0895\$1 = 0,013\$1 \$1 Coste mensual: 0,013 × 30\$1 = 0,38\$1 \$1 Memoria: 512 MB (0,5 GB) × 5 segundos × 100 interacciones = 250 GB- seconds/day = 0.069 GB-hours/day Más coste diario: 0,069 × 0,00945\$1 = 0,0007\$1 \$1 Coste mensual: 0,0007\$1 × 30 = 0,02\$1  |  0,40\$1  | 
|  Soneto antrópico Claude 3.5  |  \$1 El coste diario de 190 000 fichas de entrada al día (0,003/1000 fichas) = 0,57\$1 \$1 coste diario × 30 días = 17,10\$1 \$1 El coste diario de 16 000 fichas de salida al día (0,015 000 fichas) = 0,24\$1 \$1 coste diario × 30 días = 7,20\$1  |  24,30\$1  | 
|  Memoria Amazon Bedrock AgentCore   |  \$1 Memoria a corto plazo: 100 eventos nuevos events/day × 0,25/1000 \$1 = 0,025\$1 al día \$1 Coste mensual: 0,025\$1 × 30\$1 = 0,75\$1 \$1 Almacenamiento de memoria a largo plazo (estrategia integrada): 100 registros × 0,75 dólares/1 000\$1 = 0,075\$1 al mes records/month  \$1 Recuperación de memoria a largo plazo: 100 retrievals/day × 0,50\$1 cada 1000 recuperaciones = 0,05\$1 al día \$1 Coste mensual: 0,05\$1 × 30\$1 = 1,50\$1  |  2,33\$1  | 
|   **Coste total de la aplicación de Agent Builder con Claude 3.5 Sonnet**   |   *8,09\$1 (infraestructura) \$1 0,40\$1 (tiempo de AgentCore ejecución) \$1 24,30\$1 (modelo) \$1 2,33\$1 (memoria)*   |   **35,12\$1**   | 

**nota**  
AgentCore Los precios del tiempo de ejecución se basan en el consumo. Los costos reales dependen de:  
Tiempo de ejecución del agente (uso de CPU y memoria durante el procesamiento activo)
Número de interacciones y su complejidad
Uso de la herramienta MCP (adicional CPU/memory para la ejecución de la herramienta)
Configuración de memoria (habilitada para memoria a corto plazo o memoria a largo plazo)
Para ver AgentCore los precios detallados, consulta los [precios de Amazon Bedrock](https://aws.amazon.com/bedrock/agentcore/pricing/).

**nota**  
Si utiliza servidores MCP que utilizan servicios APIs o servicios externos, esos costos son adicionales y están fuera del ámbito de este cálculo. Del mismo modo, si utiliza herramientas de AgentCore navegador o interpretación de código, se aplican cargos basados en el consumo: 0,0895 USD por hora de CPU virtual y 0,00945 USD por GB-hora.

## Ejemplo de costos de Workflow Builder
<a name="sample-costs-for-workflow-builder"></a>

Workflow Builder crea un agente supervisor que organiza varios agentes de Agent Builder. La siguiente tabla muestra el desglose de costos de un flujo de trabajo con 1 agente supervisor y 3 agentes especializados de Agent Builder, todos configurados con Claude 3.5 Sonnet y con memoria de larga duración habilitada.

Supuestos: 100 interacciones por día, media de 2 delegaciones de agentes por interacción, tiempo de ejecución de 5 segundos por agente.


| Servicio de AWS | Dimensiones | Coste [USD] | 
| --- | --- | --- | 
|  API Gateway (WebSocket) CloudFront, Lambda, Amazon S3, almacén de parámetros de Systems Manager  |  100 interacciones de chat al día, tamaño medio de los mensajes: 32 KB por mensaje, 5 minutos por conexión  |  0,61\$1  | 
|  CloudWatch  |   CloudWatch Registros de 1,5 GB con el modo detallado activado para experimentar  |  7,23\$1  | 
|  DynamoDB  |  Tabla de configuración LLM para un tamaño de registro de 1 KB y 1 GB de almacenamiento  |  0,25\$1  | 
|   **Subtotal de los costos de infraestructura**   |  |   **8,09\$1**   | 
|  Amazon Bedrock AgentCore Runtime (agente supervisor)  |  \$1 CPU: 1 vCPU × 5 segundos × 100 interacciones = 0,140 vCPU hours/day × 30 = \$10.38 \$1 Memory: 0.5 GB × 5 seconds × 100 interactions = 0.069 GB-hours/day - × 30 = 0,02\$1  |  0,40\$1  | 
|  Amazon Bedrock AgentCore Runtime (3 agentes especializados)  |  \$1 Un promedio de 2 delegaciones por interacción = 200 agentes executions/day \$1 CPU: 1 vCPU × 5 seconds × 200 = 0.278 vCPU-hours/day × 30 = \$10.75 \$1 Memory: 0.5 GB × 5 seconds × 200 = 0.139 GB-hours/day × 30 = 0,04\$1  |  0,79\$1  | 
|  Anthropic Claude 3.5 Sonnet (agente supervisor)  |  \$1 Entrada: 190 000 × 0,003/1 000\$1 = 0,57 dólares/día tokens/day × 30 = 17,10\$1 \$1 Salida: 16 000 × 0,015 dólares/1 K = 0,24 dólares/día × 30 = 7,20\$1 tokens/day   |  24,30\$1  | 
|  Anthropic Claude 3.5 Sonnet (agentes especializados)  |  \$1 Media de 2 delegaciones por interacción \$1 Entrada: 380 000 tokens/day × 0,003\$1 = 1,14 dólares/día × 30 = 34,20\$1 \$1 Salida: 32 000 × 0,015 dólares/1 000\$1 = 0,48 dólares/día × 30\$1 = 14,40\$1 tokens/day   |  48,60\$1  | 
|  Amazon Bedrock AgentCore Memory (agente supervisor)  |  \$1 A corto plazo: 100 events/day × 0,25/1 000\$1 × 30 = 0,75\$1 \$1 Almacenamiento a largo plazo: 100 registros × 0,75 dólares/1 000\$1 = 0,08\$1 \$1 Recuperación a largo plazo: 100 × 0,50 €/1000 × 30\$1 = 1,50\$1 retrievals/day   |  2,33\$1  | 
|  Amazon Bedrock AgentCore Memory (agentes especializados)  |  \$1 A corto plazo: 200 events/day × 0,25/1 000\$1 × 30 = 1,50\$1 \$1 Almacenamiento a largo plazo: 200 registros × 0,75 dólares/1 000\$1 = 0,15\$1 \$1 Recuperación a largo plazo: 200 × 0,50 €/1000 × 30\$1 = 3,00\$1 retrievals/day   |  4,65\$1  | 
|   **Coste total de la aplicación para Workflow Builder con 3 agentes**   |   *8,09\$1 (infraestructura) \$1 1,19\$1 (AgentCore tiempo de ejecución) \$1 72,90\$1 (modelos) \$1 6,98\$1 (memoria)*   |   **89,16\$1**   | 

**nota**  
Las tasas de delegación más altas aumentan proporcionalmente el consumo de fichas
Para ver AgentCore los precios detallados, consulta los [precios de Amazon Bedrock](https://aws.amazon.com/bedrock/pricing/).

# Seguridad
<a name="security-1"></a>

Cuando crea sistemas en la infraestructura de AWS, las responsabilidades de seguridad se comparten entre usted y AWS. Este [modelo de responsabilidad compartida](https://aws.amazon.com/compliance/shared-responsibility-model/) reduce la carga operativa, ya que AWS opera, administra y controla los componentes, incluidos el sistema operativo anfitrión, la capa de virtualización y la seguridad física de las instalaciones en las que operan los servicios. Para obtener más información sobre la seguridad de AWS, visite [Seguridad en la nube de AWS](https://aws.amazon.com/security/).

## Uso de modelos de cimentación en Amazon Bedrock
<a name="using-third-party-models-on-amazon-bedrock"></a>

Amazon Bedrock alberga una colección de modelos, desde modelos Amazon Nova hasta otros modelos de bases líderes (FMs). Cuando se utiliza Amazon Bedrock, todos los modelos se alojan en la infraestructura de AWS. Esto significa que cuando utilice Amazon Bedrock como proveedor de LLM, todas sus solicitudes de inferencia permanecerán en la red de AWS y el tráfico de red no saldrá de su región.

**nota**  
Todos los modelos básicos (FMs) disponibles a través de Amazon Bedrock se alojan directamente en la infraestructura de AWS gestionada y propiedad de AWS. Los proveedores de modelos no tienen acceso a los datos de los clientes, como las indicaciones y las continuaciones, ni a los registros de servicio de Amazon Bedrock. Para obtener información adicional sobre la postura de seguridad de Amazon Bedrock, consulte [Protección de datos en Amazon Bedrock en](https://docs.aws.amazon.com/bedrock/) la Guía del usuario de *Amazon Bedrock*.

## Roles de IAM
<a name="iam-roles"></a>

Las funciones de IAM permiten a los clientes asignar políticas y permisos de acceso detallados a los servicios y usuarios de la nube de AWS. Esta solución crea funciones de IAM que otorgan acceso a las funciones Lambda de la solución para crear recursos regionales.

## CloudWatch Registros
<a name="cloudwatch-logs"></a>

Puede habilitar el modo detallado al implementar un caso de uso en la página de selección del modelo del panel de implementación, en la sección Configuración adicional. El modo detallado permite realizar CloudWatch registros detallados que pueden ser útiles para la depuración y acelerar la experimentación.

**nota**  
Cuando el modo detallado está activado, también se registran los documentos recuperados de la base de conocimientos (si el RAG está activado) y las solicitudes, que pueden contener información confidencial.

# VPC
<a name="vpc"></a>

La solución ofrece dos opciones para la configuración de Amazon VPC:

1. Deje que la solución cree una Amazon VPC para usted.

1. Administrar y traer su propia Amazon VPC para usarla dentro de la solución.

## Deje que la solución cree una Amazon VPC para usted
<a name="let-the-solution-build-an-amazon-vpc-for-you"></a>

Si selecciona la opción de permitir que la solución cree una Amazon VPC, se implementará como una arquitectura 2-AZ de forma predeterminada con un rango de CIDR de 10.10.0.0/20. Tiene la opción de usar [Amazon VPC IP Address Manager (IPAM)](https://docs.aws.amazon.com/vpc/latest/ipam/what-it-is-ipam.html), con 1 subred pública y 1 subred privada en cada zona de disponibilidad. La solución crea pasarelas NAT en cada una de las subredes públicas y configura las funciones Lambda para crearlas en [ENIs](https://docs.aws.amazon.com/Lambda/latest/dg/foundation-networking.html)las subredes privadas. Además, esta configuración crea tablas de enrutamiento y sus entradas, grupos de seguridad y sus reglas ACLs, redes y puntos finales de VPC (puntos de enlace e interfaz).

## Administrar su propia Amazon VPC
<a name="managing-your-own-amazon-vpc"></a>

Al implementar la solución con una Amazon VPC, tiene la opción de usar una Amazon VPC existente en su cuenta y región de AWS. Le recomendamos que ponga su VPC a disposición en al menos dos zonas de disponibilidad para garantizar una alta disponibilidad. Su VPC también debe tener los siguientes puntos de enlace de VPC y sus políticas de IAM asociadas para las configuraciones de VPC y tabla de enrutamiento.

### Para un panel de implementación, Amazon VPC
<a name="deployment-dashboard-2"></a>

1.  [Punto final de puerta de enlace para DynamoDB](https://docs.aws.amazon.com/vpc/latest/privatelink/vpc-endpoints-ddb.html).

1.  [Punto final de puerta de enlace para S3.](https://docs.aws.amazon.com/vpc/latest/privatelink/vpc-endpoints-s3.html)

1.  [Punto final de interfaz para CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CloudWatch-logs-and-interface-VPC.html).

1.  [Punto final de interfaz para AWS CloudFormation](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/cfn-vpce-bucketnames.html).

### Para un caso de uso Amazon VPC
<a name="use-cases-2"></a>

1.  [Punto final de puerta de enlace para DynamoDB](https://docs.aws.amazon.com/vpc/latest/privatelink/vpc-endpoints-ddb.html).

1.  [Punto final de puerta de enlace para S3.](https://docs.aws.amazon.com/vpc/latest/privatelink/vpc-endpoints-s3.html)

1.  [Punto final de interfaz para CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CloudWatch-logs-and-interface-VPC.html).

1.  [Punto final de interfaz para el almacén de parámetros de Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/setup-create-vpc.html).
**nota**  
La solución solo requiere`com.amazonaws.region.ssm`.

1.  [Punto final de interfaz para Amazon Bedrock (bedrock-runtime, agent-runtime,](https://docs.aws.amazon.com/bedrock/latest/userguide/vpc-interface-endpoints.html)). bedrock-agent-runtime

1. Opcional: si la implementación utilizará Amazon Kendra como base de conocimientos, se necesitará un [punto de enlace de interfaz para Amazon Kendra](https://docs.aws.amazon.com/kendra/latest/dg/vpc-interface-endpoints.html).

1. Opcional: si la implementación utilizará cualquier LLM en Amazon Bedrock, se necesitará un [punto de enlace de interfaz para Amazon Bedrock](https://docs.aws.amazon.com/bedrock/latest/userguide/vpc-interface-endpoints.html).
**nota**  
La solución solo requiere. `com.amazonaws.region.bedrock-runtime`

1. Opcional: si la implementación utilizará Amazon SageMaker AI para la LLM, se necesitará un [punto final de interfaz para Amazon SageMaker AI](https://docs.aws.amazon.com/sagemaker/latest/dg/interface-vpc-endpoint.html).

**nota**  
La solución no eliminará ni modificará la configuración de la VPC al utilizar la opción de implementación **Bring your own VPC**. Sin embargo, eliminará todas las VPCs que haya creado la solución en la opción **Crear una VPC para mí**. Por este motivo, debe tener cuidado al compartir una VPC gestionada por una solución entre pilas o despliegues.  
Por ejemplo, la implementación A usa la **opción Crear una VPC para mí.** La implementación B usa **Bring my own VPC** mediante la VPC creada por la implementación A. Si la implementación A se elimina antes que la implementación B, la implementación B dejará de funcionar porque se eliminó la VPC. Además, dado que la implementación B utiliza las funciones ENIs creadas por Lambda, la eliminación de la implementación A puede provocar errores y retener los recursos residuales.

# Amazon CloudFront
<a name="amazon-cloudfront"></a>

Esta solución implementa una consola web [alojada](https://docs.aws.amazon.com/AmazonS3/latest/dev/WebsiteHosting.html) en un bucket de Amazon S3. Para ayudar a reducir la latencia y mejorar la seguridad, esta solución incluye una CloudFront distribución con una identidad de acceso de origen, es decir, un CloudFront usuario que proporciona acceso público al contenido del bucket del sitio web de la solución. Para obtener más información, consulte [Restringir el acceso al contenido de Amazon S3 mediante una identidad de acceso de origen](https://docs.aws.amazon.com/AmazonCloudFront/latest/DeveloperGuide/private-content-restricting-access-to-s3.html) en la *Guía para CloudFront desarrolladores de Amazon*.

**nota**  
CloudFront tiene un límite de cuota flexible a nivel de cuenta de 20 políticas de encabezados de respuesta. Esta solución crea políticas de encabezados de respuesta personalizadas por motivos de seguridad. Si tiene más de 20 implementaciones del Generative AI Application Builder en AWS o sus casos de uso, es posible que las nuevas implementaciones fallen por alcanzar el límite de cuota.

Para resolver este problema, puede solicitar un aumento de cuota para la cuota de **Response Header Policies** en la consola de AWS Service Quotas siguiendo estos pasos:

1. Abra la consola de AWS Service Quotas.

1. En el panel de navegación, seleccione **Servicios de AWS**.

1. Busca y selecciona **Amazon CloudFront**.

1. Ve a la cuota de **políticas del encabezado de respuesta** y selecciona **Solicitar aumento de cuota**.

1. Siga las instrucciones para solicitar un aumento del límite de cuota de su cuenta de AWS.

Al aumentar la cuota de **políticas de cabecera de respuesta**, puede asegurarse de que las nuevas implementaciones del Generative AI Application Builder en AWS o sus casos de uso no fallen debido al límite de cuota.

# Cuotas
<a name="quotas"></a>

Las cuotas de servicio (que también se denominan límites) establecen el número máximo de recursos u operaciones de servicio para su cuenta de AWS.

## Cuotas para servicios de AWS en esta solución
<a name="quotas-for-aws-services-in-this-solution"></a>

Asegúrese de tener una cuota suficiente para cada uno de los [servicios implementados en esta solución](architecture-details.md#aws-services-in-this-solution). Para obtener más información, consulte las [cuotas de servicio de AWS](https://docs.aws.amazon.com/general/latest/gr/aws_service_limits.html).

Use los enlaces siguientes para ir a la página de ese servicio. Para ver las cuotas de servicio para todos los servicios de AWS en la documentación sin cambiar de página, consulte la información de la página de [Cuotas y puntos de conexión del servicio](https://docs.aws.amazon.com/general/latest/gr/aws-general.pdf#aws-service-information) del PDF.

## Cuotas de Amazon Bedrock AgentCore
<a name="agentcore-quotas"></a>

Para las implementaciones de Agent Builder, tenga en cuenta las siguientes cuotas de [ AgentCore servicio de Amazon Bedrock](https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/bedrock-agentcore-limits.html):


| Cuota | Este de EE. UU. (Norte de Virginia) | Otras regiones | 
| --- | --- | --- | 
|  Cargas de trabajo de sesión activas por cuenta  |  1 000  |  500  | 
|  Total de agentes por cuenta  |  1 000  |  1 000  | 
|  Versiones por cuenta  |  1 000  |  1 000  | 