Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Planifiez votre déploiement
<a name="plan-your-deployment"></a>

Cette section décrit les considérations relatives aux [coûts](cost.md), à la [sécurité](security-1.md), à [la région](#supported-aws-regions) et aux [quotas](quotas.md) pour planifier votre déploiement.

**Important**  
Cette solution utilise Amazon Bedrock comme principal service d'accès aux modèles générés par l'IA. Vous devez d'abord demander l'accès aux modèles avant qu'ils ne puissent être utilisés dans la solution. Pour plus de détails, reportez-vous à la section [Accès aux modèles](https://docs.aws.amazon.com/bedrock/latest/userguide/model-access.html) dans le *guide de l'utilisateur d'Amazon Bedrock*.

## Régions AWS prises en charge
<a name="supported-aws-regions"></a>

**Important**  
Cette solution utilise en option les services Amazon Bedrock et Amazon Kendra, qui ne sont actuellement pas disponibles dans toutes les régions AWS. Vous devez lancer cette solution dans une région AWS où ces services sont disponibles. Pour connaître la disponibilité la plus récente des services AWS par région, consultez la [liste des services régionaux AWS](https://aws.amazon.com/about-aws/global-infrastructure/regional-product-services/).

Generative AI Application Builder sur AWS est pris en charge dans les régions AWS suivantes :


| Nom de la région |  | 
| --- | --- | 
|  USA Est (Ohio)  |  Canada (Centre)  | 
|  USA Est (Virginie du Nord)  |  Europe (Francfort)  | 
|  USA Ouest (Californie du Nord)  |  Europe (Irlande)  | 
|  USA Ouest (Oregon)  |  Europe (Londres)  | 
|  Asie-Pacifique (Mumbai)  |  Europe (Milan)  | 
|  Asie-Pacifique (Séoul)  |  Europe (Paris)  | 
|  Asie-Pacifique (Singapour)  |  Europe (Stockholm)  | 
|  Asie-Pacifique (Sydney)  |  Middle East (Bahrain)  | 
|  Asie-Pacifique (Tokyo)  |  Amérique du Sud (São Paulo)  | 

**Note**  
Si vous utilisez un modèle de base accessible en dehors d'AWS dans vos déploiements, vérifiez auprès du fournisseur du modèle dans quelles régions il est disponible. APIs S'ils ne APIs sont disponibles que dans certaines régions, vous risquez de rencontrer une instabilité sous la forme d'une latence élevée ou même de délais d'attente. Il est également important de consulter les équipes juridiques et de conformité de votre organisation pour évaluer les considérations liées au franchissement des frontières régionales par les données.

# Cost
<a name="cost"></a>

Avec cette solution AWS, vous ne payez que pour les ressources que vous utilisez, sans frais minimaux ni frais d'installation. Les utilisateurs paient pour le tableau de bord utilisé pour lancer les cas d'utilisation de l'IA générative et pour tous les cas d'utilisation déployés. Le coût des cas d'utilisation déployés dépend des configurations. Exemples de configurations :

1. Un tableau de bord de déploiement simple qui coûte environ 20 USD par mois.

1. Un exemple d'utilisation simple d'un chatbot prêt pour la production, déployé avec des paramètres par défaut et exécuté dans l'est des États-Unis (Virginie du Nord), alimenté par Amazon Bedrock sans accès aux documents, qui coûte également environ 200 dollars américains par mois.

1. Un système évolutif adapté à un cas d'utilisation d'Amazon VPC qui prend en charge 8 000 requêtes par jour sur des dizaines de milliers de documents, pour un coût d'environ 1 500 dollars américains par mois. Le coût du cas d'utilisation varie en fonction de la configuration, par exemple les cas d'utilisation de texte avec différents fournisseurs de modèles, avec ou sans activation de la génération augmentée de récupération (RAG), etc.


| Description de la charge de travail | Coût estimé (USD/mois) | 
| --- | --- | 
|   [Exemple de coût pour le tableau de bord de déploiement](#sample-deployment-dashboard-cost)   |  20 \$1/mois  | 
|   [Coûts d'échantillonnage pour une preuve de concept basée sur du texte](#sample-costs-for-a-text-based-proof-of-concept)  (inclut le tableau de bord de déploiement et 1 cas d'utilisation du texte, environ 100 interactions par jour)  |  40 \$1/mois  | 
|   [Exemples de coûts pour un moteur de requêtes génératif basé sur l'IA hautement évolutif](#sample-costs-for-a-highly-scalable-generative-ai-query-engine)  [(Comprend un tableau de bord de déploiement, un cas d'utilisation textuel et un index Amazon Kendra pour RAG (jusqu'à 100 000 documents avec environ 8 000 requêtes par jour, avec le VPC activé)](#incremental-cost-of-enabling-amazon-vpc-for-a-use-case)   |  1 500 \$1/mois  | 
|   [Exemples de coûts pour une preuve de concept basée sur un agent](#sample-costs-for-an-agent-based-proof-of-concept)  (Comprend un tableau de bord de déploiement, un cas d'utilisation d'un agent Bedrock avec les bases de connaissances Amazon Bedrock et Amazon Bedrock Guardrails activé, environ 100 interactions par jour)  |  840 \$1/mois  | 
|   [Exemples de coûts pour le serveur MCP](#sample-costs-for-mcp-server)  (Comprend un tableau de bord de déploiement, un cas d'utilisation d'un serveur MCP avec méthode Gateway pour l'intégration Lambda, environ 100 appels d'outils par jour)  |  22 \$1/mois  | 
|   [Exemples de coûts pour Agent Builder](#sample-costs-for-agent-builder)  (Comprend un tableau de bord de déploiement, un cas d'utilisation d'Agent Builder avec intégration MCP et activation de la mémoire à long terme, environ 100 interactions par jour)  |  55 \$1/mois  | 
|   [Exemples de coûts pour Workflow Builder](#sample-costs-for-workflow-builder)  (Comprend un tableau de bord de déploiement, 1 flux de travail avec 3 agents Agent Builder, environ 100 interactions par jour)  |  109 \$1/mois  | 

**Important**  
Ces exemples sont uniquement destinés à vous aider à estimer les coûts liés à vos charges de travail spécifiques. L'utilisation de différentes LLMs configurations ou de services AWS peut modifier vos coûts (par exemple, serverless/on-demand billing vs. provisioned/time -factured). Pour gérer les coûts, nous vous recommandons [de créer un budget](https://docs.aws.amazon.com/cost-management/latest/userguide/budgets-create.html) via [AWS Cost Explorer](https://aws.amazon.com/aws-cost-management/aws-cost-explorer/). Les prix sont susceptibles d’être modifiés. Pour plus de détails, consultez la page Web de tarification de chaque service AWS utilisé dans cette solution.

## Exemples de coûts liés à l'exécution du tableau de bord de déploiement
<a name="sample-deployment-dashboard-cost"></a>

Le tableau suivant fournit la répartition des coûts pour un tableau de bord de déploiement avec des paramètres par défaut et 100 utilisateurs actifs dans la région de l'est des États-Unis (Virginie du Nord) pendant un mois, ce qui coûtera environ 20 dollars par mois.


| Service AWS | Dimensions | Coût [USD] | 
| --- | --- | --- | 
|  API Gateway, DynamoDB, CloudFront Amazon S3, Lambda, magasin de paramètres Systems Manager  |  5 000 appels d'API REST de 512 Ko par mois sans activation de la mise en cache  |  1,97\$1  | 
|  Amazon Cognito  |  100 utilisateurs actifs par mois avec des fonctionnalités de sécurité avancées activées et aucun utilisateur ne se connectant via la fédération SAML ou OIDC  |  5,55\$1  | 
|  AWS WAF  |  10 000 requêtes Web réparties sur 1 ACL Web et 7 règles définies sans aucun groupe de règles  |  12,60\$1  | 
|  Coût total du tableau de bord de déploiement  |  |   **20,12\$1**   | 

## Coûts d'échantillonnage pour une preuve de concept basée sur du texte
<a name="sample-costs-for-a-text-based-proof-of-concept"></a>

Un tableau de bord de déploiement peut comporter de nombreux cas d'utilisation déployés à un moment donné. Le tableau suivant montre la répartition des coûts d'un cas d'utilisation déployé sans RAG pour 1 utilisateur professionnel effectuant 100 requêtes par jour avec le LLM. Les requêtes sont envoyées sous forme de message texte sur le WebSocket et la réponse est retransmise sous forme de jetons, en supposant que le streaming est activé. En utilisant le modèle Amazon Bedrock Nova Pro, le coût d'exécution de ce cas d'utilisation est d'environ 20 \$1/mois.


| Service AWS | Dimensions | Coût [USD] | 
| --- | --- | --- | 
|  API Gateway (WebSocket) CloudFront, Lambda, Amazon S3, AWS Systems Manager Parameter Store  |  100 interactions par chat par jour. Taille moyenne des messages 32 Ko par message et 5 minutes par connexion.  |  0,61\$1  | 
|  CloudWatch  |   CloudWatch Journaux de 1,5 Go avec mode détaillé activé à des fins d'expérimentation  |  7,23\$1  | 
|  Amazon DynamoDB  |  Tableau de l'historique des conversations, 1 Go de stockage Table de configuration LLM, 1 Go de stockage  |  3,05\$1  | 
|   **Sous-total des coûts des cas d'utilisation (non compris LLMs)**   |  |   **10,89\$1**   | 
|  Amazon Bedrock (Nova Pro)  |  Hypothèses pour 100 interactions par jour : \$1 Coût mensuel pour 190 000 jetons d'entrée par jour = 0,152\$1 × 30\$1 \$1 Coût mensuel pour 16 000 jetons de sortie par jour = 0,0512 × 30\$1  |  6,10\$1  | 
|   **Coût total de l'application avec Amazon Bedrock (Nova Pro)**   |   **10,89\$1 (coût du cas d'utilisation) \$1 6,10\$1 (coût Amazon Bedrock)**   |   **17,00\$1**   | 

**Note**  
Les coûts des appels d'inférence effectués vers des services extérieurs au réseau AWS ne sont pas inclus dans ces estimations. Reportez-vous au guide de tarification de votre fournisseur de LLM si vous n'utilisez pas de fournisseur de modèles AWS.  
Les guides de tarification des services AWS sont disponibles à l'adresse suivante : tarification [d'Amazon Bedrock et tarification](https://aws.amazon.com/bedrock/pricing/) [d'Amazon SageMaker AI](https://aws.amazon.com/sagemaker/pricing/).

## Exemples de coûts pour un moteur de requêtes génératif basé sur l'IA hautement évolutif
<a name="sample-costs-for-a-highly-scalable-generative-ai-query-engine"></a>

Le tableau suivant fournit la ventilation des coûts d'un cas d'utilisation compatible RAG avec le modèle Nova Pro d'Amazon Bedrock comme LLM. Lorsqu'une base de connaissances Bedrock est ajoutée, ce cas d'utilisation coûte environ 1300 \$1/mois


| Service AWS | Dimensions | Coût [USD] | 
| --- | --- | --- | 
|  API Gateway (WebSocket)  |  8000 interactions par chat par jour. Taille moyenne des messages 32 Ko par message et 5 minutes par connexion.  |  38,89\$1  | 
|  CloudFront  |  240 000 demandes par mois avec 100 Go de données transférées vers Internet et 1 Go de données transférées vers l'origine  |  8,76\$1  | 
|  Amazon Bedrock (Nova Pro)  |  Hypothèses : Jetons d'entrée = PromptTemplate (400) \$1 contexte (400) \$1 ChatHistory (1080) \$1 requête Jetons d'entrée (20) = 1 900 Jetons de sortie = 160 (moyenne) Avec 8 000 transactions par jour, Coût quotidien des jetons d'entrée (1 900 x 8 000 = 15 200 000 jetons x 0,0008/1000 prix par jeton) Coût quotidien des jetons de sortie (160 x 8 000 = 1 280 000 jetons x 0,0032/1000 prix par jeton) Coût mensuel ((12,16\$1 \$1 4,10\$1) x 30)  |  487,80\$1  | 
|  CloudWatch  |  24 métriques utilisant 5 Go de données ingérées pour les journaux et 1 tableau de bord  |  9,72\$1  | 
|  DynamoDB  |  Table DynamoDB pour suivre l'historique des conversations avec chaque enregistrement jusqu'à 1 Ko de données, 8 000 lectures et écritures par jour  |  11,70\$1  | 
|  Lambda  |  Taille du conteneur : 128 Mo, 512 Mo éphémère stockage, 2 fonctions Lambda utilisées pour l'autorisation Taille du conteneur : 256 Mo, 512 Mo de stockage éphémère, 5 demandes par seconde avec un temps de calcul moyen de 20 secondes  |  20,89\$1  | 
|   **Coût total des cas d'utilisation**   |  |   **577,76 \$1/mois \$1 coût de la base de connaissances (voir ci-dessous)**   | 

**Note**  
Les coûts des appels d'API effectués vers des services extérieurs au réseau AWS ne sont pas inclus dans ces estimations. Consultez le guide tarifaire de votre fournisseur de LLM si vous n'utilisez pas Amazon Bedrock.

## Coûts liés à l'ajout d'une base de connaissances
<a name="cost-of-adding-a-knowledge-base"></a>

Les coûts de la base de connaissances varieront en fonction du type de base de connaissances utilisé et (dans le cas de Bedrock) du magasin de vecteurs sous-jacent utilisé par la base de connaissances. Le provisionnement et la gestion des bases de connaissances n'entrent pas dans le cadre de la solution.

 **Bases de connaissances Amazon Bedrock** 

La solution ne gère ni ne fournit de ressources liées aux bases de connaissances Amazon Bedrock. Amazon Bedrock ne facture aucun frais pour l'utilisation de la fonctionnalité de base de connaissances elle-même, mais l'utilisation du modèle d'intégration utilisé dans votre cas d'utilisation vous sera facturée pour chaque requête. En outre, le magasin vectoriel sous-jacent à votre base de connaissances (par exemple, un index dans [Amazon OpenSearch Service](https://aws.amazon.com/opensearch-service) ou une base de données dans Amazon Relational Database Service) aura un coût associé qui ne peut être ni fourni ni calculé ici.

Pour le scénario de moteur de requêtes d'IA génératif hautement évolutif ci-dessus, les coûts engagés par ce service pour appeler le modèle d'intégration Amazon Bedrock sont les suivants :


| Service AWS | Dimensions | Coût [USD] | 
| --- | --- | --- | 
|  Amazon Bedrock (Amazon Titan Text Embeddings V2)  |  8 000 requêtes par jour avec 1 900 jetons d'entrée par requête = 15 200 000 jetons = 0,30 USD par jour. Coût quotidien x 30 jours = coût mensuel de 9,00 USD  |  9,00\$1  | 
|  Exemple d'utilisation d'Amazon OpenSearch Service (sans serveur)  |  Configuration sans serveur de base avec 4 unités de OpenSearch calcul (OCU) (minimum facturable) = 23,04 USD par jour Coût quotidien x 30 jours = 691,20\$1 USD  Cela fournit une estimation approximative, car certaines charges de travail nécessiteront davantage OCUs, tandis que les clients disposant de OpenSearch ressources provisionnées auront à supporter des coûts moindres dans ce domaine.   |  691,20\$1  | 
|   **Coût supplémentaire total**   |  |  700,20\$1  | 

 **Amazon Kendra** 

La solution peut vous fournir un index Kendra, ou vous pouvez apporter le vôtre. Le coût d'exécution d'une configuration adaptée au moteur de requêtes IA génératif hautement évolutif ci-dessus est le suivant :


| Service AWS | Dimensions | Coût [USD] | 
| --- | --- | --- | 
|  Amazon Kendra  |  0 à 8 000 requêtes par jour et jusqu'à 100 000 documents avec Amazon Kendra Enterprise Edition avec 0 à 50 sources de données  |  1 008,00\$1  | 

**Note**  
Vous pouvez partager l'index Amazon Kendra entre différents cas d'utilisation, mais cela peut augmenter le nombre de requêtes par index. S'il ne s'agit pas de l'édition Amazon Kendra Enterprise, des frais supplémentaires s'appliqueront.

## Coût supplémentaire lié à l'activation d'Amazon VPC pour un cas d'utilisation
<a name="incremental-cost-of-enabling-amazon-vpc-for-a-use-case"></a>

Le tableau suivant fournit la répartition des coûts liés à l'activation d'Amazon VPC pour un cas d'utilisation déployé en deux. AZs


| Service AWS | Dimensions | Coût [USD] | 
| --- | --- | --- | 
|  Passerelle Amazon NAT  |  Hypothèse : déploiement de 2 zones, avec une passerelle NAT dans chaque zone de disponibilité. 100 Go de données traitées via NAT Gateway 730 heures, 100 Go de données traitées par mois  |  74,70\$1  | 
|  AWS PrivateLink (points de terminaison VPC)  |  Hypothèses : déploiement à 2 AZ, avec 1 sous-réseau privé dans chaque AZ et 1 point de terminaison VPC avec 2 interfaces ENIs réseau élastiques (). 6 points de terminaison VPC, 2 par point de terminaison ENIs VPC, 730 heures avec 1 024 Go de données traitées en un mois  |  97,84\$1  | 
|   IPv4 Adresse publique  |  Hypothèse : déploiement de 2 AZ, 1 sous-réseau public dans chaque AZ avec une passerelle NAT dans chaque sous-réseau public. Chaque passerelle NAT est configurée avec 1 public actif IPv4. 2 IPv4 adresses publiques actives x 730 heures par mois x 0,005\$1 de frais horaires = 7,3 USD  |  7,30\$1  | 
|  Coût supplémentaire (pour Amazon VPC)  |  |   **179,93\$1**   | 

## Incidences financières liées à l'utilisation du débit provisionné
<a name="cost-implications-when-using-provisioned-throughput"></a>

Les coûts de débit provisionnés varient en fonction du type de modèle que vous avez provisionné et de votre période d'engagement, ainsi que des unités de modèle sélectionnées pour la période d'engagement. L'utilisation du débit provisionné entraîne un coût supplémentaire.

Pour plus d'informations et pour up-to-date connaître les tarifs les plus élevés, vous pouvez consulter les [tarifs de Bedrock](https://aws.amazon.com/bedrock/pricing/).

## Coût de l'utilisation de l'inférence entre régions
<a name="cost-for-using-cross-region-inference"></a>

L'utilisation de l'[inférence entre régions](https://docs.aws.amazon.com/bedrock/latest/userguide/cross-region-inference.html) n'entraîne aucun coût supplémentaire pour le routage ou le transfert de données. Vous payez le même prix par jeton pour les modèles que dans votre région source ou principale.

## Exemples de coûts pour une preuve de concept basée sur un agent
<a name="sample-costs-for-an-agent-based-proof-of-concept"></a>

Lorsque vous utilisez Amazon Bedrock Agents, vous êtes facturé en fonction des composants composant l'agent, tels que le modèle de support et la base de connaissances (si RAG est activé), ainsi que des fonctionnalités supplémentaires que vous ajoutez. Le tableau suivant présente la répartition des coûts d'un cas d'utilisation de Bedrock Agent configuré avec un modèle Claude 3.5 Sonnet à la demande, les bases de connaissances Amazon Bedrock et Amazon Bedrock Guardrails.

Tout comme le [coût d'ajout des bases de connaissances Amazon Bedrock](#cost-of-adding-a-knowledge-base), cette solution ne gère ni ne fournit les ressources liées aux agents Amazon Bedrock. La solution n'entraîne pas non plus de frais pour l'utilisation des bases de connaissances Amazon Bedrock, mais entraîne des frais pour :
+ Utilisation du modèle d'intégration pour chaque requête qui lui est envoyée
+ Le magasin vectoriel sous-jacent à votre base de connaissances (par exemple, un index dans Amazon OpenSearch Service ou une base de données dans Amazon RDS)

Le tableau suivant suppose 100 interactions par jour avec 1 900 jetons d'entrée et 160 jetons de sortie par requête.

**Note**  
Pour cet exemple de cas d'utilisation de l'agent Bedrock, si un groupe d'action était configuré pour utiliser une API externe, ces coûts seraient supplémentaires. Ils n'entrent pas dans le cadre des calculs présentés dans ce tableau.


| Service AWS | Dimensions | Coût [USD] | 
| --- | --- | --- | 
|  API Gateway (WebSocket) CloudFront, Lambda, Amazon S3, magasin de paramètres Systems Manager  |  100 interactions par chat par jour, taille moyenne des messages 32 Ko par message, 5 minutes par connexion  |  0,61\$1  | 
|  CloudWatch  |   CloudWatch Logs de 1,5 Go avec mode détaillé activé à des fins d'expérimentation  |  7,23\$1  | 
|  DynamoDB  |  Table de configuration LLM pour une taille d'enregistrement de 1 Ko et un stockage de 1 Go  |  0,25\$1  | 
|   **Sous-total des coûts (non compris LLMs)**   |  |   **8,09\$1**   | 
|  Sonnet Anthropic Claude 3.5  |  \$1 Coût quotidien pour 190 000 jetons d'entrée par jour (0,003 /1 000 jetons) = 0,57\$1 \$1 Coût quotidien × 30 jours = 17,10 \$1\$1 Coût quotidien pour 16 000 jetons de sortie par jour (0,015 \$1/1 000 jetons) = 0,24\$1 \$1 Coût quotidien × 30 jours = 7,20\$1  |  24,30\$1  | 
|  Amazon Bedrock (Amazon Titan Text Embeddings V2) pour les bases de connaissances Amazon Bedrock  |  Coût quotidien pour 190 000 jetons d'entrée par jour (0,00002/1 000 jetons) = 0,004 Coût quotidien × 30 jours = 0,12\$1  |  0,12\$1  | 
|  Exemple d'utilisation d'Amazon OpenSearch Service (sans serveur)  |  Configuration sans serveur de base avec 4 unités de OpenSearch calcul (OCU) (minimum facturable) = 23,04\$1 par jour Coût quotidien × 30 jours = 691,20\$1  |  691,20\$1  | 
|  Barrières de protections Amazon Bedrock  |  190 000 jetons équivalent à peu près 760 000 caractères (190 000 × 4) et 3 800 unités de texte (760 000 caractères pour 200) Envisagez un garde-corps configuré avec des filtres de contenu, un filtre d'informations personnelles (PII), un filtre d'informations sensibles (expression régulière) et des filtres de mots Coût quotidien du filtre de contenu (0,75/1 000 unités de texte) \$1 coût du filtre PII (0,1/1 000 unités de texte) \$1 filtre d'informations sensibles (regex) \$1 filtres de mots = 2,85\$1 \$1 0,38\$1 \$1 0\$1 Coût mensuel = coût quotidien × 30 jours = 96,90\$1  |  96,90\$1  | 
|   **Coût total de candidature pour un agent soutenu par Anthropic Claude 3.5 Sonnet**   |   *8,09\$1 (coût du cas d'utilisation) \$1* **812,52\$1 (autres configurations d'agent)**   |  820,61\$1  | 

**Note**  
Reportez-vous au guide de tarification de votre fournisseur de LLM si vous n'utilisez pas de fournisseur de modèles AWS. Les guides de tarification des services AWS sont disponibles à l'adresse suivante : tarification [d'Amazon Bedrock et tarification](https://aws.amazon.com/bedrock/pricing/) [d'Amazon SageMaker AI](https://aws.amazon.com/sagemaker/pricing/).

## Exemples de coûts pour le serveur MCP
<a name="sample-costs-for-mcp-server"></a>

Les cas d'utilisation des serveurs MCP permettent le déploiement et la gestion de serveurs Model Context Protocol sur Amazon AgentCore Bedrock. Le tableau suivant montre la répartition des coûts d'un cas d'utilisation d'un serveur MCP utilisant la méthode Gateway pour encapsuler les fonctions Lambda existantes.

La solution gère le déploiement et la configuration de la AgentCore passerelle. Vous êtes facturé pour :
+ Coûts d'infrastructure (API Gateway, Lambda, DynamoDB, S3) CloudWatch
+ AgentCore Consommation de la passerelle (par appel d'outil)
+ Coûts d'exécution de la fonction Lambda (pour la méthode Gateway avec des cibles Lambda)
+ Coûts d'API externes (pour la méthode Gateway avec des cibles d'API ou de serveur MCP, le cas échéant)


| Élément | Calculs | Cost | 
| --- | --- | --- | 
|  Amazon API Gateway (API REST)  |  100 appels d'outils par jour × 30 jours = 3 000 demandes par mois  |  0,05 USD  | 
|  AWS Lambda (orchestration)  |  100 appels par jour × 30 jours × 1 seconde en moyenne × 512 Mo = 3 000 Go-secondes par mois  |  0,05 USD  | 
|  Amazon DynamoDB  |  3 000 read/write demandes par mois \$1 1 Go de stockage  |  0,15\$1  | 
|  Amazon CloudWatch  |  Surveillance et journalisation standard pour 3 000 invocations  |  1,00\$1  | 
|  Amazon S3  |  Stockage de configuration et journaux (utilisation minimale)  |  0,25\$1  | 
|  Passerelle Amazon Bedrock AgentCore   |  3 000 appels d'outils par mois  |  0,05 USD  | 
|  Fonction Lambda cible  |  100 appels par jour × 30 jours × 0,5 seconde × 128 Mo = 1 500 Go de secondes par mois  |  0,25\$1  | 
|   **Coût mensuel total**   |   *1,75\$1 (infrastructure) \$1 0,05\$1 (passerelle) AgentCore *   |  1,80\$1  | 

**Note**  
Les coûts varient en fonction de la méthode de déploiement (Gateway ou Runtime), des types de cibles et des modèles d'utilisation. Les déploiements de méthodes d' AgentCore exécution entraînent des frais d'exécution plutôt que des frais de passerelle. Les coûts d'API externes et les coûts d'hébergement de conteneurs personnalisés sont supplémentaires.

## Exemples de coûts pour Agent Builder
<a name="sample-costs-for-agent-builder"></a>

Agent Builder vous permet de créer et de déployer des agents personnalisés sur Amazon Bedrock AgentCore. Le tableau suivant indique la répartition des coûts d'un cas d'utilisation d'Agent Builder configuré avec Claude 3.5 Sonnet, intégration du serveur MCP et activation de la mémoire à long terme.

La solution gère le déploiement et la configuration du AgentCore Runtime. Vous êtes facturé pour :
+ Coûts d'infrastructure (API Gateway, Lambda, DynamoDB, S3) CloudWatch
+ AgentCore Consommation d'exécution (heures de processeur et de mémoire basées sur le temps d'exécution réel de l'agent)
+ Inférence du modèle de base (jetons d'entrée et de sortie)
+ AgentCore Mémoire (événements à court terme et stockage/récupération à long terme)

Le tableau suivant suppose 100 interactions par jour avec 1 900 jetons d'entrée et 160 jetons de sortie par requête, avec un temps d'exécution moyen de l'agent de 5 secondes par interaction.


| Service AWS | Dimensions | Coût [USD] | 
| --- | --- | --- | 
|  API Gateway (WebSocket) CloudFront, Lambda, Amazon S3, magasin de paramètres Systems Manager  |  100 interactions par chat par jour, taille moyenne des messages 32 Ko par message, 5 minutes par connexion  |  0,61\$1  | 
|  CloudWatch  |   CloudWatch Logs de 1,5 Go avec mode détaillé activé à des fins d'expérimentation  |  7,23\$1  | 
|  DynamoDB  |  Table de configuration LLM pour une taille d'enregistrement de 1 Ko et un stockage de 1 Go  |  0,25\$1  | 
|   **Sous-total des coûts d'infrastructure**   |  |   **8,09\$1**   | 
|  Amazon Bedrock Runtime AgentCore   |  \$1 Processeur : 1 vCPU × 5 secondes × 100 interactions = 125 vCPU- seconds/day = 0.140 vCPU-hours/day \$1 Coût quotidien : 0,140 × 0,0895\$1 = 0,013\$1 \$1 Coût mensuel : 0,013\$1 × 30 = 0,38\$1 \$1 Mémoire : 512 Mo (0,5 Go) × 5 secondes × 100 interactions = 250 Go- seconds/day = 0.069 GB-hours/day \$1 Coût quotidien : 0,069 × 0,00945\$1 = 0,0007\$1 \$1 Coût mensuel : 0,0007\$1 × 30 = 0,02\$1  |  0,40\$1  | 
|  Sonnet Anthropic Claude 3.5  |  \$1 Coût quotidien pour 190 000 jetons d'entrée par jour (0,003 par 1 000 jetons) = 0,57\$1 \$1 coût quotidien × 30 jours = 17,10\$1 \$1 Coût quotidien pour 16 000 jetons de sortie par jour (0,015 \$1/1 000 jetons) = 0,24\$1 \$1 coût quotidien × 30 jours = 7,20\$1  |  24,30\$1  | 
|  Mémoire Amazon Bedrock AgentCore   |  \$1 Mémoire à court terme : 100 nouveaux événements events/day × 0,25 \$1/1 000 = 0,025 \$1/jour \$1 Coût mensuel : 0,025\$1 × 30 = 0,75\$1 \$1 Stockage de mémoire à long terme (stratégie intégrée) : 100 enregistrements × 0,75 \$1/1 000 = 0,075 \$1/mois records/month  \$1 Récupération de la mémoire à long terme : 100 retrievals/day × 0,50 \$1/1 000 extractions = 0,05 \$1/jour \$1 Coût mensuel : 0,05 × 30 = 1,50\$1  |  2,33\$1  | 
|   **Coût total de l'application pour Agent Builder avec Claude 3.5 Sonnet**   |   *8,09\$1 (infrastructure) \$1 0,40\$1 (temps AgentCore d'exécution) \$1 24,30\$1 (modèle) \$1 2,33\$1 (mémoire)*   |   **35,12\$1**   | 

**Note**  
AgentCore La tarification du temps d'exécution est basée sur la consommation. Les coûts réels dépendent de :  
Durée d'exécution de l'agent (utilisation du processeur et de la mémoire pendant le traitement actif)
Nombre d'interactions et leur complexité
Utilisation de l'outil MCP (supplémentaire CPU/memory pour l'exécution de l'outil)
Configuration de la mémoire (mémoire à court terme ou mémoire à long terme activée)
Pour connaître les AgentCore tarifs détaillés, consultez les [tarifs d'Amazon Bedrock](https://aws.amazon.com/bedrock/agentcore/pricing/).

**Note**  
Si vous utilisez des serveurs MCP qui font appel à des services APIs ou à des services externes, ces coûts sont supplémentaires et ne sont pas pris en compte dans ce calcul. De même, si vous utilisez des outils de AgentCore navigateur ou d'interprétation de code, des frais basés sur la consommation s'appliquent à 0,0895\$1 par heure de vCPU et à 0,00945\$1 par Go d'heure.

## Exemples de coûts pour Workflow Builder
<a name="sample-costs-for-workflow-builder"></a>

Workflow Builder crée un agent superviseur qui orchestre plusieurs agents Agent Builder. Le tableau suivant indique la répartition des coûts pour un flux de travail comprenant 1 agent superviseur et 3 agents Agent Builder spécialisés, tous configurés avec Claude 3.5 Sonnet et avec une mémoire à long terme activée.

Hypothèses : 100 interactions par jour, moyenne de 2 délégations d'agent par interaction, 5 secondes de temps d'exécution par agent.


| Service AWS | Dimensions | Coût [USD] | 
| --- | --- | --- | 
|  API Gateway (WebSocket) CloudFront, Lambda, Amazon S3, magasin de paramètres Systems Manager  |  100 interactions par chat par jour, taille moyenne des messages 32 Ko par message, 5 minutes par connexion  |  0,61\$1  | 
|  CloudWatch  |   CloudWatch Logs de 1,5 Go avec mode détaillé activé à des fins d'expérimentation  |  7,23\$1  | 
|  DynamoDB  |  Table de configuration LLM pour une taille d'enregistrement de 1 Ko et un stockage de 1 Go  |  0,25\$1  | 
|   **Sous-total des coûts d'infrastructure**   |  |   **8,09\$1**   | 
|  Amazon Bedrock AgentCore Runtime (agent superviseur)  |  \$1 Processeur : 1 vCPU × 5 secondes × 100 interactions = 0,140 vCPU hours/day × 30 = \$10.38 \$1 Memory: 0.5 GB × 5 seconds × 100 interactions = 0.069 GB-hours/day - × 30 = 0,02\$1  |  0,40\$1  | 
|  Amazon Bedrock AgentCore Runtime (3 agents spécialisés)  |  \$1 En moyenne, 2 délégations par interaction = 200 agents executions/day \$1 CPU: 1 vCPU × 5 seconds × 200 = 0.278 vCPU-hours/day × 30 = \$10.75 \$1 Memory: 0.5 GB × 5 seconds × 200 = 0.139 GB-hours/day × 30 = 0,04\$1  |  0,79\$1  | 
|  Anthropic Claude 3.5 Sonnet (agent superviseur)  |  \$1 Entrée : 190 000\$1 tokens/day × 0,003 \$1/1 000\$1 = 0,57 \$1/jour × 30 = 17,10\$1 \$1 Sortie : 16 000 × 0,015 \$1/1 000\$1 = 0,24\$1 par jour × 30 = 7,20\$1 tokens/day   |  24,30\$1  | 
|  Anthropic Claude 3.5 Sonnet (Agents spécialisés)  |  \$1 En moyenne, 2 délégations par interaction \$1 Entrée : 380 000 dollars × 0,003 \$1/1 000 dollars = 1,14 \$1/jour tokens/day × 30 = 34,20 dollars \$1 Sortie : 32 000 × 0,015 \$1/1 000 dollars = 0,48 \$1/jour × 30 = 14,40 dollars tokens/day   |  48,60\$1  | 
|  Amazon Bedrock AgentCore Memory (agent superviseur)  |  \$1 Court terme : 100 events/day × 0,25 \$1/1 000 × 30 = 0,75\$1 \$1 Stockage à long terme : 100 enregistrements × 0,75 \$1/1 000\$1 = 0,08\$1 \$1 Récupération à long terme : 100 × 0,50 \$1/1 000 × 30 = 1,50\$1 retrievals/day   |  2,33\$1  | 
|  Amazon Bedrock AgentCore Memory (agents spécialisés)  |  \$1 Court terme : 200 events/day × 0,25 \$1/1 000 × 30 = 1,50\$1 \$1 Stockage à long terme : 200 enregistrements × 0,75 \$1/1 000\$1 = 0,15\$1 \$1 Récupération à long terme : 200 × 0,50 \$1/1 000 × 30 = 3\$1 retrievals/day   |  4,65\$1  | 
|   **Coût total de l'application pour Workflow Builder avec 3 agents**   |   *8,09\$1 (infrastructure) \$1 1,19\$1 (temps AgentCore d'exécution) \$1 72,90\$1 (modèles) \$1 6,98\$1 (mémoire)*   |   **89,16\$1**   | 

**Note**  
Des taux de délégation plus élevés augmentent proportionnellement la consommation de jetons
Pour connaître les AgentCore tarifs détaillés, consultez les [tarifs d'Amazon Bedrock](https://aws.amazon.com/bedrock/pricing/).

# Sécurité
<a name="security-1"></a>

Lorsque vous créez des systèmes sur l'infrastructure AWS, les responsabilités en matière de sécurité sont partagées entre vous et AWS. Ce [modèle de responsabilité partagée](https://aws.amazon.com/compliance/shared-responsibility-model/) réduit votre charge opérationnelle car AWS exploite, gère et contrôle les composants, notamment le système d'exploitation hôte, la couche de virtualisation et la sécurité physique des installations dans lesquelles les services fonctionnent. Pour plus d'informations sur la sécurité AWS, rendez-vous sur [AWS Cloud Security](https://aws.amazon.com/security/).

## Utilisation de modèles de fondation sur Amazon Bedrock
<a name="using-third-party-models-on-amazon-bedrock"></a>

Amazon Bedrock héberge une collection de modèles allant des modèles Amazon Nova à d'autres modèles de base de premier plan (FMs). Lorsque vous utilisez Amazon Bedrock, tous les modèles sont hébergés au sein de l'infrastructure AWS. Cela signifie que lorsque vous utilisez Amazon Bedrock comme fournisseur de LLM, toutes vos demandes d'inférence resteront dans le réseau AWS et le trafic réseau ne quittera pas votre région.

**Note**  
Tous les modèles de base (FMs) disponibles via Amazon Bedrock sont hébergés directement sur l'infrastructure AWS gérée et détenue par AWS. Les fournisseurs de modèles n'ont pas accès aux données des clients telles que les instructions et les continuations, ni aux journaux de service Amazon Bedrock. Pour plus d'informations sur le niveau de sécurité d'Amazon Bedrock, reportez-vous à la section [Protection des données dans Amazon Bedrock dans](https://docs.aws.amazon.com/bedrock/) le guide de l'utilisateur d'*Amazon Bedrock*.

## Rôles IAM
<a name="iam-roles"></a>

Les rôles IAM permettent aux clients d'attribuer des politiques d'accès et des autorisations détaillées aux services et aux utilisateurs sur le cloud AWS. Cette solution crée des rôles IAM qui accordent aux fonctions Lambda de la solution l'accès pour créer des ressources régionales.

## CloudWatch Journaux
<a name="cloudwatch-logs"></a>

Vous pouvez activer le mode détaillé lors du déploiement d'un cas d'utilisation à l'aide de la page de sélection du modèle du tableau de bord de déploiement, sous Paramètres supplémentaires. Le mode détaillé permet d'obtenir des CloudWatch journaux détaillés qui peuvent être utiles pour le débogage et une expérimentation rapide.

**Note**  
Lorsque le mode détaillé est activé, les documents extraits de la base de connaissances (si RAG est activé) et les invites sont également enregistrés, ce qui peut contenir des informations sensibles.

# VPC
<a name="vpc"></a>

La solution propose deux options pour la configuration d'Amazon VPC :

1. Laissez la solution créer un Amazon VPC pour vous.

1. Gérer et intégrer votre propre Amazon VPC à utiliser dans le cadre de la solution.

## Laissez la solution créer un Amazon VPC pour vous
<a name="let-the-solution-build-an-amazon-vpc-for-you"></a>

Si vous sélectionnez l'option permettant à la solution de créer un Amazon VPC, celle-ci sera déployée en tant qu'architecture 2-AZ par défaut avec une plage d'adresses CIDR 10.10.0.0/20. Vous avez la possibilité d'utiliser [Amazon VPC IP Address Manager (IPAM)](https://docs.aws.amazon.com/vpc/latest/ipam/what-it-is-ipam.html), avec 1 sous-réseau public et 1 sous-réseau privé dans chaque zone de disponibilité. La solution crée des passerelles NAT dans chacun des sous-réseaux publics et configure les fonctions Lambda pour les créer dans [ENIs](https://docs.aws.amazon.com/Lambda/latest/dg/foundation-networking.html)les sous-réseaux privés. En outre, cette configuration crée des tables de routage et leurs entrées, des groupes de sécurité et leurs règles, un réseau ACLs, des points de terminaison VPC (points de terminaison de passerelle et d'interface).

## Gérer votre propre Amazon VPC
<a name="managing-your-own-amazon-vpc"></a>

Lorsque vous déployez la solution avec un Amazon VPC, vous avez la possibilité d'utiliser un Amazon VPC existant dans votre compte et votre région AWS. Nous vous recommandons de rendre votre VPC disponible dans au moins deux zones de disponibilité pour garantir une haute disponibilité. Votre VPC doit également disposer des points de terminaison VPC suivants et de leurs politiques IAM associées pour les configurations de votre VPC et de table de routage.

### Pour un tableau de bord de déploiement : Amazon VPC
<a name="deployment-dashboard-2"></a>

1.  Point de [terminaison de passerelle pour DynamoDB](https://docs.aws.amazon.com/vpc/latest/privatelink/vpc-endpoints-ddb.html).

1.  Point de [terminaison Gateway pour S3](https://docs.aws.amazon.com/vpc/latest/privatelink/vpc-endpoints-s3.html).

1.  Point de [terminaison de l'interface pour CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CloudWatch-logs-and-interface-VPC.html).

1.  Point de [terminaison de l'interface pour AWS CloudFormation](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/cfn-vpce-bucketnames.html).

### Pour un cas d'utilisation : Amazon VPC
<a name="use-cases-2"></a>

1.  Point de [terminaison de passerelle pour DynamoDB](https://docs.aws.amazon.com/vpc/latest/privatelink/vpc-endpoints-ddb.html).

1.  Point de [terminaison Gateway pour S3](https://docs.aws.amazon.com/vpc/latest/privatelink/vpc-endpoints-s3.html).

1.  Point de [terminaison de l'interface pour CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CloudWatch-logs-and-interface-VPC.html).

1.  Point de [terminaison de l'interface pour le magasin de paramètres Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/setup-create-vpc.html).
**Note**  
La solution ne nécessite que`com.amazonaws.region.ssm`.

1.  Point de [terminaison de l'interface pour Amazon Bedrock (bedrock-runtime, agent-runtime,](https://docs.aws.amazon.com/bedrock/latest/userguide/vpc-interface-endpoints.html)). bedrock-agent-runtime

1. Facultatif : si le déploiement utilise Amazon Kendra comme base de connaissances, un point de [terminaison d'interface pour Amazon Kendra](https://docs.aws.amazon.com/kendra/latest/dg/vpc-interface-endpoints.html) est nécessaire.

1. Facultatif : si le déploiement utilise un LLM sous Amazon Bedrock, un point de [terminaison d'interface pour Amazon Bedrock](https://docs.aws.amazon.com/bedrock/latest/userguide/vpc-interface-endpoints.html) est nécessaire.
**Note**  
La solution ne nécessite que`com.amazonaws.region.bedrock-runtime`.

1. Facultatif : si le déploiement utilise Amazon SageMaker AI pour le LLM, un point de [terminaison d'interface pour Amazon SageMaker AI](https://docs.aws.amazon.com/sagemaker/latest/dg/interface-vpc-endpoint.html) est nécessaire.

**Note**  
La solution ne supprimera ni ne modifiera la configuration du VPC lors de l'utilisation de l'option de déploiement **Bring your own VPC**. Cependant, il supprimera tous VPCs ceux créés par la solution dans l'option **Créer un VPC pour moi**. Pour cette raison, vous devez être prudent lorsque vous partagez un VPC géré par une solution entre plusieurs stacks/déploiements.  
Par exemple, le déploiement A utilise l'**option Create a VPC for me.** Le déploiement B utilise **Bring my own VPC** en utilisant le VPC créé par le déploiement A. Si le déploiement A est supprimé avant le déploiement B, le déploiement B ne fonctionnera plus car le VPC a été supprimé. De plus, étant donné que le déploiement B utilise les fonctions ENIs créées par les fonctions Lambda, la suppression du déploiement A peut entraîner des erreurs et la rétention de ressources résiduelles.

# Amazon CloudFront
<a name="amazon-cloudfront"></a>

Cette solution déploie une console Web [hébergée](https://docs.aws.amazon.com/AmazonS3/latest/dev/WebsiteHosting.html) dans un compartiment Amazon S3. Pour réduire le temps de latence et améliorer la sécurité, cette solution inclut une CloudFront distribution dotée d'une identité d'accès d'origine, c'est-à-dire un CloudFront utilisateur fournissant un accès public au contenu du bucket du site Web de la solution. Pour plus d'informations, consultez [Restreindre l'accès au contenu Amazon S3 à l'aide d'une identité d'accès d'origine](https://docs.aws.amazon.com/AmazonCloudFront/latest/DeveloperGuide/private-content-restricting-access-to-s3.html) dans le manuel *Amazon CloudFront Developer Guide*.

**Note**  
CloudFront dispose d'une limite de quota souple au niveau du compte de 20 politiques d'en-tête de réponse. Cette solution crée des politiques d'en-tête de réponse personnalisées pour des raisons de sécurité. Si vous avez déployé plus de 20 applications Generative AI Application Builder sur AWS ou dans ses cas d'utilisation, les nouveaux déploiements risquent d'échouer en raison de l'atteinte de la limite de quota.

Pour résoudre ce problème, vous pouvez demander une augmentation de quota pour le quota **Response Header Policies** dans la console AWS Service Quotas en suivant ces étapes :

1. Ouvrez la console AWS Service Quotas.

1. Dans le volet de navigation, sélectionnez **Services AWS**.

1. Recherchez et sélectionnez **Amazon CloudFront**.

1. Accédez au quota des **politiques d'en-tête de réponse** et choisissez **Demander une augmentation du quota**.

1. Suivez les instructions pour demander une augmentation de la limite de quota pour votre compte AWS.

En augmentant le quota des **politiques d'en-tête de réponse**, vous pouvez vous assurer que les nouveaux déploiements du générateur d'applications d'IA générative sur AWS ou ses cas d'utilisation n'échoueront pas en raison de la limite de quota.

# Quotas
<a name="quotas"></a>

Les quotas de service, également appelés limites, représentent le nombre maximal de ressources ou d'opérations de service pour votre compte AWS.

## Quotas pour les services AWS dans cette solution
<a name="quotas-for-aws-services-in-this-solution"></a>

Assurez-vous de disposer d'un quota suffisant pour chacun des [services mis en œuvre dans cette solution](architecture-details.md#aws-services-in-this-solution). Pour plus d'informations, consultez la section [Quotas de service AWS](https://docs.aws.amazon.com/general/latest/gr/aws_service_limits.html).

Utilisez les liens suivants pour accéder à la page de ce service. Pour consulter les quotas de service pour tous les services AWS dans la documentation sans changer de page, consultez plutôt les informations de la page [Points de terminaison et quotas du service](https://docs.aws.amazon.com/general/latest/gr/aws-general.pdf#aws-service-information) dans le PDF.

## Quotas Amazon Bedrock AgentCore
<a name="agentcore-quotas"></a>

Pour les déploiements d'Agent Builder, tenez compte des quotas de [ AgentCore service Amazon Bedrock](https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/bedrock-agentcore-limits.html) suivants :


| Quota | USA Est (Virginie du Nord) | Autres régions | 
| --- | --- | --- | 
|  Charges de travail Active Session par compte  |  1 000  |  500  | 
|  Nombre total d'agents par compte  |  1 000  |  1 000  | 
|  Versions par compte  |  1 000  |  1 000  |