

# デプロイを計画する
<a name="plan-your-deployment"></a>

このセクションでは、デプロイを計画する際の[コスト](cost.md)、[セキュリティ](security-1.md)、[リージョン](#supported-aws-regions)、[クォータ](quotas.md)の考慮事項について説明します。

**重要**  
このソリューションでは、AI 生成モデルにアクセスするための主要なサービスとして、Amazon Bedrock を活用します。ソリューション内でモデルを使用できるようにするには、まずモデルへのアクセスをリクエストする必要があります。詳細については、「*Amazon Bedrock ユーザーガイド*」の「[Model access](https://docs.aws.amazon.com/bedrock/latest/userguide/model-access.html)」を参照してください。

## サポートしている AWS リージョン
<a name="supported-aws-regions"></a>

**重要**  
このソリューションは、必要に応じて Amazon Bedrock と Amazon Kendra サービスを使用します。これは現時点では、一部の AWS リージョンでは利用できません。このソリューションは、これらのサービスが利用可能な AWS リージョンで起動する必要があります。リージョン別の AWS サービスの最新情報については、[AWS リージョン別のサービスのリスト](https://aws.amazon.com/about-aws/global-infrastructure/regional-product-services/)を参照してください。

AWS での生成 AI アプリケーションビルダーは、以下の AWS リージョンでサポートされます。


| リージョン名 |  | 
| --- | --- | 
|  米国東部 (オハイオ)  |  カナダ (中部)  | 
|  米国東部 (バージニア北部)  |  欧州 (フランクフルト)  | 
|  米国西部 (北カリフォルニア)  |  欧州 (アイルランド)  | 
|  米国西部 (オレゴン)  |  欧州 (ロンドン)  | 
|  アジアパシフィック (ムンバイ)  |  欧州 (ミラノ)  | 
|  アジアパシフィック (ソウル)  |  欧州 (パリ)  | 
|  アジアパシフィック (シンガポール)  |  欧州 (ストックホルム)  | 
|  アジアパシフィック (シドニー)  |  中東 (バーレーン)  | 
|  アジアパシフィック (東京)  |  南米 (サンパウロ)  | 

**注記**  
AWS 外でアクセスする基盤モデルをデプロイで使用する場合は、API が利用可能なリージョンについてモデルプロバイダーに確認してください。プロバイダーの API が特定のリージョンでしか利用できない場合、高レイテンシーやタイムアウトなどの不安定性が生じる可能性があります。組織の法務チームやコンプライアンスチームに確認して、リージョンの境界を越えるデータに関する考慮事項を評価することも重要です。

# Cost
<a name="cost"></a>

この AWS ソリューションでは、使用したリソースに対してのみ課金され、最低料金やセットアップ料金は発生しません。ユーザーには、生成 AI のユースケースを起動するために使用するダッシュボードと、デプロイされるすべてのユースケースに対して課金されます。デプロイされるユースケースのコストは、設定によって異なります。設定例:

1. シンプルなデプロイダッシュボードは、1 か月あたり約 20 USD です。

1. シンプルな本番対応のチャットボットのユースケースをデフォルト設定で米国東部 (バージニア北部) にデプロイする場合、Amazon Bedrock を利用し、ドキュメントにはアクセスしないと、1 か月あたり約 200 USD になります。

1. Amazon VPC ユースケースのスケールしたシステムの場合、数万のドキュメントに対して 1 日あたり 8,000 件のクエリをサポートし、コストは 1 か月あたり約 1,500 USD です。ユースケースのコストは、さまざまなモデルプロバイダーの Text ユースケース、検索拡張生成 (RAG) を有効にするかなど、設定によって異なります。


| ワークロードの説明 | 推定コスト (USD/月) | 
| --- | --- | 
|   [デプロイダッシュボードのコスト例](#sample-deployment-dashboard-cost)   |  20 USD/ 月  | 
|   [テキストベースの概念実証のコスト例](#sample-costs-for-a-text-based-proof-of-concept)  (デプロイダッシュボードと単一の Text ユースケース、1 日あたり最大 100 回のインタラクションを含む)  |  40 USD/ 月  | 
|   [高度にスケーラブルな生成 AI クエリエンジンのコスト例](#sample-costs-for-a-highly-scalable-generative-ai-query-engine)  (デプロイダッシュボード、単一の Text ユースケース、最大 10 万ドキュメントの RAG 用の Amazon Kendra インデックス、1 日あたり最大 8,000 件のクエリ、[VPC を有効化](#incremental-cost-of-enabling-amazon-vpc-for-a-use-case))   |  1,500 USD/ 月  | 
|   [エージェントベースの概念実証のコスト例](#sample-costs-for-an-agent-based-proof-of-concept)  (デプロイダッシュボード、Amazon Bedrock ナレッジベースと Amazon Bedrock ガードレールが有効になっている 1 つの Bedrock エージェントユースケース、1 日あたり最大 100 件のインタラクションを含む)  |  840 USD/ 月  | 
|   [MCP サーバーのコスト例](#sample-costs-for-mcp-server)  (デプロイダッシュボード、Lambda 統合用のゲートウェイメソッドを使用した 1 つの MCP サーバーのユースケース、1 日あたり最大 100 件のツール呼び出しを含む)  |  22 USD/月  | 
|   [エージェントビルダーのコスト例](#sample-costs-for-agent-builder)  (デプロイダッシュボード、MCP 統合と長期メモリが有効になっている 1 つのエージェントビルダーのユースケース、1 日あたり最大 100 件のインタラクションを含む)  |  55 USD/ 月  | 
|   [ワークフロービルダーのコスト例](#sample-costs-for-workflow-builder)  (デプロイダッシュボード、3 つのエージェントビルダーのエージェントを含む 1 つのワークフロー、1 日あたり最大 100 回のインタラクションを含む)  |  109 USD/ 月  | 

**重要**  
これらの例は、特定のワークロードのコストを見積もるサポートの目的でのみ提供されています。使用する LLM、設定、または AWS のサービスが異なると、コストが変わる場合があります (サーバーレス/オンデマンド課金と比べたプロビジョン済み/時間課金など)。コスト管理には、[AWS Cost Explorer](https://aws.amazon.com/aws-cost-management/aws-cost-explorer/) を使用して[予算を策定](https://docs.aws.amazon.com/cost-management/latest/userguide/budgets-create.html)することをお勧めします。価格は変更されることがあります。詳細については、このソリューションで使用する AWS のサービスごとに料金ウェブページを参照してください。

## デプロイダッシュボードを実行する場合のコスト例
<a name="sample-deployment-dashboard-cost"></a>

次の表は、米国東部 (バージニア北部) リージョンの 100 アクティブユーザーで、デフォルトパラメータを含むデプロイダッシュボードを使用した場合の 1 か月間のコスト (1 か月あたり約 20 USD) の内訳を示しています。


| AWS のサービス | ディメンション | コスト [USD] | 
| --- | --- | --- | 
|  API Gateway、DynamoDB、CloudFront、Amazon S3、Lambda、Systems Manager Parameter Store  |  キャッシュを有効にしない場合の 1 か月あたり 5,000 回の 512 KB の REST API コール  |  1.97 USD  | 
|  Amazon Cognito  |  高度なセキュリティ機能を有効にし、SAML または OIDC フェデレーションを介してサインインするユーザーなし、1 か月あたり 100 人のアクティブユーザー  |  5.55 USD  | 
|  AWS WAF  |  1 つのウェブ ACL と 7 つの定義済みルールにわたる 10,000 件のウェブリクエスト、ルールグループなし  |  12.60 USD  | 
|  デプロイダッシュボードの合計コスト  |  |   **20.12 USD**   | 

## テキストベースの概念実証のコスト例
<a name="sample-costs-for-a-text-based-proof-of-concept"></a>

デプロイダッシュボードでは、一度に多くのユースケースをデプロイできます。次の表は、1 日あたり 100 件のクエリを LLM で実行する 1 人のビジネスユーザーに対して、RAG なしでデプロイされたユースケースのコスト内訳を説明しています。クエリは WebSocket でテキストメッセージとして送信され、ストリーミングが有効になっていることを前提に、応答はトークンとしてストリーミングで返されます。Amazon Bedrock Nova Pro モデルを使用すると、このユースケースを実行するコストは約 20 USD/月です。


| AWS のサービス | ディメンション | コスト [USD] | 
| --- | --- | --- | 
|  API Gateway (WebSocket)、CloudFront、Lambda、Amazon S3、AWS Systems Manager Parameter Store  |  1 日あたり 100 件のチャットインタラクション。平均メッセージサイズは、メッセージあたり 32 KB、各接続は 5 分。  |  0.61 USD  | 
|  CloudWatch  |  テスト用に冗長モードをオンにした状態で 1.5 GB の CloudWatch ログ  |  7.23 USD  | 
|  Amazon DynamoDB  |  会話履歴テーブル、1 GB のストレージ LLM 設定テーブル、1 GB のストレージ  |  3.05 USD  | 
|   **ユースケースコストの小計 (LLM を除く)**   |  |   **10.89 USD**   | 
|  Amazon Bedrock (Nova Pro)  |  1 日あたり 100 件のインタラクションの前提: \$1 1 日あたり 190,000 の入力トークンの月別コスト = 0.152 USD × 30 日 \$1 1 日あたり 16,000 の出力トークンの月別コスト = 0.0512 USD × 30 日  |  6.10 USD  | 
|   **Amazon Bedrock (Nova Pro) の合計アプリケーションコスト**   |   **10.89 USD (ユースケースのコスト) \$1 6.10 USD (Amazon Bedrock のコスト)**   |   **17.00 USD**   | 

**注記**  
AWS ネットワーク外のサービスに対して行われた推論呼び出しのコストは、これらの見積もりに含まれていません。AWS モデルプロバイダーを使用しない場合は、LLM プロバイダーの料金ガイドを参照してください。  
AWS サービスの料金ガイドは、「[Amazon Bedrock の料金](https://aws.amazon.com/bedrock/pricing/)」と「[Amazon SageMaker AI の料金](https://aws.amazon.com/sagemaker/pricing/)」で確認できます。

## 高度にスケーラブルな生成 AI クエリエンジンのコスト例
<a name="sample-costs-for-a-highly-scalable-generative-ai-query-engine"></a>

次の表は、Amazon Bedrock の Nova Pro モデルを LLM とする RAG 対応ユースケースのコスト内訳を示しています。Bedrock ナレッジベースを追加すると、このユースケースのコストは約 1,300 USD/月になります


| AWS のサービス | ディメンション | コスト [USD] | 
| --- | --- | --- | 
|  API Gateway (WebSocket)  |  1 日あたり 8000 件のチャットインタラクション。平均メッセージサイズは、メッセージあたり 32 KB、各接続は 5 分。  |  38.89 USD  | 
|  CloudFront  |  1 か月あたり 240,000 件のリクエスト、100 GB のデータをインターネットに転送し、1 GB のデータをオリジンに転送する場合  |  8.76 USD  | 
|  Amazon Bedrock (Nova Pro)  |  前提: 入力トークン = promptTemplate (400) \$1 context (400) \$1 chatHistory (1,080) \$1 クエリ入力トークン (20) = 1,900 出力トークン = 160 (平均) 1 日あたり 8,000 件のトランザクションの場合、 日次入力トークンコスト (1,900 x 8,000 = 15,200,000 トークン x トークンあたりの料金 0.0008/1000) 日次出力トークンのコスト (160 x 8,000 = 1,280,000 トークン x トークンあたりの料金 0.0032/1000) 月別コスト ((12.16 USD \$1 4.10 USD) x 30)  |  487.80 USD  | 
|  CloudWatch  |  ログに取り込んだ 5 GB のデータと 1 つのダッシュボードを使用する 24 のメトリクス  |  9.72 USD  | 
|  DynamoDB  |  会話履歴を追跡するための DynamoDB テーブル、各レコードで最大 1 KB のデータ、1 日あたり 8,000 回の読み取りと書き込み  |  11.70 USD  | 
|  Lambda  |  コンテナサイズ - 128 MB、512 MB のエフェメラルストレージ、 認証に使用する 2 つの Lambda 関数 コンテナサイズ - 256 MB、512 MB のエフェメラルストレージ、1 秒あたり 5 件のリクエスト、平均コンピューティング時間 20 秒  |  20.89 USD  | 
|   **ユースケースのコスト合計**   |  |   **577.76 USD/月 \$1 ナレッジベースコスト (以下を参照)**   | 

**注記**  
AWS ネットワーク外のサービスに対して行われる API コールのコストは、これらの見積もりに含まれていません。Amazon Bedrock を使用しない場合は、LLM プロバイダーの料金ガイドを参照してください。

## ナレッジベースを追加する場合のコスト
<a name="cost-of-adding-a-knowledge-base"></a>

ナレッジベースのコストは、使用するナレッジベースのタイプと、ナレッジベースで使用される基盤ベクトルストア (Bedrock の場合) によって異なります。ナレッジベースのプロビジョンと管理は、このソリューションの範囲に含まれていません。

 **Amazon Bedrock ナレッジベース** 

このソリューションでは、Amazon Bedrock ナレッジベースに関連するリソースを管理またはプロビジョンは行いません。Amazon Bedrock を使用する場合、ナレッジベース機能自体の使用にはコストは発生しません。ただし、ユースケースが各クエリで使用する埋め込みモデルの使用に対して料金が発生します。さらに、ナレッジベースの基盤ベクトルストアでは ([Amazon OpenSearch Service](https://aws.amazon.com/opensearch-service) のインデックスや Amazon Relational Database Service 内のデータベースなど) に、ここで提供したり計算したりできない関連コストが発生します。

上記の高度にスケーラブルな生成 AI クエリエンジンのシナリオの場合、Amazon Bedrock 埋め込みモデルを呼び出すためにこのサービスで発生するコストは次のとおりです。


| AWS のサービス | ディメンション | コスト [USD] | 
| --- | --- | --- | 
|  Amazon Bedrock (Amazon Titan Text Embeddings V2)  |  1 クエリあたり 1,900 入力トークンで、1 日あたり 8,000 件のクエリ = 15,200,000 トークン = 1 日あたり 0.30 USD 日別コスト x 30 日 = 9.00 USD の月額コスト  |  9.00 USD  | 
|  Amazon OpenSearch Service (Serverless) の使用例  |  4 つの OpenSearch Compute Unit (OCU) を使用する基本的なサーバーレス設定 (最低料金) = 1 日あたり 23.04 USD 日別コスト x 30 日 = 691.20 USD  これは概算値であり、ワークロードによってはさらに多くの OCU が必要になります。既にプロビジョン済みの OpenSearch リソースを使用する場合のコストはこれより低くなります。   |  691.20 USD  | 
|   **追加コストの合計**   |  |  700.20 USD  | 

 **Amazon Kendra** 

このソリューションでは、Kendra インデックスを自動的にプロビジョンすることも、ユーザー独自のインデックスを使用することもできます。上記の高度にスケーラブルな生成 AI クエリエンジンに適した設定を実行する場合のコストは次のとおりです。


| AWS のサービス | ディメンション | コスト [USD] | 
| --- | --- | --- | 
|  Amazon Kendra  |  Amazon Kendra Enterprise Edition と 0～50 のデータソース、1 日あたり 0～8,000 件のクエリ、最大 100,000 件のドキュメント  |  1,008.00 USD  | 

**注記**  
Amazon Kendra インデックスはユースケース間で共有できます。ただしこれにより、インデックスあたりのクエリ数が増加する可能性があります。これが Amazon Kendra Enterprise Edition の範囲外となる場合は、追加料金が適用されます。

## ユースケースで Amazon VPC を有効にする場合の追加コスト
<a name="incremental-cost-of-enabling-amazon-vpc-for-a-use-case"></a>

次の表は、2 つの AZ にデプロイされたユースケースで Amazon VPC を有効にする場合のコスト内訳を示しています。


| AWS のサービス | ディメンション | コスト [USD] | 
| --- | --- | --- | 
|  Amazon NAT Gateway  |  前提条件: 2 つの AZ にデプロイ、各 AZ に 1 つの NAT ゲートウェイ。NAT ゲートウェイを介して 100 GB のデータ処理を 730 時間、1 か月あたり 100 GB のデータ処理  |  74.70 USD  | 
|  AWS PrivateLink (VPC エンドポイント)  |  前提条件: 2 つの AZ にデプロイ、各 AZ に 1 つのプライベートサブネット、1 つの VPC エンドポイント、2 つの Elastic Network Interface (ENI)。 6 つの VPC エンドポイント、VPC エンドポイントあたり 2 つの ENI、1 か月で 730 時間、1,024 GB のデータを処理  |  97.84 USD  | 
|  パブリック IPv4 アドレス  |  前提: 2 つの AZ にデプロイ、各 AZ に 1 つのパブリックサブネット、各パブリックサブネットに 1 つの NAT ゲートウェイ。各 NAT ゲートウェイには 1 つのアクティブなパブリック IPv4 が設定されている。 2 つのアクティブなパブリック IPv4 アドレス x 730 時間 / 月 x 0.005 USD / 時間 = 7.3 USD  |  7.30 USD  | 
|  追加料金 (Amazon VPC の場合)  |  |   **179.93 USD**   | 

## プロビジョンドスループットを使用する場合のコストへの影響
<a name="cost-implications-when-using-provisioned-throughput"></a>

プロビジョンドスループットのコストは、プロビジョンしたモデルのタイプと契約期間、契約期間に選択されたモデルユニットによって異なります。プロビジョンドスループットの使用には追加コストがかかります。

詳細と最新の料金については、「[Bedrock の料金](https://aws.amazon.com/bedrock/pricing/)」を参照してください。

## クロスリージョン推論の使用コスト
<a name="cost-for-using-cross-region-inference"></a>

[クロスリージョン推論](https://docs.aws.amazon.com/bedrock/latest/userguide/cross-region-inference.html)を使用する場合、追加のルーティングやデータ転送についての料金は発生しません。モデルについては、ソースまたはプライマリリージョンと同じ料金がトークンごとに課金されます。

## エージェントベースの概念実証のコスト例
<a name="sample-costs-for-an-agent-based-proof-of-concept"></a>

Amazon Bedrock エージェントを使用すると、使用するモデルやナレッジベース (RAG が有効になっている場合) など、エージェントを構成するコンポーネントと追加した追加機能に基づいて料金が発生します。次の表は、オンデマンド Claude 3.5 Sonnet モデル、Amazon Bedrock ナレッジベース、Amazon Bedrock ガードレールで設定した Bedrock エージェントユースケースのコスト内訳を説明しています。

[Amazon Bedrock ナレッジベースを追加するコスト](#cost-of-adding-a-knowledge-base)と同様に、このソリューションでは Amazon Bedrock エージェントに関連するリソースの管理やプロビジョニングは行いません。このソリューションでは Amazon Bedrock ナレッジベースの使用にコストは発生しないとはいえ、以下のコストも発生します。
+ 送信されるクエリごとの埋め込みモデルの使用コスト
+ ナレッジベースで使用するベクトルストア (Amazon OpenSearch Service のインデックス、Amazon RDS 内のデータベースなど) のコスト

次の表では、クエリごとに 1,900 の入力トークンと 160 の出力トークンを使用して、1 日あたり 100 件のインタラクションがあることを想定しています。

**注記**  
この Bedrock エージェントユースケース例では、外部 API を使用するように設定されたアクショングループがある場合には、これらのコストが追加されます。これらのコストは、この表の計算の範囲外です。


| AWS のサービス | ディメンション | コスト [USD] | 
| --- | --- | --- | 
|  API Gateway (WebSocket)、CloudFront、Lambda、Amazon S3、Systems Manager Parameter Store  |  1 日あたり 100 チャットインタラクション、1 メッセージにつき平均メッセージサイズは 32 KB、1 接続につき 5 分。  |  0.61 USD  | 
|  CloudWatch  |  テスト用に冗長モードをオンにした状態で 1.5 GB の CloudWatch ログ  |  7.23 USD  | 
|  DynamoDB  |  1 KB のレコードサイズ用の LLM 設定テーブルと 1 GB ストレージ  |  0.25 USD  | 
|   **コストの小計 (LLM を除く)**   |  |   **8.09 USD**   | 
|  Anthropic Claude 3.5 Sonnet  |  \$1 1 日あたり 190,000 の入力トークンの日別コスト (0.003/1,000 トークン) = 0.57 USD \$1 日別コスト × 30 日 = 17.10 USD \$1 1 日あたり 16,000 の出力トークンの日別コスト (0.015/1,000 トークン) = 0.24 USD \$1 日別コスト × 30 日 = 7.20 USD  |  24.30 USD  | 
|  Amazon Bedrock ナレッジベース用の Amazon Bedrock (Amazon Titan Text Embeddings V2)  |  1 日あたり 190,000 の入力トークンの日別コスト (0.00002/1000 トークン) = 0.004 日別コスト × 30 日 = 0.12 USD  |  0.12 USD  | 
|  Amazon OpenSearch Service (Serverless) の使用例  |  4 つの OpenSearch Compute Unit (OCU) を搭載する基本的なサーバーレス構成 (最低請求額) = 1 日あたり 23.04 USD 日別コスト × 30 日 = 691.20 USD  |  691.20 USD  | 
|  Amazon Bedrock ガードレール  |  190K トークンは、760,000 (190,000 × 4) 文字と 3,800 テキスト単位 (760K 文字/200) とほぼ同等です。 コンテンツフィルター、個人を特定できる情報 (PII) フィルター、機密情報フィルター (正規表現)、単語フィルターで設定されたガードレールの場合を考えてみます。 1 日のコンテンツフィルターのコスト (0.75/1000 テキストユニット) \$1 PII フィルターのコスト (0.1 USD/1,000 テキストユニット) \$1 機密情報フィルター (正規表現) \$1 ワードフィルター = 2.85 USD \$1 0.38 USD \$1 0 USD \$1 0 USD 月別コスト = 日別コスト × 30 日 = 96.90 USD  |  96.90 USD  | 
|   **Anthropic Claude 3.5 Sonnet でサポートされるエージェントのアプリケーションコスト合計**   |   *8.09 USD (ユースケースコスト) \$1* **812.52 USD (その他のエージェント設定)**   |  820.61 USD  | 

**注記**  
AWS モデルプロバイダーを使用しない場合は、LLM プロバイダーの料金ガイドを参照してください。AWS サービスの料金ガイドは、「[Amazon Bedrock の料金](https://aws.amazon.com/bedrock/pricing/)」と「[Amazon SageMaker AI の料金](https://aws.amazon.com/sagemaker/pricing/)」で確認できます。

## MCP サーバーのコスト例
<a name="sample-costs-for-mcp-server"></a>

MCP サーバーユースケースにより、Amazon Bedrock AgentCore でのモデルコンテキストプロトコルサーバーのデプロイと管理が可能になります。次の表は、ゲートウェイメソッドを使用して既存の Lambda 関数をラップする MCP サーバーのユースケースのコスト内訳を示しています。

このソリューションは、AgentCore Gateway のデプロイと設定を管理します。以下の料金が請求されます。
+ インフラストラクチャコスト (API Gateway、Lambda、DynamoDB、CloudWatch、S3)
+ AgentCore Gateway の消費量 (ツール呼び出しごと)
+ Lambda 関数の実行コスト (Lambda ターゲットを持つゲートウェイメソッドの場合)
+ 外部 API コスト (該当する場合、API または MCP サーバーターゲットを使用するゲートウェイメソッドの場合)


| Item | 計算 | Cost | 
| --- | --- | --- | 
|  Amazon API Gateway (REST API)  |  1 日あたり 100 回のツール呼び出し × 30 日 = 1 か月あたり 3,000 リクエスト  |  0.05 USD  | 
|  AWS Lambda (オーケストレーション)  |  1 日あたり 100 回の呼び出し × 30 日 × 1 秒平均 × 512 MB = 1 か月あたり 3,000 GB-秒  |  0.05 USD  | 
|  Amazon DynamoDB  |  1 か月あたり 3,000 回の読み取り/書き込みリクエスト \$1 1 GB ストレージ  |  0.15 USD  | 
|  Amazon CloudWatch  |  3,000 回の呼び出しに対する標準モニタリングとログ記録  |  1.00 USD  | 
|  Amazon S3  |  設定ストレージとログ (最小使用量)  |  0.25 USD  | 
|  Amazon Bedrock AgentCore Gateway  |  1 か月あたり 3,000 ツール呼び出し  |  0.05 USD  | 
|  ターゲット Lambda 関数  |  1 日あたり 100 回の呼び出し × 30 日 × 0.5 秒 × 128 MB = 1 か月あたり 1,500 GB-秒  |  0.25 USD  | 
|   **合計月額コスト**   |   *1.75 USD (インフラストラクチャ) \$1 0.05 USD (AgentCore Gateway)*   |  1.80 USD  | 

**注記**  
コストは、デプロイ方法 (ゲートウェイとランタイム)、ターゲットタイプ、使用パターンによって異なります。ランタイムメソッドのデプロイでは、ゲートウェイ料金ではなく AgentCore Runtime 料金が発生します。外部 API コストとカスタムコンテナホスティングコストは別途発生します。

## エージェントビルダーのコスト例
<a name="sample-costs-for-agent-builder"></a>

エージェントビルダーを使用すると、Amazon Bedrock AgentCore にカスタムエージェントを作成してデプロイできます。次の表は、Claude 3.5 Sonnet、MCP サーバー統合、長期メモリが有効になっているエージェントビルダーのユースケースのコスト内訳を示しています。

このソリューションは、AgentCore Runtime のデプロイと設定を管理します。以下の料金が請求されます。
+ インフラストラクチャコスト (API Gateway、Lambda、DynamoDB、CloudWatch、S3)
+ AgentCore Runtime 消費量 (実際のエージェント実行時間に基づく CPU およびメモリ時間)
+ 基盤モデル推論 (入力トークンと出力トークン)
+ AgentCore Memory (短期イベントと長期保存/取得)

次の表では、1 日あたり 100 件のインタラクション、クエリごとに 1,900 の入力トークンと 160 の出力トークン、インタラクションあたりの平均エージェント実行時間が 5 秒であると想定しています。


| AWS のサービス | ディメンション | コスト [USD] | 
| --- | --- | --- | 
|  API Gateway (WebSocket)、CloudFront、Lambda、Amazon S3、Systems Manager Parameter Store  |  1 日あたり 100 チャットインタラクション、1 メッセージにつき平均メッセージサイズは 32 KB、1 接続につき 5 分。  |  0.61 USD  | 
|  CloudWatch  |  テスト用に冗長モードをオンにした状態で 1.5 GB の CloudWatch ログ  |  7.23 USD  | 
|  DynamoDB  |  1 KB のレコードサイズ用の LLM 設定テーブルと 1 GB ストレージ  |  0.25 USD  | 
|   **インフラストラクチャコストの小計**   |  |   **8.09 USD**   | 
|  Amazon Bedrock AgentCore Runtime  |  \$1 CPU: 1 vCPU × 5 秒 × 100 インタラクション = 125 vCPU-秒/日 = 0.140 vCPU-時間/日 \$1 日別コスト: 0.140 × 0.0895 USD = 0.013 USD \$1 月別コスト: 0.013 × 30 = 0.38 USD \$1 メモリ: 512 MB (0.5 GB) × 5 秒 × 100 インタラクション = 250 GB-秒/日 = 0.069 GB-時間/日 \$1 日別コスト: 0.069 × 0.00945 USD = 0.0007 USD \$1 月別コスト: 0.0007 × 30 = 0.02 USD  |  0.40 USD  | 
|  Anthropic Claude 3.5 Sonnet  |  \$1 1 日あたり 190,000 入力トークンの日別コスト (0.003/1,000 トークン) = 0.57 USD \$1 日別コスト × 30 日 = 17.10 USD \$1 1 日あたり 16,000 の出力トークンの日別コスト (0.015/1,000 トークン) = 0.24 USD \$1 日別コスト × 30 日 = 7.20 USD  |  24.30 USD  | 
|  Amazon Bedrock AgentCore Memory  |  \$1 短期メモリ: 100 件の新規イベント/日 × 0.25 USD/1,000 件のイベント = 0.025 USD/日 \$1 月別コスト: 0.025 USD × 30 = 0.75 USD \$1 長期メモリストレージ (組み込み戦略): 100 レコード × 0.75 USD/1,000 レコード/月 = 0.075 USD/月 \$1 長期メモリ取得: 100 取得/日 × 0.50 USD/1,000 取得 = 0.05 USD/日 \$1 月別コスト: 0.05 USD × 30 = 1.50 USD  |  2.33 USD  | 
|   **Claude 3.5 Sonnet を使用したエージェントビルダーの合計アプリケーションコスト**   |   *8.09 USD (インフラストラクチャ) \$1 0.40 USD (AgentCore Runtime) \$1 24.30 USD (モデル) \$1 2.33 USD (メモリ)*   |   **35.12 USD**   | 

**注記**  
AgentCore Runtime の料金は消費ベースです。実際のコストは以下によって異なります。  
エージェントの実行時間 (アクティブな処理中の CPU とメモリの使用量)
インタラクションの数とその複雑さ
MCP ツールの使用状況 (ツール実行用の追加の CPU/メモリ)
メモリ設定 (短期メモリと長期メモリの有効化)
AgentCore の料金の詳細については、「[Amazon Bedrock の料金](https://aws.amazon.com/bedrock/agentcore/pricing/)」を参照してください。

**注記**  
外部 API またはサービスを呼び出す MCP サーバーを使用する場合、それらのコストは追加となり、この計算の範囲外です。同様に、AgentCore Browser または Code Interpreter ツールを使用する場合、消費ベースの料金は vCPU 時間あたり 0.0895 USD、GB 時間あたり 0.00945 USD の料金が適用されます。

## ワークフロービルダーのコスト例
<a name="sample-costs-for-workflow-builder"></a>

ワークフロービルダーは、複数のエージェントビルダーのエージェントをオーケストレーションするスーパーバイザーエージェントを作成します。次の表は、1 つのスーパーバイザーエージェントと 3 つの専門エージェントビルダーエージェントを含むワークフローのコスト内訳を示しています。すべて Claude 3.5 Sonnet で設定され、長期メモリが有効になっています。

前提: 1 日あたり 100 回のインタラクション、インタラクションごとに平均 2 回のエージェント委任、エージェントあたり 5 秒の実行時間。


| AWS のサービス | ディメンション | コスト [USD] | 
| --- | --- | --- | 
|  API Gateway (WebSocket)、CloudFront、Lambda、Amazon S3、Systems Manager Parameter Store  |  1 日あたり 100 チャットインタラクション、1 メッセージにつき平均メッセージサイズは 32 KB、1 接続につき 5 分。  |  0.61 USD  | 
|  CloudWatch  |  テスト用に冗長モードをオンにした状態で 1.5 GB の CloudWatch ログ  |  7.23 USD  | 
|  DynamoDB  |  1 KB のレコードサイズ用の LLM 設定テーブルと 1 GB ストレージ  |  0.25 USD  | 
|   **インフラストラクチャコストの小計**   |  |   **8.09 USD**   | 
|  Amazon Bedrock AgentCore Runtime (スーパーバイザーエージェント)  |  \$1 CPU: 1 vCPU × 5 秒 × 100 インタラクション = 0.140 vCPU-時間/日 × 30 = 0.38 USD \$1 メモリ: 0.5 GB × 5 秒 × 100 インタラクション = 0.069 GB-時間/日 × 30 = 0.02 USD  |  0.40 USD  | 
|  Amazon Bedrock AgentCore Runtime (3 つの専門エージェント)  |  \$1 インタラクションあたり平均 2 回の委任 = 200 エージェント実行/日 \$1 CPU: 1 vCPU × 5 秒 × 200 = 0.278 vCPU-時間/日 × 30 = 0.75 USD \$1 メモリ: 0.5 GB × 5 秒 × 200 = 0.139 GB-時間/日 × 30 = 0.04 USD  |  0.79 USD  | 
|  Anthropic Claude 3.5 Sonnet (スーパーバイザーエージェント)  |  \$1 入力: 190,000 トークン/日 × 0.003 USD/1,000 = 0.57 USD/日 × 30 = 17.10 USD \$1 出力: 16,000 トークン/日 × 0.015 USD/1,000 = 0.24 USD/日 × 30 = 7.20 USD  |  24.30 USD  | 
|  Anthropic Claude 3.5 Sonnet (専門エージェント)  |  \$1 インタラクションごとに平均 2 回の委任 \$1 入力: 380,000 トークン/日 × 0.003/1,000 USD = 1.14 USD/日 × 30 = 34.20 USD \$1 出力: 32,000 トークン/日 × 0.015/1,000 = 0.48 USD/日 × 30 = 14.40 USD  |  48.60 USD  | 
|  Amazon Bedrock AgentCore Memory (スーパーバイザーエージェント)  |  \$1 短期: 100 イベント/日 × 0.25 USD/1,000 × 30 = 0.75 USD \$1 長期ストレージ: 100 レコード × 0.75 USD/1,000 = 0.08 USD \$1 長期取得: 100 取得/日 × 0.50 USD/1,000 × 30 = 1.50 USD  |  2.33 USD  | 
|  Amazon Bedrock AgentCore Memory (専門エージェント)  |  \$1 短期: 200 イベント/日 × 0.25 USD/1,000 × 30 = 1.50 USD \$1 長期ストレージ: 200 レコード × 0.75 USD/1,000 = 0.15 USD \$1 長期取得: 200 取得/日 × 0.50 USD/1,000 × 30 = 3.00 USD  |  4.65 USD  | 
|   **ワークフロービルダー (3 つのエージェント) の合計アプリケーションコスト**   |   *8.09 USD (インフラストラクチャ) \$1 1.19 USD (AgentCore Runtime) \$1 72.90 USD (モデル) \$1 6.98 USD (メモリ)*   |   **89.16 USD**   | 

**注記**  
委任レートが高くなるとトークンの消費量が比例的に増加します
AgentCore の料金の詳細については、「[Amazon Bedrock の料金](https://aws.amazon.com/bedrock/pricing/)」を参照してください。

# セキュリティ
<a name="security-1"></a>

AWS インフラストラクチャでシステムを構築すると、お客様と AWS の間でセキュリティ上の責任が分担されます。この[責任共有モデル](https://aws.amazon.com/compliance/shared-responsibility-model/)により、AWS が、ホストオペレーティングシステムと仮想化レイヤーからサービスが運用されている施設の物理的なセキュリティに至るまでの要素を運用、管理、および制御するため、お客様の運用上の負担を軽減するのに役立ちます。AWS セキュリティの詳細については、「[AWS クラウドセキュリティ](https://aws.amazon.com/security/)」を参照してください。

## Amazon Bedrock で基盤モデルを使用する
<a name="using-third-party-models-on-amazon-bedrock"></a>

Amazon Bedrockは、Amazon Nova モデルから他の主要な基盤モデル (FM) まで、幅広いモデルコレクションをホストしています。Amazon Bedrock を使用する場合、すべてのモデルが AWS インフラストラクチャ内でホストされます。つまり、Amazon Bedrock を LLM プロバイダーとして使用する場合、すべての推論リクエストは AWS ネットワーク内に残り、ネットワークトラフィックがリージョン外に出ることはありません。

**注記**  
Amazon Bedrock で利用できるすべての基盤モデル (FM) は、AWS が管理、所有する AWS インフラストラクチャ上で直接ホストされます。モデルプロバイダーは、プロンプトやそれに対する応答などの顧客データや Amazon Bedrock サービスログにアクセスすることはできません。Amazon Bedrock のセキュリティ体制に関する詳細については、「*Amazon Bedrock ユーザーガイド*」の「[Data protection in Amazon Bedrock](https://docs.aws.amazon.com/bedrock/)」を参照してください。

## IAM ロール
<a name="iam-roles"></a>

IAM ロールを使用すると、AWS クラウドのサービスとユーザーに、きめ細かなアクセスポリシーとアクセス許可を割り当てることができます。このソリューションでは、リージョンのリソースを作成するためのアクセス権をソリューションの Lambda 関数に付与する IAM ロールが作成されます。

## CloudWatch ログ
<a name="cloudwatch-logs"></a>

デプロイダッシュボードのモデル選択ページの [追加設定] を使用して、ユースケースをデプロイするときに詳細モードを有効にできます。詳細モードでは、デバッグや迅速な実験に役立つ詳細な CloudWatch ログが有効になります。

**注記**  
詳細モードを有効にすると、ナレッジベースから取得したドキュメント (RAG が有効になっている場合) とプロンプトもログに記録されます。これには機密情報が含まれる場合があります。

# VPC
<a name="vpc"></a>

このソリューションは、Amazon VPC 設定に関して 2 つのオプションが提供されています。

1. ソリューションに Amazon VPC を構築させる

1. ソリューション内で使用するために BYO Amazon VPC (独自の Amazon VPC) を使用して管理する。

## ソリューションに Amazon VPC を構築させる
<a name="let-the-solution-build-an-amazon-vpc-for-you"></a>

ソリューションに Amazon VPC を構築させるオプションを選択すると、デフォルトでは、10.10.0.0/20 の CIDR 範囲を持つ 2-AZ アーキテクチャとしてデプロイされます。[Amazon VPC IP Address Manager (IPAM)](https://docs.aws.amazon.com/vpc/latest/ipam/what-it-is-ipam.html) を、各 AZ に 1 つのパブリックサブネットと 1 つのプライベートサブネットで使用するオプションもあります。このソリューションでは、各パブリックサブネットに NAT ゲートウェイを作成し、プライベートサブネットに [ENI](https://docs.aws.amazon.com/Lambda/latest/dg/foundation-networking.html) を作成するように Lambda 関数を設定します。さらに、この設定はルートテーブルとそのエントリ、セキュリティグループとそのルール、ネットワーク ACL、VPC エンドポイント (ゲートウェイとインターフェイスエンドポイント) を作成します。

## 独自の Amazon VPC を管理する
<a name="managing-your-own-amazon-vpc"></a>

Amazon VPC を使用してソリューションをデプロイする場合、AWS アカウントとリージョンの既存の Amazon VPC を使用するオプションがあります。高可用性を確保するために、少なくとも 2 つのアベイラビリティーゾーンで VPC を利用可能にすることをお勧めします。また、VPC とルートテーブルの設定には、次の VPC エンドポイントとそれに関連する IAM ポリシーが必要です。

### デプロイメントダッシュボード用の Amazon VPC
<a name="deployment-dashboard-2"></a>

1.  [DynamoDB のゲートウェイエンドポイント](https://docs.aws.amazon.com/vpc/latest/privatelink/vpc-endpoints-ddb.html)

1.  [S3 のゲートウェイエンドポイント](https://docs.aws.amazon.com/vpc/latest/privatelink/vpc-endpoints-s3.html)。

1.  [CloudWatch のインターフェイスエンドポイント](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CloudWatch-logs-and-interface-VPC.html)

1.  [AWS CloudFormation のインターフェイスエンドポイント](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/cfn-vpce-bucketnames.html)

### ユースケース用の Amazon VPC
<a name="use-cases-2"></a>

1.  [DynamoDB のゲートウェイエンドポイント](https://docs.aws.amazon.com/vpc/latest/privatelink/vpc-endpoints-ddb.html)

1.  [S3 のゲートウェイエンドポイント](https://docs.aws.amazon.com/vpc/latest/privatelink/vpc-endpoints-s3.html)。

1.  [CloudWatch のインターフェイスエンドポイント](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CloudWatch-logs-and-interface-VPC.html)

1.  [Systems Manager Parameter Store のインターフェイスエンドポイント](https://docs.aws.amazon.com/systems-manager/latest/userguide/setup-create-vpc.html)
**注記**  
このソリューションで必要なのは `com.amazonaws.region.ssm` のみです。

1.  [Amazon Bedrock のインターフェイスエンドポイント (bedrock-runtime、agent-runtime、bedrock-agent-runtime)](https://docs.aws.amazon.com/bedrock/latest/userguide/vpc-interface-endpoints.html)

1. オプション: デプロイで Amazon Kendra をナレッジベースとして使用する場合は、[Amazon Kendra のインターフェイスエンドポイント](https://docs.aws.amazon.com/kendra/latest/dg/vpc-interface-endpoints.html)が必要です。

1. オプション: デプロイで、Amazon Bedrock で任意の LLM を使用する場合は、[Amazon Bedrock のインターフェイスエンドポイント](https://docs.aws.amazon.com/bedrock/latest/userguide/vpc-interface-endpoints.html)が必要です。
**注記**  
このソリューションに必要なのは `com.amazonaws.region.bedrock-runtime` のみです。

1. オプション: デプロイで、LLM に Amazon SageMaker AI を使用する場合は、[Amazon SageMaker AI のインターフェイスエンドポイント](https://docs.aws.amazon.com/sagemaker/latest/dg/interface-vpc-endpoint.html)が必要です。

**注記**  
**Bring your own VPC deployment** (Bring-Your-Own-VPC デプロイ) オプションを使用する場合でも、ソリューションによって VPC 設定が削除または変更されることはありません。ただし、**Create a VPC for me** (VPC の自動作成) オプションでソリューションが作成する VPC はすべて削除されます。このため、ソリューションが管理する VPC をスタック/デプロイ間で共有する場合は注意が必要です。  
例えば、デプロイ A では **Create a VPC for me** (VPC の自動作成) オプションを使用します。デプロイ B では、デプロイ A で作成された VPC を使用する **Bring my own VPC** (自分の VPC を使用) を使用します。デプロイ A がデプロイ B より前に削除されると、VPC が削除されてしまうためデプロイ B は機能しなくなります。また、デプロイ B は Lambda 関数によって作成された ENI を使用しているため、デプロイ A を削除するとエラーが発生し、残存リソースが保持される可能性があります。

# Amazon CloudFront
<a name="amazon-cloudfront"></a>

このソリューションでは、Amazon S3 バケットで[ホストされる](https://docs.aws.amazon.com/AmazonS3/latest/dev/WebsiteHosting.html)静的なウェブコンソールをデプロイします。レイテンシーを軽減し、セキュリティを向上させるために、このソリューションには、オリジンアクセスアイデンティティを持つ CloudFront ディストリビューションが含まれています。オリジンアクセスアイデンティティは、このソリューションのウェブサイトバケットにあるコンテンツに、パブリックアクセスを提供する CloudFront ユーザーです。詳細については、[Amazon CloudFront デベロッパーガイド](https://docs.aws.amazon.com/AmazonCloudFront/latest/DeveloperGuide/private-content-restricting-access-to-s3.html)の*オリジンアクセスアイデンティティを使用して Amazon S3 コンテンツへのアクセスを制限する*を参照してください。

**注記**  
CloudFront は、アカウントレベルのソフトクォータ制限として 20 の Response Header Policies を提供します。このソリューションは、セキュリティ上の目的でカスタム Response Header Policies を作成します。AWS での生成 AI アプリケーションビルダーまたはそのユースケースのデプロイが 20 を超える場合、クォータ制限に達したことが原因で新しいデプロイが失敗する可能性があります。

この問題を解決するには、以下の手順に従って、AWS Service Quotas コンソールで **Response Header Policies** クォータのクォータ引き上げをリクエストできます。

1. AWS Service Quotas コンソールを開きます。

1. ナビゲーションペインで、[**AWS services (AWS のサービス)**] を選択します。

1. **[Amazon CloudFront]** を検索して選択します。

1. **[Response Header Policies]** のクォータまでスクロールして、**[Request quota increase]** を選択します。

1. プロンプトに従って、AWS アカウントのクォータ制限の引き上げをリクエストします。

**Response Header Policies** クォータを引き上げると、AWS での生成 AI アプリケーションビルダーの新しいデプロイやそのユースケースで、クォータ制限が原因の失敗を回避できます。

# クォータ
<a name="quotas"></a>

サービスクォータ (制限とも呼ばれます) は、AWS アカウントのサービスリソースまたはオペレーションの最大数です。

## このソリューション内の AWS サービスのクォータ
<a name="quotas-for-aws-services-in-this-solution"></a>

[このソリューションに実装されている各サービス](architecture-details.md#aws-services-in-this-solution)に十分なクォータがあることを確認してください。詳細については、「[AWS サービスクォータ](https://docs.aws.amazon.com/general/latest/gr/aws_service_limits.html)」を参照してください。

次のリンクを使用すると、各サービスのページに移動できます。ページを切り替えずに、ドキュメント内のすべての AWS サービスのサービスクォータを表示するには、この PDF の「[Service endpoints and quotas](https://docs.aws.amazon.com/general/latest/gr/aws-general.pdf#aws-service-information)」ページの情報を参照してください。

## Amazon Bedrock AgentCore のクォータ
<a name="agentcore-quotas"></a>

エージェントビルダーのデプロイでは、次の Amazon [Bedrock AgentCore サービスクォータ](https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/bedrock-agentcore-limits.html)に注意してください。


| クォータ | 米国東部 (バージニア北部) | その他のリージョン | 
| --- | --- | --- | 
|  アカウントあたりのアクティブなセッションワークロード  |  1,000  |  500  | 
|  アカウントあたりのエージェント総数  |  1,000  |  1,000  | 
|  アカウントあたりのバージョン  |  1,000  |  1,000  | 