翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
地理的クロスリージョン推論
地理的クロスリージョン推論は、データ処理を指定された地理的境界 (米国、欧州、APAC など) 内に維持し、単一リージョン推論よりも高いスループットを提供します。このオプションは、データレジデンシー要件とコンプライアンス規制がある組織に最適です。
地理的クロスリージョン推論に関する考慮事項
地理的クロスリージョン推論に関する次の情報に注意してください。
-
地域 (米国、欧州、APAC など) に関連付けられた推論プロファイルへのクロスリージョン推論リクエストは、データが最初に存在する地域の一部 AWS リージョン である 内に保持されます。たとえば、米国内で行われたリクエストは、米国内 AWS リージョン の 内に保持されます。データはソースリージョンにのみ保存されますが、クロスリージョン推論を使用する場合、入力プロンプトと出力結果がソースリージョン外に移動することがあります。すべてのデータは Amazon の安全なネットワーク経由で暗号化されて送信されます。
-
地域 (米国、欧州、APAC など) に関連付けられた推論プロファイルを使用する場合のクロスリージョンスループットのデフォルトのクォータを確認するには、「AWS 全般のリファレンス」の「Amazon Bedrock サービスクォータ」で「${Model} のクロスリージョンモデル推論リクエスト/分」と「${Model} のクロスリージョンモデル推論トークン/分」の値を参照してください。
地理的クロスリージョン推論の IAM ポリシー要件
IAM ユーザーまたはロールが地理的クロスリージョン推論プロファイルを呼び出せるようにするには、次のリソースへのアクセスを許可する必要があります。
-
地域固有のクロスリージョン推論プロファイル (これらのプロファイルには、
us、eu、 などの地理的プレフィックスがありますapac) -
ソースリージョンの基盤モデル
-
地理的プロファイルにリストされているすべての送信先リージョンの基盤モデル
次のポリシー例では、Claude Sonnet 4.5 基盤モデルを米国の地理的クロスリージョン推論プロファイルで使用するために必要なアクセス許可を付与します。ここで、送信元リージョンは us-east-1で、送信先リージョンは us-east-1、us-east-2、および ですus-west-2。
{ "Version": "2012-10-17", "Statement": [ { "Sid": "GrantGeoCrisInferenceProfileAccess", "Effect": "Allow", "Action": "bedrock:InvokeModel", "Resource": [ "arn:aws:bedrock:us-east-1:<ACCOUNT_ID>:inference-profile/us.anthropic.claude-sonnet-4-5-20250929-v1:0" ] }, { "Sid": "GrantGeoCrisModelAccess", "Effect": "Allow", "Action": "bedrock:InvokeModel", "Resource": [ "arn:aws:bedrock:us-east-1::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0", "arn:aws:bedrock:us-east-2::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0", "arn:aws:bedrock:us-west-2::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0" ], "Condition": { "StringEquals": { "bedrock:InferenceProfileArn": "arn:aws:bedrock:us-east-1:<ACCOUNT_ID>:inference-profile/us.anthropic.claude-sonnet-4-5-20250929-v1:0" } } } ] }
最初のステートメントは、リクエスト元のリージョンから送信されるリクエストの地理的クロスリージョン推論プロファイルへの bedrock:InvokeModel API アクセスを許可します。2 番目のステートメントは、リクエスト元のリージョンと推論プロファイルにリストされているすべての送信先リージョンの両方で、基盤モデルへの bedrock:InvokeModel API アクセスを許可します。
地理的クロスリージョン推論のサービスコントロールポリシーの要件
多くの組織は、セキュリティとコンプライアンスのために AWS Organizations のサービスコントロールポリシーを通じてリージョンのアクセスコントロールを実装しています。組織のセキュリティポリシーで SCPs を使用して未使用のリージョンをブロックする場合は、リージョン固有の SCP 条件が、ソースリージョンの地理的クロスリージョン推論プロファイルにリストされているすべての宛先リージョンへのアクセスを許可していることを確認する必要があります。
地理的クロスリージョン推論では、ソースリージョン (API コールを行う場所) と宛先リージョン (リクエストをルーティングできる場所) の関係を理解する必要があります。推論プロファイルのドキュメントを確認して、ソースリージョンのすべての送信先リージョンを特定し、SCPs がそれらのすべての送信先リージョンへのアクセスを許可していることを確認します。
たとえば、US Anthropic Claude Sonnet 4.5 Geographic プロファイルを使用して us-east-1 (ソースリージョン) から を呼び出す場合、リクエストは us-east-1、us-east-2、および us-west-2 (宛先リージョン) にルーティングできます。SCP が us-east-1 のみへのアクセスを制限する場合、us-east-2 または us-west-2 にルーティングしようとすると、クロスリージョン推論は失敗します。したがって、呼び出し元のリージョンに関係なく、SCP の 3 つの送信先リージョンすべてを許可する必要があります。
リージョンの除外用に SCPs を設定するときは、推論プロファイルの送信先リージョンをブロックすると、送信元リージョンが引き続きアクセス可能であっても、クロスリージョン推論が正しく機能しなくなることに注意してください。グローバルクロスリージョン推論の SCP 要件については、「」を参照してくださいグローバルクロスリージョン推論のサービスコントロールポリシーの要件。
セキュリティを向上させるには、 bedrock:InferenceProfileArn条件を使用して特定の推論プロファイルへのアクセスを制限することを検討してください。これにより、使用できる推論プロファイルを制限しながら、必要なリージョンへのアクセスを許可できます。
地理的クロスリージョン推論を使用する
地理的クロスリージョン推論を使用するには、次の方法でモデル推論を実行するときに推論プロファイルを含めます。
-
オンデマンドモデル推論 – InvokeModel、InvokeModelWithResponseStream、Converse、または ConverseStream リクエストを送信するときに、推論プロファイルの ID を
modelIdと指定します。推論プロファイルは、ソースリージョンから発信される推論リクエストをルーティングできる 1 つ以上のリージョンを定義します。クロスリージョン推論を使用すると、推論プロファイルで定義されたリージョン間でモデル呼び出しリクエストを動的にルーティングすることで、スループットとパフォーマンスが向上します。ルーティング時には、ユーザートラフィック、需要、リソースの使用率が考慮されます。詳細については、プロンプトを送信し、モデル推論を使用してレスポンスを生成するを参照してください。 -
バッチ推論 – CreateModelInvocationJob リクエストを送信するときに推論プロファイルの ID を
modelIdと指定して、バッチ推論を使用してリクエストを非同期で送信します。推論プロファイルを使用すると、複数の AWS リージョン でコンピューティングを活用し、バッチジョブの処理時間を短縮できます。ジョブが完了したら、ソースリージョンの Amazon S3 バケットから出力ファイルを取得できます。 -
エージェント – CreateAgent リクエストの
foundationModelフィールドで推論プロファイルの ID を指定します。詳細については、「エージェントを手動で作成および設定する」を参照してください。 -
ナレッジベースのレスポンス生成 – ナレッジベースのクエリ後にレスポンスを生成する場合に、クロスリージョン推論を使用できます。詳細については、「クエリとレスポンスを使用してナレッジベースをテストする」を参照してください。
-
モデル評価 – モデル評価ジョブを送信する際、評価するモデルとして推論プロファイルを送信できます。詳細については、「Amazon Bedrock リソースのパフォーマンスを評価する」を参照してください。
-
プロンプト管理 – プロンプト管理で作成したプロンプトのレスポンスを生成する際に、クロスリージョン推論を使用できます。詳細については、Amazon Bedrock でプロンプト管理を使用して再利用可能なプロンプトを構築して保存するを参照してください。
-
プロンプトフロー – プロンプトフローのプロンプトノードでインラインで定義したプロンプトのレスポンスを生成する際に、クロスリージョン推論を使用できます。詳細については、「Amazon Bedrock フローを使用してエンドツーエンドの生成 AI ワークフローを構築する」を参照してください。
推論プロファイルを使用してリージョン間でモデル呼び出しリクエストを送信する方法については、「モデル呼び出しで推論プロファイルを使用する」を参照してください。
クロスリージョン推論の詳細については、「Amazon Bedrock でのクロスリージョン推論の開始方法
IAM セットアップやサービスクォータ管理など、グローバルなクロスリージョン推論の詳細については、「」を参照してくださいグローバルクロスリージョン推論。