サポートされているクロスリージョン推論プロファイルアプリケーション推論プロファイルでサポートされているリージョンとモデル

推論プロファイルでサポートされているリージョンおよびモデル

Amazon Bedrock でサポートされているリージョンコードとエンドポイントのリストについては、「Amazon Bedrock endpoints and quotas」を参照してください。このトピックでは、使用できる事前定義推論プロファイルと、アプリケーション推論プロファイルをサポートするリージョンおよびモデルについて説明します。

注記

特定のモデルの推論プロファイル IDs をお探しですか? 各モデルの推論プロファイル IDs とリージョンの可用性がモデルの詳細ページで文書化されるようになりました。モデルを一目で確認し、関心のあるモデルを選択します。

サポートされているクロスリージョン推論プロファイル

クロスリージョン (システム定義) 推論プロファイルを使用して、クロスリージョン推論を実行できます。クロスリージョン推論を使用すると、さまざまなでコンピューティングを使用することで、計画外のトラフィックバーストをシームレスに管理できます AWS リージョン。クロスリージョン推論を使用すると、複数の AWS リージョンにトラフィックを分散できます。

クロスリージョン (システム定義) 推論プロファイルは、サポートするモデルにちなんで命名され、サポートするリージョンによって定義されます。クロスリージョン推論プロファイルがリクエストを処理する方法を理解するには、次の定義を確認してください。

ソースリージョン – 推論プロファイルを指定する API リクエストを行うリージョン。
送信先リージョン – Amazon Bedrock サービスがソースリージョンからのリクエストをルーティングできるリージョン。

Amazon Bedrock でクロスリージョン推論プロファイルを呼び出すと、リクエストはソースリージョンから発信され、そのプロファイルで定義されている送信先リージョンの 1 つに自動的にルーティングされて、パフォーマンスが最適化されます。グローバルクロスリージョン推論プロファイルの送信先リージョンには、商用リージョンがすべて含まれます。

注記

クロスリージョン推論プロファイルの送信先リージョンには、オプトインリージョンを含めることができます。オプトインリージョンは、 AWS アカウントまたは組織レベルで明示的に有効にする必要があるリージョンです。詳細については、アカウントの「有効または無効にする AWS リージョン」を参照してください。クロスリージョン推論プロファイルを使用する場合、プロファイル内の任意の送信先リージョンをアカウントでオプトインしなかった場合でも、推論リクエストはその送信先リージョンにルーティングされる可能性があります。入力プロンプトと出力結果は、不正検出の目的でオプトインリージョンに保存される場合があります。

サービスコントロールポリシー (SCPs) と AWS Identity and Access Management (IAM) ポリシーは連携して、クロスリージョン推論が許可される場所を制御します。SCP を使用すると、Amazon Bedrock で推論に使用できるリージョンを制御でき、IAM ポリシーを使用すると、推論を実行するためのアクセス許可を持つユーザーまたはロールを定義できます。クロスリージョン推論プロファイルの任意の送信先リージョンが SCP でブロックされている場合、他のリージョンが許可されていてもリクエストは失敗します。クロスリージョン推論による効率的なオペレーションを確保するために、SCPs と IAM ポリシーを更新して、選択した推論プロファイルに含まれるすべての送信先リージョンで必要なすべての Amazon Bedrock 推論アクション ( bedrock:InvokeModel*やなどbedrock:CreateModelInvocationJob) を許可できます。詳細については、「Enabling Amazon Bedrock cross-Region inference in multi-account environments」を参照してください。

注記

一部の推論プロファイルは、呼び出し元のソースリージョンに応じて異なる送信先リージョンにルーティングされます。例えば、米国東部 (オハイオ) から us.anthropic.claude-3-haiku-20240307-v1:0 を呼び出すと、リクエストを us-east-1、us-east-2、または us-west-2 にルーティングできますが、米国西部 (オレゴン) から呼び出すと、リクエストを us-east-1 と us-west-2 にのみルーティングできます。

推論プロファイルのソースリージョンと送信先リージョンを確認するには、次のいずれかを実行します。

サポートされているクロスリージョン推論プロファイルのリストの対応するセクションを展開します。
ソースリージョンから Amazon Bedrock コントロールプレーンエンドポイントを使用して GetInferenceProfile リクエストを送信し、inferenceProfileIdentifier フィールドに推論プロファイルの Amazon リソースネーム (ARN) または ID を指定します。レスポンスの models フィールドは、各送信先リージョンを識別できるモデル ARN のリストにマッピングされます。

注記

リクエストを処理できる商用リージョン AWS が追加されると、特定のモデルのグローバルクロスリージョン推論プロファイルは時間の経過とともに変化する可能性があります。ただし、推論プロファイルが地域 (米国、欧州、APAC など) に関連付けられている場合、その送信先リージョンリストは変更されません。は、新しいリージョンを組み込む新しい推論プロファイルを作成する AWS 可能性があります。これらの推論プロファイルを使用するようにシステムを更新するには、セットアップ内の ID を新しいものに変更します。

グローバルクロスリージョン推論プロファイルは現在、米国西部 (オレゴン）、米国東部 (バージニア北部）、米国東部 (オハイオ）、欧州 (アイルランド）、アジアパシフィック (東京) の各ソースリージョンのAnthropicClaude Sonnet 4モデルでのみサポートされています。グローバル推論プロファイルの送信先リージョンには、すべての商用 AWS リージョンが含まれます。

重要

各モデルのクロスリージョン推論プロファイル IDs、サポートされているソースリージョン、送信先リージョン、およびジオスコープ (グローバル、米国、または EU) は、モデルの詳細ページに記載されています。この情報を確認するには、モデルを一目で確認し、関心のあるモデルを選択します。モデルページで、リージョンの可用性テーブルを探します。これは、リージョン内、地域、グローバル推論プロファイルをサポートするリージョンを示し、推論プロファイル IDs セクションには、API コールで使用する正確な IDsが一覧表示されます。

コンプライアンス計画のために複数のモデル間でデータレジデンシーオプションを比較する必要がある場合は、各モデルのページのリージョン別可用性表を確認して、選択したモデルの推論プロファイルが要件を満たすリージョンにのみリクエストをルーティングしていることを確認します。

アプリケーション推論プロファイルでサポートされているリージョンとモデル

アプリケーション推論プロファイルは、以下のすべてのモデルに対して作成できます AWS リージョン。

ap-northeast-1
ap-northeast-2
ap-south-1
ap-southeast-1
ap-southeast-2
ca-central-1
eu-central-1
eu-west-1
eu-west-2
eu-west-3
sa-east-1
us-east-1
us-east-2
us-gov-east-1
us-west-2

アプリケーション推論プロファイルは、Amazon Bedrock でサポートされているほとんどのモデルから作成できます。モデルの埋め込みなど、一部のモデルは推論プロファイルをサポートしていません。特定のモデルが推論プロファイルをサポートしているかどうかを確認するには、「モデルの概要」を参照してください。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

推論プロファイル

前提条件