翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# Amazon Bedrock エンドポイントとクォータ
<a name="bedrock"></a>

 AWS サービスにプログラムで接続するには、endpoint. AWS services は、サービスがサポートする一部またはすべての AWS リージョンで、IPv4 エンドポイント、デュアルスタックエンドポイント、および FIPS エンドポイントのエンドポイントタイプを提供します。一部のサービスにはグローバルエンドポイントが用意されています。詳細については、「[AWS サービスエンドポイント](rande.md)」を参照してください。

制限とも呼ばれるサービスクォータは、 AWS アカウントのサービスリソースまたはオペレーションの最大数です。詳細については、「[AWS サービスクォータ](aws_service_limits.md)」を参照してください。

このサービスのサービスエンドポイントおよび Service Quotas を以下に示します。

## Amazon Bedrock サービスエンドポイント
<a name="bedrock_region"></a>

### Amazon Bedrock コントロールプレーン API
<a name="br-cp"></a>

次の表は、Amazon Bedrock でモデルの管理、トレーニング、およびデプロイがサポートされている、リージョン固有のエンドポイントの一覧です。[Amazon Bedrock API オペレーション](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_Operations_Amazon_Bedrock.html)には、これらのエンドポイントを使用します。


| リージョン名 | リージョン | エンドポイント | プロトコル | 
| --- | --- | --- | --- | 
| 米国東部 (オハイオ) | us-east-2 |  bedrock.us-east-2.amazonaws.com <br /> bedrock-fips.us-east-2.amazonaws.com  | HTTPS<br />HTTPS | 
| 米国東部 (バージニア北部) | us-east-1 |  bedrock.us-east-1.amazonaws.com <br /> bedrock-fips.us-east-1.amazonaws.com  | HTTPS<br />HTTPS | 
| 米国西部 (北カリフォルニア) | us-west-1 |  bedrock.us-west-1.amazonaws.com <br /> bedrock-fips.us-west-1.amazonaws.com  | HTTPS<br />HTTPS | 
| 米国西部 (オレゴン) | us-west-2 |  bedrock.us-west-2.amazonaws.com <br /> bedrock-fips.us-west-2.amazonaws.com  | HTTPS<br />HTTPS | 
| アフリカ (ケープタウン) | af-south-1 |  bedrock.af-south-1.amazonaws.com  | HTTPS | 
| アジアパシフィック (ハイデラバード) | ap-south-2 |  bedrock.ap-south-2.amazonaws.com  | HTTPS | 
| アジアパシフィック (ジャカルタ) | ap-southeast-3 |  bedrock.ap-southeast-3.amazonaws.com  | HTTPS | 
| アジアパシフィック (マレーシア) | ap-southeast-5 |  bedrock.ap-southeast-5.amazonaws.com  | HTTPS | 
| アジアパシフィック (メルボルン) | ap-southeast-4 |  bedrock.ap-southeast-4.amazonaws.com  | HTTPS | 
| アジアパシフィック (ムンバイ) | ap-south-1 |  bedrock.ap-south-1.amazonaws.com  | HTTPS | 
| アジアパシフィック (ニュージーランド) | ap-southeast-6 |  bedrock.ap-southeast-6.amazonaws.com  | HTTPS | 
| アジアパシフィック (大阪) | ap-northeast-3 |  bedrock.ap-northeast-3.amazonaws.com  | HTTPS | 
| アジアパシフィック (ソウル) | ap-northeast-2 |  bedrock.ap-northeast-2.amazonaws.com  | HTTPS | 
| アジアパシフィック (シンガポール) | ap-southeast-1 |  bedrock.ap-southeast-1.amazonaws.com  | HTTPS | 
| アジアパシフィック (シドニー) | ap-southeast-2 |  bedrock.ap-southeast-2.amazonaws.com  | HTTPS | 
| アジアパシフィック (台北) | ap-east-2 |  bedrock.ap-east-2.amazonaws.com  | HTTPS | 
| アジアパシフィック (タイ) | ap-southeast-7 |  bedrock.ap-southeast-7.amazonaws.com  | HTTPS | 
| アジアパシフィック (東京) | ap-northeast-1 |  bedrock.ap-northeast-1.amazonaws.com  | HTTPS | 
| カナダ (中部) | ca-central-1 |  bedrock.ca-central-1.amazonaws.com <br /> bedrock-fips.ca-central-1.amazonaws.com  | HTTPS<br />HTTPS | 
| カナダ西部 (カルガリー) | ca-west-1 |  bedrock.ca-west-1.amazonaws.com <br /> bedrock-fips.ca-west-1.amazonaws.com  | HTTPS<br />HTTPS | 
| 欧州 (フランクフルト) | eu-central-1 |  bedrock.eu-central-1.amazonaws.com  | HTTPS | 
| 欧州 (アイルランド) | eu-west-1 |  bedrock.eu-west-1.amazonaws.com  | HTTPS | 
| 欧州 (ロンドン) | eu-west-2 |  bedrock.eu-west-2.amazonaws.com  | HTTPS | 
| ヨーロッパ (ミラノ) | eu-south-1 |  bedrock.eu-south-1.amazonaws.com  | HTTPS | 
| 欧州 (パリ) | eu-west-3 |  bedrock.eu-west-3.amazonaws.com  | HTTPS | 
| 欧州 (スペイン) | eu-south-2 |  bedrock.eu-south-2.amazonaws.com  | HTTPS | 
| 欧州 (ストックホルム) | eu-north-1 |  bedrock.eu-north-1.amazonaws.com  | HTTPS | 
| 欧州 (チューリッヒ) | eu-central-2 |  bedrock.eu-central-2.amazonaws.com  | HTTPS | 
| イスラエル (テルアビブ) | il-central-1 |  bedrock.il-central-1.amazonaws.com  | HTTPS | 
| メキシコ (中部) | mx-central-1 |  bedrock.mx-central-1.amazonaws.com  | HTTPS | 
| 中東 (バーレーン) | me-south-1 |  bedrock.me-south-1.amazonaws.com  | HTTPS | 
| 中東 (アラブ首長国連邦) | me-central-1 |  bedrock.me-central-1.amazonaws.com  | HTTPS | 
| 南米 (サンパウロ) | sa-east-1 |  bedrock.sa-east-1.amazonaws.com  | HTTPS | 
|  AWS GovCloud (米国東部) | us-gov-east-1 |  bedrock.us-gov-east-1.amazonaws.com <br /> bedrock-fips.us-gov-east-1.amazonaws.com  | HTTPS<br />HTTPS | 
|  AWS GovCloud (米国西部) | us-gov-west-1 |  bedrock.us-gov-west-1.amazonaws.com <br /> bedrock-fips.us-gov-west-1.amazonaws.com  | HTTPS<br />HTTPS | 

### Amazon Bedrock ランタイム API
<a name="br-rt"></a>

次の表は、Amazon Bedrock でホストされるモデルに対して推論リクエストを行うために Amazon Bedrock でサポートされているリージョン固有のエンドポイントの一覧です。[Amazon Bedrock ランタイム API オペレーション](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_Operations_Amazon_Bedrock_Runtime.html)には、これらのエンドポイントを使用します。


| リージョン名 | リージョン | エンドポイント | プロトコル | 
| --- | --- | --- | --- | 
| 米国東部 (オハイオ) | us-east-2 |  bedrock-runtime.us-east-2.amazonaws.com <br /> bedrock-runtime-fips.us-east-2.amazonaws.com  | HTTPS<br />HTTPS | 
| 米国東部 (バージニア北部) | us-east-1 |  bedrock-runtime.us-east-1.amazonaws.com <br /> bedrock-runtime-fips.us-east-1.amazonaws.com  | HTTPS<br />HTTPS | 
| 米国西部 (オレゴン) | us-west-2 |  bedrock-runtime.us-west-2.amazonaws.com <br /> bedrock-runtime-fips.us-west-2.amazonaws.com  | HTTPS<br />HTTPS | 
| アジアパシフィック (ハイデラバード) | ap-south-2 |  bedrock-runtime.ap-south-2.amazonaws.com  | HTTPS | 
| アジアパシフィック (ムンバイ) | ap-south-1 |  bedrock-runtime.ap-south-1.amazonaws.com  | HTTPS | 
| アジアパシフィック (大阪) | ap-northeast-3 |  bedrock-runtime.ap-northeast-3.amazonaws.com  | HTTPS | 
| アジアパシフィック (ソウル) | ap-northeast-2 |  bedrock-runtime.ap-northeast-2.amazonaws.com  | HTTPS | 
| アジアパシフィック (シンガポール) | ap-southeast-1 |  bedrock-runtime.ap-southeast-1.amazonaws.com  | HTTPS | 
| アジアパシフィック (シドニー) | ap-southeast-2 |  bedrock-runtime.ap-southeast-2.amazonaws.com  | HTTPS | 
| アジアパシフィック (東京) | ap-northeast-1 |  bedrock-runtime.ap-northeast-1.amazonaws.com  | HTTPS | 
| カナダ (中部) | ca-central-1 |  bedrock-runtime.ca-central-1.amazonaws.com <br /> bedrock-runtime-fips.ca-central-1.amazonaws.com  | HTTPS<br />HTTPS | 
| 欧州 (フランクフルト) | eu-central-1 |  bedrock-runtime.eu-central-1.amazonaws.com  | HTTPS | 
| 欧州 (アイルランド) | eu-west-1 |  bedrock-runtime.eu-west-1.amazonaws.com  | HTTPS | 
| 欧州 (ロンドン) | eu-west-2 |  bedrock-runtime.eu-west-2.amazonaws.com  | HTTPS | 
| ヨーロッパ (ミラノ) | eu-south-1 |  bedrock-runtime.eu-south-1.amazonaws.com  | HTTPS | 
| 欧州 (パリ) | eu-west-3 |  bedrock-runtime.eu-west-3.amazonaws.com  | HTTPS | 
| 欧州 (スペイン) | eu-south-2 |  bedrock-runtime.eu-south-2.amazonaws.com  | HTTPS | 
| 欧州 (ストックホルム) | eu-north-1 |  bedrock-runtime.eu-north-1.amazonaws.com  | HTTPS | 
| 欧州 (チューリッヒ) | eu-central-2 |  bedrock-runtime.eu-central-2.amazonaws.com  | HTTPS | 
| 南米 (サンパウロ) | sa-east-1 |  bedrock-runtime.sa-east-1.amazonaws.com  | HTTPS | 
|  AWS GovCloud (米国東部) | us-gov-east-1 |  bedrock-runtime.us-gov-east-1.amazonaws.com <br /> bedrock-runtime-fips.us-gov-east-1.amazonaws.com  | HTTPS<br />HTTPS | 
|  AWS GovCloud (米国西部) | us-gov-west-1 |  bedrock-runtime.us-gov-west-1.amazonaws.com <br /> bedrock-runtime-fips.us-gov-west-1.amazonaws.com  | HTTPS<br />HTTPS | 

### Agents for Amazon Bedrock ビルドタイム API
<a name="bra-bt"></a>

次の表は、エージェントとナレッジベースの作成と管理のために Amazon Bedrock エージェントがサポートするリージョン固有のエンドポイントの一覧です。[Amazon Bedrock エージェント API オペレーション](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_Operations_Agents_for_Amazon_Bedrock.html)には、これらのエンドポイントを使用します。


- **米国東部 (バージニア北部)**
  - **リージョン:** us-east-1
  - **エンドポイント:** bedrock-agent.us-east-1.amazonaws.com / **プロトコル:** HTTPS
  - **エンドポイント:** bedrock-agent-fips.us-east-1.amazonaws.com / **プロトコル:** HTTPS

- **米国西部 (オレゴン)**
  - **リージョン:** us-west-2
  - **エンドポイント:** bedrock-agent.us-west-2.amazonaws.com / **プロトコル:** HTTPS
  - **エンドポイント:** bedrock-agent-fips.us-west-2.amazonaws.com / **プロトコル:** HTTPS

- **アジアパシフィック (シンガポール)**
  - **リージョン:** ap-southeast-1
  - **エンドポイント:** bedrock-agent.ap-southeast-1.amazonaws.com
  - **プロトコル:** HTTPS

- **アジアパシフィック (シドニー)**
  - **リージョン:** ap-southeast-2
  - **エンドポイント:** bedrock-agent.ap-southeast-2.amazonaws.com
  - **プロトコル:** HTTPS

- **アジアパシフィック (東京)**
  - **リージョン:** ap-northeast-1
  - **エンドポイント:** bedrock-agent.ap-northeast-1.amazonaws.com
  - **プロトコル:** HTTPS

- **アジアパシフィック (ソウル)**
  - **リージョン:** ap-northeast-2
  - **エンドポイント:** bedrock-agent.ap-northeast-2.amazonaws.com
  - **プロトコル:** HTTPS

- **カナダ (中部)**
  - **リージョン:** ca-central-1
  - **エンドポイント:** bedrock-agent.ca-central-1.amazonaws.com
  - **プロトコル:** HTTPS

- **欧州 (フランクフルト)**
  - **リージョン:** eu-central-1
  - **エンドポイント:** bedrock-agent.eu-central-1.amazonaws.com
  - **プロトコル:** HTTPS

- **欧州 (アイルランド)**
  - **リージョン:** eu-west-1
  - **エンドポイント:** bedrock-agent.eu-west-1.amazonaws.com
  - **プロトコル:** HTTPS

- **欧州 (ロンドン)**
  - **リージョン:** eu-west-2
  - **エンドポイント:** bedrock-agent.eu-west-2.amazonaws.com
  - **プロトコル:** HTTPS

- **欧州 (パリ)**
  - **リージョン:** eu-west-3
  - **エンドポイント:** bedrock-agent.eu-west-3.amazonaws.com
  - **プロトコル:** HTTPS

- **アジアパシフィック (ムンバイ)**
  - **リージョン:** ap-south-1
  - **エンドポイント:** bedrock-agent.ap-south-1.amazonaws.com
  - **プロトコル:** HTTPS

- **南米 (サンパウロ)**
  - **リージョン:** sa-east-1
  - **エンドポイント:** bedrock-agent.sa-east-1.amazonaws.com
  - **プロトコル:** HTTPS


### Agents for Amazon Bedrock ランタイム API
<a name="bra-rt"></a>

次の表は、エージェントの呼び出しとナレッジベースのクエリのために Amazon Bedrock エージェントがサポートするリージョン固有のエンドポイントの一覧です。[Amazon Bedrock エージェントのランタイム API オペレーション](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_Operations_Agents_for_Amazon_Bedrock_Runtime.html)には、これらのエンドポイントを使用します。


- **米国東部 (バージニア北部)**
  - **リージョン:** us-east-1
  - **エンドポイント:** bedrock-agent-runtime.us-east-1.amazonaws.com / **プロトコル:** HTTPS
  - **エンドポイント:** bedrock-agent-runtime-fips.us-east-1.amazonaws.com / **プロトコル:** HTTPS

- **米国西部 (オレゴン)**
  - **リージョン:** us-west-2
  - **エンドポイント:** bedrock-agent-runtime.us-west-2.amazonaws.com / **プロトコル:** HTTPS
  - **エンドポイント:** bedrock-agent-runtime-fips.us-west-2.amazonaws.com / **プロトコル:** HTTPS

- **アジアパシフィック (シンガポール)**
  - **リージョン:** ap-southeast-1
  - **エンドポイント:** bedrock-agent-runtime.ap-southeast-1.amazonaws.com
  - **プロトコル:** HTTPS

- **アジアパシフィック (シドニー)**
  - **リージョン:** ap-southeast-2
  - **エンドポイント:** bedrock-agent-runtime.ap-southeast-2.amazonaws.com
  - **プロトコル:** HTTPS

- **アジアパシフィック (東京)**
  - **リージョン:** ap-northeast-1
  - **エンドポイント:** bedrock-agent-runtime.ap-northeast-1.amazonaws.com
  - **プロトコル:** HTTPS

- **アジアパシフィック (ソウル)**
  - **リージョン:** ap-northeast-2
  - **エンドポイント:** bedrock-agent-runtime.ap-northeast-2.amazonaws.com
  - **プロトコル:** HTTPS

- **カナダ (中部)**
  - **リージョン:** ca-central-1
  - **エンドポイント:** bedrock-agent-runtime.ca-central-1.amazonaws.com
  - **プロトコル:** HTTPS

- **欧州 (フランクフルト)**
  - **リージョン:** eu-central-1
  - **エンドポイント:** bedrock-agent-runtime.eu-central-1.amazonaws.com
  - **プロトコル:** HTTPS

- **欧州 (パリ)**
  - **リージョン:** eu-west-3
  - **エンドポイント:** bedrock-agent-runtime.eu-west-3.amazonaws.com
  - **プロトコル:** HTTPS

- **欧州 (アイルランド)**
  - **リージョン:** eu-west-1
  - **エンドポイント:** bedrock-agent-runtime.eu-west-1.amazonaws.com
  - **プロトコル:** HTTPS

- **欧州 (ロンドン)**
  - **リージョン:** eu-west-2
  - **エンドポイント:** bedrock-agent-runtime.eu-west-2.amazonaws.com
  - **プロトコル:** HTTPS

- **アジアパシフィック (ムンバイ)**
  - **リージョン:** ap-south-1
  - **エンドポイント:** bedrock-agent-runtime.ap-south-1.amazonaws.com
  - **プロトコル:** HTTPS

- **南米 (サンパウロ)**
  - **リージョン:** sa-east-1
  - **エンドポイント:** bedrock-agent-runtime.sa-east-1.amazonaws.com
  - **プロトコル:** HTTPS


### Amazon Bedrock Data Automation API
<a name="brbda-bt"></a>

次の表は、Amazon Bedrock Data Automation でサポートされているリージョン固有のエンドポイントの一覧です。`runtime` という単語を使用するエンドポイントは、ブループリントとプロジェクトを呼び出し、ファイルから情報を抽出します。[Amazon Bedrock Data Automation ランタイム API オペレーション](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_Operations_Runtime_for_Amazon_Bedrock_Data_Automation.html)には、これらのエンドポイントを使用します。`runtime` を使用しないエンドポイントはブループリントとプロジェクトの作成に使用され、抽出に関するガイダンスを提供します。[Amazon Bedrock Data Automation API Buildtime オペレーション](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_Operations_Data_Automation_for_Amazon_Bedrock.html)には、これらのエンドポイントを使用します。


| リージョン名 | リージョン | エンドポイント | プロトコル | 
| --- | --- | --- | --- | 
| 米国東部 (オハイオ) | us-east-2 |  bedrock-data-automation.us-east-2.amazonaws.com <br /> bedrock-data-automation-runtime.us-east-2.amazonaws.com <br /> bedrock-data-automation-fips.us-east-2.amazonaws.com <br /> bedrock-data-automation-runtime-fips.us-east-2.amazonaws.com  | HTTPS<br />HTTPS<br />HTTPS<br />HTTPS | 
| 米国東部 (バージニア北部) | us-east-1 |  bedrock-data-automation.us-east-1.amazonaws.com <br /> bedrock-data-automation-runtime.us-east-1.api.aws <br /> bedrock-data-automation-runtime.us-east-1.amazonaws.com <br /> bedrock-data-automation.us-east-1.api.aws <br /> bedrock-data-automation-fips.us-east-1.amazonaws.com <br /> bedrock-data-automation-runtime-fips.us-east-1.api.aws <br /> bedrock-data-automation-runtime-fips.us-east-1.amazonaws.com <br /> bedrock-data-automation-fips.us-east-1.api.aws  | HTTPS<br />HTTPS<br />HTTPS<br />HTTPS<br />HTTPS<br />HTTPS<br />HTTPS<br />HTTPS | 
| 米国西部 (オレゴン) | us-west-2 |  bedrock-data-automation.us-west-2.amazonaws.com <br /> bedrock-data-automation-runtime.us-west-2.api.aws <br /> bedrock-data-automation-runtime.us-west-2.amazonaws.com <br /> bedrock-data-automation.us-west-2.api.aws <br /> bedrock-data-automation-fips.us-west-2.amazonaws.com <br /> bedrock-data-automation-runtime-fips.us-west-2.api.aws <br /> bedrock-data-automation-runtime-fips.us-west-2.amazonaws.com <br /> bedrock-data-automation-fips.us-west-2.api.aws  | HTTPS<br />HTTPS<br />HTTPS<br />HTTPS<br />HTTPS<br />HTTPS<br />HTTPS<br />HTTPS | 
| アジアパシフィック (ムンバイ) | ap-south-1 |  bedrock-data-automation.ap-south-1.amazonaws.com <br /> bedrock-data-automation-runtime.ap-south-1.amazonaws.com  | HTTPS<br />HTTPS | 
| アジアパシフィック (シドニー) | ap-southeast-2 |  bedrock-data-automation.ap-southeast-2.amazonaws.com <br /> bedrock-data-automation-runtime.ap-southeast-2.amazonaws.com  | HTTPS<br />HTTPS | 
| アジアパシフィック (東京) | ap-northeast-1 |  bedrock-data-automation.ap-northeast-1.amazonaws.com <br /> bedrock-data-automation-runtime.ap-northeast-1.amazonaws.com  | HTTPS<br />HTTPS | 
| カナダ (中部) | ca-central-1 |  bedrock-data-automation.ca-central-1.amazonaws.com <br /> bedrock-data-automation-runtime.ca-central-1.amazonaws.com <br /> bedrock-data-automation-fips.ca-central-1.amazonaws.com <br /> bedrock-data-automation-runtime-fips.ca-central-1.amazonaws.com  | HTTPS<br />HTTPS<br />HTTPS<br />HTTPS | 
| 欧州 (フランクフルト) | eu-central-1 |  bedrock-data-automation.eu-central-1.amazonaws.com <br /> bedrock-data-automation-runtime.eu-central-1.amazonaws.com  | HTTPS<br />HTTPS | 
| 欧州 (アイルランド) | eu-west-1 |  bedrock-data-automation.eu-west-1.amazonaws.com <br /> bedrock-data-automation-runtime.eu-west-1.amazonaws.com  | HTTPS<br />HTTPS | 
| 欧州 (ロンドン) | eu-west-2 |  bedrock-data-automation.eu-west-2.amazonaws.com <br /> bedrock-data-automation-runtime.eu-west-2.amazonaws.com  | HTTPS<br />HTTPS | 
| 欧州 (スペイン) | eu-south-2 |  bedrock-data-automation.eu-south-2.amazonaws.com <br /> bedrock-data-automation-runtime.eu-south-2.amazonaws.com  | HTTPS<br />HTTPS | 
|  AWS GovCloud (米国西部) | us-gov-west-1 |  bedrock-data-automation.us-gov-west-1.amazonaws.com <br /> bedrock-data-automation-runtime.us-gov-west-1.amazonaws.com <br /> bedrock-data-automation-fips.us-gov-west-1.amazonaws.com <br /> bedrock-data-automation-runtime-fips.us-gov-west-1.amazonaws.com  | HTTPS<br />HTTPS<br />HTTPS<br />HTTPS | 

## Amazon Bedrock サービスクォータ
<a name="limits_bedrock"></a>

**ヒント**  
Amazon Bedrock には多数のクォータがあるため、サービスクォータの表示には以下の表ではなくコンソールを使用することをお勧めします。[Amazon Bedrock クォータ](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas)を開きます。特定のクォータを検索するには、検索フィールドを使用します。歯車アイコンを使用して、ページに表示されるクォータの数を制御できます。


| 名前 | デフォルト | 引き上げ可能 | 説明 | 
| --- | --- | --- | --- | 
| (高度なプロンプト最適化) アカウントあたりのアクティブなジョブ | サポートされている各リージョン: 20 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B46DD052)  | アカウントあたりのアクティブな高度なプロンプト最適化 (APO) ジョブの最大数。 | 
| (高度なプロンプト最適化) アカウントあたりの非アクティブなジョブ | サポートされている各リージョン: 5,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-0B66D421)  | アカウントあたりの非アクティブな高度なプロンプト最適化 (APO) ジョブの最大数。 | 
| (自動推論) ポリシーの注釈 | サポートされている各リージョン: 10 | いいえ | 自動推論ポリシーの注釈の最大数。 | 
| (自動推論) 1 秒あたりの CancelAutomatedReasoningPolicyBuildWorkflow リクエスト数 | サポートされている各リージョン： 5 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7334E629)  | 1 秒あたりの CancelAutomatedReasoningPolicyBuildWorkflow API リクエストの最大数。 | 
| (自動推論) ポリシーあたりの同時ビルド数 | サポートされている各リージョン: 2 | いいえ | 自動推論ポリシーあたりの同時ビルドの最大数。 | 
| (自動推論) アカウントあたりの同時ポリシービルド数 | サポートされている各リージョン：5 | いいえ | 1 つのアカウントでの同時自動推論ポリシービルドの最大数。 | 
| (自動推論) 1 秒あたりの CreateAutomatedReasoningPolicy リクエスト数 | サポートされている各リージョン： 5 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-6326A422)  | 1 秒あたりの CreateAutomatedReasoningPolicy API リクエストの最大数。 | 
| (自動推論) 1 秒あたりの CreateAutomatedReasoningPolicyTestCase リクエスト数 | サポートされている各リージョン： 5 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F5ACA0A6)  | 1 秒あたりの CreateAutomatedReasoningPolicyTestCase API リクエストの最大数。 | 
| (自動推論) 1 秒あたりの CreateAutomatedReasoningPolicyVersion リクエスト数 | サポートされている各リージョン： 5 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C5913DD6)  | 1 秒あたりの CreateAutomatedReasoningPolicyVersion API リクエストの最大数。 | 
| (自動推論) 1 秒あたりの DeleteAutomatedReasoningPolicy リクエスト数 | サポートされている各リージョン： 5 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-51CDA0E1)  | 1 秒あたりの DeleteAutomatedReasoningPolicy API リクエストの最大数。 | 
| (自動推論) 1 秒あたりの DeleteAutomatedReasoningPolicyBuildWorkflow リクエスト数 | サポートされている各リージョン： 5 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F20FBC17)  | 1 秒あたりの DeleteAutomatedReasoningPolicyBuildWorkflow API リクエストの最大数。 | 
| (自動推論) 1 秒あたりの DeleteAutomatedReasoningPolicyTestCase リクエスト数 | サポートされている各リージョン： 5 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-345B029F)  | 1 秒あたりの DeleteAutomatedReasoningPolicyTestCase API リクエストの最大数。 | 
| (自動推論) 1 秒あたりの ExportAutomatedReasoningPolicyVersion リクエスト数 | サポートされている各リージョン： 5 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9B17C979)  | 1 秒あたりの ExportAutomatedReasoningPolicyVersion API リクエストの最大数。 | 
| (自動推論) 1 秒あたりの GetAutomatedReasoningPolicy リクエスト数 | サポートされている各リージョン: 10 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4DBDD5C9)  | 1 秒あたりの GetAutomatedReasoningPolicy API リクエストの最大数。 | 
| (自動推論) 1 秒あたりの GetAutomatedReasoningPolicyAnnotations リクエスト数 | サポートされている各リージョン: 10 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-0CB120A9)  | 1 秒あたりの GetAutomatedReasoningPolicyAnnotations API リクエストの最大数。 | 
| (自動推論) 1 秒あたりの GetAutomatedReasoningPolicyBuildWorkflow リクエスト数 | サポートされている各リージョン: 10 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-749C38BD)  | 1 秒あたりの GetAutomatedReasoningPolicyBuildWorkflow API リクエストの最大数。 | 
| (自動推論) 1 秒あたりの GetAutomatedReasoningPolicyBuildWorkflowResultAssets リクエスト数 | サポートされている各リージョン: 10 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9B9B20DB)  | 1 秒あたりの GetAutomatedReasoningPolicyBuildWorkflowResultAssets API リクエストの最大数。 | 
| (自動推論) 1 秒あたりの GetAutomatedReasoningPolicyNextScenario リクエスト数 | サポートされている各リージョン: 10 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-EAD257E4)  | 1 秒あたりの GetAutomatedReasoningPolicyNextScenario API リクエストの最大数。 | 
| (自動推論) 1 秒あたりの GetAutomatedReasoningPolicyTestCase リクエスト数 | サポートされている各リージョン: 10 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7D9F04A9)  | 1 秒あたりの GetAutomatedReasoningPolicyTestCase API リクエストの最大数。 | 
| (自動推論) 1 秒あたりの GetAutomatedReasoningPolicyTestResult リクエスト数 | サポートされている各リージョン: 10 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8A686BB7)  | 1 秒あたりの GetAutomatedReasoningPolicyTestResult API リクエストの最大数。 | 
| (自動推論) 1 秒あたりの ListAutomatedReasoningPolicies リクエスト数 | サポートされている各リージョン： 5 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-99471E7A)  | 1 秒あたりの ListAutomatedReasoningPolicies API リクエストの最大数。 | 
| (自動推論) 1 秒あたりの ListAutomatedReasoningPolicyBuildWorkflows リクエスト数 | サポートされている各リージョン： 5 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-884C068A)  | 1 秒あたりの ListAutomatedReasoningPolicyBuildWorkflows API リクエストの最大数。 | 
| (自動推論) 1 秒あたりの ListAutomatedReasoningPolicyTestCases リクエスト数 | サポートされている各リージョン： 5 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5DD391B1)  | 1 秒あたりの ListAutomatedReasoningPolicyTestCases API リクエストの最大数。 | 
| (自動推論) 1 秒あたりの ListAutomatedReasoningPolicyTestResults リクエスト数 | サポートされている各リージョン： 5 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9D3DC9B2)  | 1 秒あたりの ListAutomatedReasoningPolicyTestResults API リクエストの最大数。 | 
| (自動推論) アカウントごとのポリシー | サポートされている各リージョン: 100 | いいえ | 1 つのアカウント内の自動推論ポリシーの最大数。 | 
| (自動推論) ポリシーのルール | サポートされている各リージョン: 500 | いいえ | 自動推論ポリシーのルールの最大数。 | 
| (自動推論) ソースドキュメントサイズ (MB) | サポートされている各リージョン：5 | いいえ | 自動推論ポリシーを作成するためのソースドキュメントの最大サイズ (MB)。 | 
| (自動推論) ソースドキュメントトークン | サポートされている各リージョン: 122,880 | いいえ | 自動推論ポリシーの作成時にソースドキュメントで許可されるトークンの最大数。 | 
| (自動推論) 1 秒あたりの StartAutomatedReasoningPolicyBuildWorkflow リクエスト数 | サポートされている各リージョン: 1 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B7BF1255)  | 1 秒あたりの StartAutomatedReasoningPolicyBuildWorkflow API リクエストの最大数。 | 
| (自動推論) 1 秒あたりの StartAutomatedReasoningPolicyTestWorkflow リクエスト数 | サポートされている各リージョン: 1 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-07D73971)  | 1 秒あたりの StartAutomatedReasoningPolicyTestWorkflow API リクエストの最大数。 | 
| (自動推論) ポリシーごとのテスト | サポートされている各リージョン: 100 | いいえ | 自動推論ポリシーごとのテストの最大数。 | 
| (自動推論) ポリシーごとのタイプ | サポートされている各リージョン: 50 | いいえ | 自動推論ポリシーごとのタイプの最大数。 | 
| (自動推論) 1 秒あたりの UpdateAutomatedReasoningPolicy リクエスト数 | サポートされている各リージョン： 5 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9EF56DA1)  | 1 秒あたりの UpdateAutomatedReasoningPolicy API リクエストの最大数。 | 
| (自動推論) 1 秒あたりの UpdateAutomatedReasoningPolicyAnnotations リクエスト数 | サポートされている各リージョン： 5 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F2DCFA42)  | 1 秒あたりの UpdateAutomatedReasoningPolicyAnnotations API リクエストの最大数。 | 
| (自動推論) 1 秒あたりの UpdateAutomatedReasoningPolicyTestCase リクエスト数 | サポートされている各リージョン： 5 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9D7C8A75)  | 1 秒あたりの UpdateAutomatedReasoningPolicyTestCase API リクエストの最大数。 | 
| (自動推論) ポリシーのタイプごとの値 | サポートされている各リージョン: 50 | いいえ | 自動推論ポリシーのタイプごとの値の最大数。 | 
| (自動推論) ポリシーの変数 | サポートされている各リージョン: 200 | いいえ | 自動推論ポリシー内の変数の最大数。 | 
| (自動推論) ポリシーごとのバージョン | サポートされている各リージョン: 1,000 | いいえ | 自動推論ポリシーごとのバージョンの最大数。 | 
| (データ自動化) (コンソール) ドキュメントの最大ファイルサイズ (MB) | サポートされている各リージョン: 200 | いいえ | コンソールの最大ファイルサイズ | 
| (データ自動化) (コンソール) ドキュメントファイルあたりの最大ページ数 | サポートされている各リージョン: 20 | いいえ | コンソールのドキュメントあたりの最大ページ数 | 
| (データ自動化) CreateBlueprint – アカウントあたりのブループリントの最大数 | サポートされている各リージョン: 350 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-23CF4444)  | アカウントあたりのブループリントの最大数 | 
| (データ自動化) CreateBlueprintVersion – ブループリントごとのブループリントバージョンの最大数 | サポートされている各リージョン: 10 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-21EE8B55)  | ブループリントあたりのバージョンの最大数 | 
| (データ自動化) フィールドの説明の長さ (文字) | サポートされている各リージョン: 300 | いいえ | フィールドの説明の最大文字数 | 
| (データ自動化) InvokeBlueprintOptimizationAsync - ブループリント最適化の同時ジョブの最大数 | サポートされている各リージョン: 3 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-54FAADA6)  | ブループリント最適化非同期オープンジョブの呼び出しの最大数 | 
| (データ自動化) InvokeBlueprintOptimizationAsync - 1 日あたりのブループリント最適化ジョブの最大数 | サポートされている各リージョン: 30 | いいえ | 1 日あたりのブループリント最適化非同期ジョブの呼び出しの最大数 | 
| (データ自動化) InvokeDataAutomation(Sync) - ドキュメント - 最大リクエスト数 | サポートされている各リージョン: 60 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8B289D99)  | ドキュメントモダリティの 1 分あたりの InvokeDataAutomation リクエストの最大数 | 
| (データ自動化) InvokeDataAutomation(Sync) - イメージ - 最大リクエスト数 | us-east-1: 200<br />us-west-2: 200<br />他のサポートされている各リージョン: 100 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-CF1B283E)  | イメージモダリティの 1 分あたりの InvokeDataAutomation リクエストの最大数 | 
| (データ自動化) InvokeDataAutomationAsync – 音声 – 同時ジョブの最大数 | us-east-1: 20<br />us-west-2: 20<br />他のサポートされている各リージョン: 2 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-3E961CAB)  | 音声用のデータ自動化の非同期呼び出しのオープンジョブの最大数 | 
| (データ自動化) InvokeDataAutomationAsync – ドキュメント – 同時ジョブの最大数 | us-east-1: 25<br />us-west-2: 25<br />他のサポートされている各リージョン: 5 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9E3C255A)  | ドキュメント用のデータ自動化の非同期呼び出しのオープンジョブの最大数 | 
| (データ自動化) InvokeDataAutomationAsync – 画像 – 同時ジョブの最大数 | us-east-1: 20<br />us-west-2: 20<br />他のサポートされている各リージョン: 5 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-BDD176EF)  | 画像用のデータ自動化の非同期呼び出しのオープンジョブの最大数 | 
| (データ自動化) InvokeDataAutomationAsync – オープンジョブの最大数 | サポートされている各リージョン: 1,800 | いいえ | 画像用のデータ自動化の非同期呼び出しのオープンジョブの最大数 | 
| (データ自動化) InvokeDataAutomationAsync – 動画 – 同時ジョブの最大数 | us-east-1: 20<br />us-west-2: 20<br />サポートされている他の各リージョン: 3 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-895C7A6C)  | 動画用のデータ自動化の非同期呼び出しのオープンジョブの最大数 | 
| (データ自動化) 音声の最大サンプルレート (Hz) | サポートされている各リージョン: 48,000 | いいえ | 音声の最大サンプルレート | 
| (データ自動化) プロジェクトあたりのブループリントの最大数 (音声) | サポートされている各リージョン: 1 | [いいえ] | 音声のプロジェクトあたりのブループリントの最大数 | 
| (データ自動化) プロジェクトあたりのブループリントの最大数 (ドキュメント) | サポートされている各リージョン: 40 | いいえ | ドキュメントのプロジェクトあたりのブループリントの最大数  | 
| (データ自動化) プロジェクトあたりのブループリントの最大数 (画像) | サポートされている各リージョン: 1 | [いいえ] | 画像のプロジェクトあたりのブループリントの最大数 | 
| (データ自動化) プロジェクトあたりのブループリントの最大数 (動画) | サポートされている各リージョン: 1 | [いいえ] | 動画のプロジェクトあたりのブループリントの最大数 | 
| (データ自動化) JSON ブループリントの最大サイズ (文字) | サポートされている各リージョン: 100,000 | いいえ | 文字単位の JSON の最大サイズ | 
| (データ自動化) フィールド階層の最大レベル | サポートされている各リージョン: 1 | [いいえ] | フィールド階層の最大数レベル | 
| (データ自動化) ドキュメントあたりの最大ページ数 | サポートされている各リージョン: 3,000 | いいえ | ドキュメントあたりの最大ページ数 | 
| (データ自動化) 最大解像度 | サポートされている各リージョン: 8,000 | いいえ | 画像の最大解像度 | 
| (データ自動化) 音声ファイルの最大サイズ (MB) | サポートされている各リージョン: 2,048 | いいえ | 音声の最大ファイルサイズ | 
| (データ自動化) 音声の最大長 (分) | サポートされている各リージョン: 240 | いいえ | 分単位の音声の最大長 | 
| (データ自動化) ドキュメントファイルの最大サイズ (MB) | サポートされている各リージョン: 500 | いいえ | ファイルの最大サイズ | 
| (データ自動化) 画像ファイルの最大サイズ (MB) | サポートされている各リージョン：5 | いいえ | 画像の最大ファイルサイズ | 
| (データ自動化) オーディオ設計図の最大指示フィールド長 - (文字) | サポートされている各リージョン: 500 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-00F9DD5C)  | オーディオブループリントの命令フィールドの最大長を文字で表します。 | 
| (データ自動化) 推論開始リクエストあたりのブループリントの最大数 (音声) | サポートされている各リージョン: 1 | [いいえ] | 推論開始リクエストのインラインブループリントの最大数 | 
| (データ自動化) 推論開始リクエストあたりのブループリントの最大数 (ドキュメント) | サポートされている各リージョン: 10 | いいえ | 推論開始リクエストのインラインブループリントの最大数 | 
| (データ自動化) 推論開始リクエストあたりのブループリントの最大数 (画像) | サポートされている各リージョン: 1 | [いいえ] | 推論開始リクエストのインラインブループリントの最大数 | 
| (データ自動化) 推論開始リクエストあたりのブループリントの最大数 (動画) | サポートされている各リージョン: 1 | [いいえ] | 推論開始リクエストのインラインブループリントの最大数 | 
| (データ自動化) ブループリントあたりのリストフィールドの最大数 | サポートされている各リージョン: 15 | いいえ | ブループリントあたりのリストフィールドの最大数 | 
| (データ自動化) 動画ファイルの最大サイズ (MB) | サポートされている各リージョン: 10,240 | いいえ | 動画の最大ファイルサイズ | 
| (データ自動化) 動画の最大長 (分) | サポートされている各リージョン: 240 | いいえ | 分単位の動画の最大長 | 
| (データ自動化) 音声の最小サンプルレート (Hz) | サポートされている各リージョン: 8,000 | いいえ | 音声の最小サンプルレート | 
| (データ自動化) 音声の最小長 (ミリ秒) | サポートされている各リージョン: 500 | いいえ | ミリ秒単位の音声の最小長 | 
| (評価) 同時自動モデル評価ジョブの数 | サポートされている各リージョン: 20 | いいえ | このアカウントで現在のリージョンに一度に指定できる自動モデル評価ジョブの最大数。 | 
| (評価) ヒューマンワーカーを使用する同時モデル評価ジョブの数 | サポートされている各リージョン: 10 | いいえ | このアカウントで現在のリージョンに一度に指定できるヒューマンワーカーを使用するモデル評価ジョブの最大数。 | 
| (評価) カスタムメトリクスの数 | サポートされている各リージョン: 10 | いいえ | ヒューマンワーカーを使用するモデル評価ジョブで指定できるカスタムメトリクスの最大数。 | 
| (評価) 人間ベースのモデル評価ジョブのカスタムプロンプトデータセットの数 | サポートされている各リージョン: 1 | [いいえ] | このアカウントで現在のリージョンに人間ベースのモデル評価ジョブで指定できるカスタムプロンプトデータセットの最大数。 | 
| (評価) ジョブあたりのデータセットの数 | サポートされている各リージョン：5 | いいえ | 自動モデル評価ジョブで指定できるデータセットの最大数。これには、カスタムプロンプトデータセットと組み込みプロンプトデータセットの両方が含まれます。 | 
| (評価) 評価ジョブの数 | サポートされている各リージョン: 5,000 | いいえ | このアカウントで現在のリージョンに作成できるモデル評価ジョブの最大数。 | 
| (評価) データセットあたりのメトリクスの数 | サポートされている各リージョン: 3 | いいえ | 自動モデル評価ジョブでデータセットごとに指定できるメトリクスの最大数。これには、カスタムメトリクスと組み込みメトリクスの両方が含まれます。 | 
| (評価) ヒューマンワーカーを使用するモデル評価ジョブのモデルの数 | サポートされている各リージョン: 2 | いいえ | ヒューマンワーカーを使用するモデル評価ジョブで指定できるモデルの最大数。 | 
| (評価) 自動モデル評価ジョブのモデル数 | サポートされている各リージョン: 1 | [いいえ] | 自動モデル評価ジョブで指定できるモデルの最大数。 | 
| (評価) カスタムプロンプトデータセットのプロンプトの数 | サポートされている各リージョン: 1,000 | いいえ | カスタムプロンプトデータセットに含めることができるプロンプトの最大数。 | 
| (評価) プロンプトのサイズ | サポートされている各リージョン: 4 | いいえ | カスタムプロンプトデータセットの個々のプロンプトの最大サイズ (KB)。 | 
| (評価) ワーカーのタスク時間 | サポートされている各リージョン: 30 | いいえ | ワーカーがタスクを完了するために使える最長時間 (日数)。 | 
| (フロー) フローあたりのエージェントノード数 | サポートされている各リージョン: 20 | いいえ | エージェントノードの最大数。 | 
| (フロー) フローあたりのコレクターノード | サポートされている各リージョン: 1 | [いいえ] | コレクターノードの最大数。 | 
| (フロー) フローあたりの条件ノード | サポートされている各リージョン：5 | いいえ | 条件ノードの最大数。 | 
| (フロー) 条件ノードあたりの条件 | サポートされている各リージョン：5 | いいえ | 条件ノードあたりの条件の最大数。 | 
| (フロー) 1 秒あたりの CreateFlow リクエスト数 | サポートされている各リージョン: 2 | いいえ | 1 秒あたりの CreateFlow リクエストの最大数。 | 
| (フロー) 1 秒あたりの CreateFlowAlias リクエスト数 | サポートされている各リージョン: 2 | いいえ | 1 秒あたりの CreateFlowAlias リクエストの最大数。 | 
| (フロー) 1 秒あたりの CreateFlowVersion リクエスト数 | サポートされている各リージョン: 2 | いいえ | 1 秒あたりの CreateFlowVersion リクエストの最大数。 | 
| (フロー) 1 秒あたりの DeleteFlow リクエスト数 | サポートされている各リージョン: 2 | いいえ | 1 秒あたりの DeleteFlow リクエストの最大数。 | 
| (フロー) 1 秒あたりの DeleteFlowAlias リクエスト数 | サポートされている各リージョン: 2 | いいえ | 1 秒あたりの DeleteFlowAlias リクエストの最大数。 | 
| (フロー) 1 秒あたりの DeleteFlowVersion リクエスト数 | サポートされている各リージョン: 2 | いいえ | 1 秒あたりの DeleteFlowVersion リクエストの最大数。 | 
| (フロー) フローあたりのフローエイリアス | サポートされている各リージョン: 10 | いいえ | フローエイリアスの最大数。 | 
| (フロー) アカウントあたりのフロー実行数 | サポートされている各リージョン: 1,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F1613626)  | フロー実行のアカウントあたりの最大数。 | 
| (フロー) フローあたりのフローバージョン | サポートされている各リージョン: 10 | いいえ | フローバージョンの最大数。 | 
| (フロー) アカウントあたりのフロー | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D321719B)  | フローのアカウントあたりの最大数 | 
| (フロー) 1 秒あたりの GetFlow リクエスト数 | サポートされている各リージョン: 10 | いいえ | 1 秒あたりの GetFlow リクエストの最大数。 | 
| (フロー) 1 秒あたりの GetFlowAlias リクエスト数 | サポートされている各リージョン: 10 | いいえ | 1 秒あたりの GetFlowAlias リクエストの最大数。 | 
| (フロー) 1 秒あたりの GetFlowVersion リクエスト数 | サポートされている各リージョン: 10 | いいえ | 1 秒あたりの GetFlowVersion リクエストの最大数。 | 
| (フロー) フローあたりのインラインコードノード数 | サポートされている各リージョン：5 | いいえ | フローあたりのインラインコードノードの最大数。 | 
| (フロー) フローあたりの入力ノード数 | サポートされている各リージョン: 1 | [いいえ] | フロー入力ノードの最大数。 | 
| (フロー) フローあたりのイテレーターノード数 | サポートされている各リージョン: 1 | [いいえ] | イテレーターノードの最大数。 | 
| (フロー) フローあたりのナレッジベースノード数 | サポートされている各リージョン: 20 | いいえ | ナレッジベースノードの最大数。 | 
| (フロー) フローあたりの Lambda 関数ノード数 | サポートされている各リージョン: 20 | いいえ | Lambda 関数ノードの最大数。 | 
| (フロー) フローあたりの Lex ノード数 | サポートされている各リージョン：5 | いいえ | Lex ノードの最大数。 | 
| (フロー) 1 秒あたりの ListFlowAliases リクエスト数 | サポートされている各リージョン: 10 | いいえ | 1 秒あたりの ListFlowAliases リクエストの最大数。 | 
| (フロー) 1 秒あたりの ListFlowVersions リクエスト数 | サポートされている各リージョン: 10 | いいえ | 1 秒あたりの ListFlowVersions リクエストの最大数。 | 
| (フロー) 1 秒あたりの ListFlows リクエスト数 | サポートされている各リージョン: 10 | いいえ | 1 秒あたりの ListFlows リクエストの最大数。 | 
| (フロー) フローあたりの出力ノード数 | サポートされている各リージョン: 20 | いいえ | フロー出力ノードの最大数。 | 
| (フロー) 1 秒あたりの PrepareFlow リクエスト数 | サポートされている各リージョン: 2 | いいえ | 1 秒あたりの PrepareFlow リクエストの最大数。 | 
| (フロー) フローあたりのプロンプトノード数 | サポートされている各リージョン: 20 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-0F2A24D7)  | プロンプトノードの最大数。 | 
| (フロー) フローあたりの S3 取得ノード数 | サポートされている各リージョン: 10 | いいえ | S3 取得ノードの最大数。 | 
| (フロー) フローあたりの S3 ストレージノード数 | サポートされている各リージョン: 10 | いいえ | S3 ストレージノードの最大数。 | 
| (フロー) フローあたりの合計ノード数 | サポートされている各リージョン: 40 | いいえ | フロー内のノードの最大数。 | 
| (フロー) 1 秒あたりの UpdateFlow リクエスト数 | サポートされている各リージョン: 2 | いいえ | 1 秒あたりの UpdateFlow リクエストの最大数。 | 
| (フロー) 1 秒あたりの UpdateFlowAlias リクエスト数 | サポートされている各リージョン: 2 | いいえ | 1 秒あたりの UpdateFlowAlias リクエストの最大数。 | 
| (フロー) 1 秒あたりの ValidateFlowDefinition リクエスト数 | サポートされている各リージョン: 2 | いいえ | 1 秒あたりの ValidateFlowDefinition リクエストの最大数。 | 
| (ガードレール) ガードレールあたりの自動推論ポリシー | サポートされている各リージョン: 2 | いいえ | ガードレールあたりの自動推論ポリシーの最大数。 | 
| (ガードレール) テキスト単位のコンテキストグラウンディングクエリの長さ | サポートされている各リージョン: 1 | [いいえ] | テキスト単位のコンテキストグラウンディングクエリの最大長 | 
| (ガードレール) テキスト単位のコンテキストグラウンディングレスポンスの長さ | サポートされている各リージョン：5 | いいえ | テキスト単位のコンテキストグラウンディングレスポンスの最大長 | 
| (ガードレール) テキスト単位のコンテキストグラウンディングソースの長さ | us-east-1: 100<br />us-west-2: 100<br />他のサポートされている各リージョン: 50 | いいえ | テキスト単位のコンテキストグラウンディングのグラウンディングソースの最大長 | 
| (ガードレール) トピックあたりのフレーズの例 | サポートされている各リージョン：5 | いいえ | トピックごとに含めることができるトピックの例の最大数 | 
| (ガードレール) アカウントあたりのガードレール数 | サポートされている各リージョン: 100 | いいえ | アカウント内のガードレールの最大数 | 
| (ガードレール) オンデマンド ApplyGuardrail コンテンツフィルターポリシーの 1 秒あたりのテキストユニット数 | us-east-1: 200<br />us-west-2: 200<br />他のサポートされている各リージョン: 25 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-01F3CD81)  | コンテンツフィルターポリシーで処理できる 1 秒あたりのテキストユニットの最大数 | 
| (ガードレール) オンデマンド ApplyGuardrail コンテンツフィルターポリシーの 1 秒あたりのテキストユニット数 (標準) | us-east-1: 200<br />us-east-2: 200<br />us-west-1: 200<br />us-west-2: 200<br />ap-northeast-1: 50<br />ap-northeast-2: 100<br />ap-south-1: 50<br />ap-southeast-1: 100<br />eu-central-1: 50<br />他のサポートされている各リージョン: 25 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-6B3D3DE4)  | コンテンツフィルターポリシーで処理できる 1 秒あたりのテキストユニットの最大数。これは標準コンテンツポリシーモデルに適用されます。 | 
| (ガードレール) オンデマンド ApplyGuardrail 拒否トピックポリシーの 1 秒あたりのテキストユニット数 | us-east-1: 50<br />us-west-2: 50<br />他のサポートされている各リージョン: 25 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-124DCF3D)  | 拒否トピックポリシーで処理できる 1 秒あたりのテキストユニットの最大数 | 
| (ガードレール) オンデマンド ApplyGuardrail 拒否トピックポリシーの 1 秒あたりのテキストユニット数 (標準) | us-east-1: 200<br />us-west-2: 200<br />他のサポートされている各リージョン: 25 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5755FAB6)  | 拒否トピックポリシーで処理できる 1 秒あたりのテキストユニットの最大数。これは、標準トピックポリシーモデルに適用されます。 | 
| (ガードレール) オンデマンド ApplyGuardrail 機密情報フィルターポリシーの 1 秒あたりのテキストユニット数 | us-east-1: 500<br />us-east-2: 100<br />us-west-1: 50<br />us-west-2: 500<br />ap-northeast-1: 500<br />ap-northeast-2: 100<br />ap-south-1: 200<br />ap-southeast-1: 100<br />eu-central-1: 500<br />他のサポートされている各リージョン: 25 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-CFCAAB0E)  | 機密情報フィルターポリシーで処理できる 1 秒あたりのテキストユニットの最大数 | 
| (ガードレール) オンデマンド ApplyGuardrail 単語フィルターポリシーの 1 秒あたりのテキストユニット数 | us-east-1: 500<br />us-east-2: 500<br />us-west-1: 500<br />us-west-2: 500<br />ap-northeast-1: 500<br />ap-northeast-2: 500<br />ap-south-1: 500<br />ap-southeast-1: 500<br />eu-central-1: 500<br />他のサポートされている各リージョン: 25 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9F4DB459)  | 単語フィルターポリシーで処理できる 1 秒あたりのテキストユニットの最大数 | 
| (ガードレール) オンデマンド ApplyGuardrail コンテキストグラウンディングポリシーの 1 秒あたりのテキストユニット数 | サポートされている各リージョン: 106 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-086556D1)  | コンテキストグラウンディングポリシーで処理できる 1 秒あたりのテキストユニットの最大数 | 
| (ガードレール) 1 秒あたりのオンデマンド ApplyGuardrail リクエスト数 | us-east-1: 100<br />us-east-2: 100<br />us-west-1: 100<br />us-west-2: 100<br />ap-northeast-1: 100<br />ap-northeast-2: 100<br />ap-south-1: 100<br />ap-southeast-1: 100<br />eu-central-1: 100<br />他のサポートされている各リージョン: 25 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9072D6F0)  | 1 秒あたりに実行できる ApplyGuardrail API コールの最大数 | 
| (ガードレール) 機密情報フィルターの正規表現エンティティ | me-central-1: 10<br />サポートされている他の各リージョン: 30 | いいえ | 機密情報ポリシーに含めることができるガードレールフィルター正規表現の最大数 | 
| (ガードレール) 正規表現の長さ (文字数) | サポートされている各リージョン: 500 | いいえ | ガードレールフィルター正規表現の最大文字数 | 
| (ガードレール) ガードレールあたりのトピック | サポートされている各リージョン: 30 | いいえ | ガードレールトピックポリシー間で定義できるトピックの最大数 | 
| (ガードレール) ガードレールあたりのバージョン | サポートされている各リージョン: 20 | いいえ | ガードレールで保持できるバージョンの最大数 | 
| (ガードレール) 単語の長さ (文字数) | サポートされている各リージョン: 100 | いいえ | ブロックされた単語リスト内の単語の最大長 (文字数) | 
| (ガードレール) 単語ポリシーあたりの単語数 | サポートされている各リージョン: 10,000 | いいえ | ブロックされる単語リストに含めることができる単語の最大数 | 
| (ナレッジベース) アカウントあたりの IngestKnowledgeBaseDocuments リクエストと DeleteKnowledgeBaseDocuments リクエストの同時実行 | サポートされている各リージョン: 10 | いいえ | アカウントで同時に実行できる IngestKnowledgeBaseDocuments リクエストと DeleteKnowledgeBaseDocuments リクエストの最大数。 | 
| (ナレッジベース) アカウントあたりの同時取り込みジョブ | サポートされている各リージョン：5 | いいえ | アカウントで同時に実行できる取り込みジョブの最大数。 | 
| (ナレッジベース) データソースあたりの同時取り込みジョブ | サポートされている各リージョン: 1 | [いいえ] | データソースに対して同時に実行できる取り込みジョブの最大数。 | 
| (ナレッジベース) ナレッジベースあたりの同時取り込みジョブ | サポートされている各リージョン: 1 | [いいえ] | ナレッジベースに対して同時に実行できる取り込みジョブの最大数。 | 
| (ナレッジベース) 1 秒あたりの CreateDataSource リクエスト数 | サポートされている各リージョン: 2 | いいえ | 1 秒あたりの CreateDataSource API リクエストの最大数。 | 
| (ナレッジベース) 1 秒あたりの CreateKnowledgeBase リクエスト数 | サポートされている各リージョン: 2 | いいえ | 1 秒あたりの CreateKnowledgeBase API リクエストの最大数。 | 
| (ナレッジベース) ナレッジベースあたりのデータソース | サポートされている各リージョン：5 | いいえ | ナレッジベースあたりのデータソースの最大数。 | 
| (ナレッジベース) 1 秒あたりの DeleteDataSource リクエスト数 | サポートされている各リージョン: 2 | いいえ | 1 秒あたりの DeleteDataSource API リクエストの最大数。 | 
| (ナレッジベース) 1 秒あたりの DeleteKnowledgeBase リクエスト数 | サポートされている各リージョン: 2 | いいえ | 1 秒あたりの DeleteKnowledgeBase API リクエストの最大数。 | 
| (ナレッジベース) 1 秒あたりの DeleteKnowledgeBaseDocuments リクエスト数 | サポートされている各リージョン：5 | いいえ | 1 秒あたりの DeleteKnowledgeBaseDocuments API リクエストの最大数。 | 
| (ナレッジベース) 取り込みジョブごとに追加または更新するファイル | サポートされている各リージョン: 5,000,000 | いいえ | 取り込みジョブごとに取り込み可能な新規および更新されたファイルの最大数。 | 
| (ナレッジベース) 取り込みジョブごとに削除するファイル | サポートされている各リージョン: 5,000,000 | いいえ | 取り込みジョブごとに削除できるファイルの最大数。 | 
| (ナレッジベース) IngestKnowledgeBaseDocuments ジョブごとに取り込むファイル。 | サポートされている各リージョン: 25 | いいえ | IngestKnowledgeBaseDocuments リクエストごとに取り込み可能なドキュメントの最大数。 | 
| (ナレッジベース) 1 秒あたりの GenerateQuery リクエスト数 | サポートされている各リージョン: 2 | いいえ | 1 秒あたりの GenerateQuery API リクエストの最大数。 | 
| (ナレッジベース) 1 秒あたりの GetDataSource リクエスト数 | サポートされている各リージョン: 10 | いいえ | 1 秒あたりの GetDataSource API リクエストの最大数。 | 
| (ナレッジベース) 1 秒あたりの GetIngestionJob リクエスト数 | サポートされている各リージョン: 10 | いいえ | 1 秒あたりの GetIngestionJob API リクエストの最大数。 | 
| (ナレッジベース) 1 秒あたりの GetKnowledgeBase リクエスト数 | サポートされている各リージョン: 10 | いいえ | 1 秒あたりの GetKnowledgeBase API リクエストの最大数。 | 
| (ナレッジベース) 1 秒あたりの GetKnowledgeBaseDocuments リクエスト数 | サポートされている各リージョン：5 | いいえ | 1 秒あたりの GetKnowledgeBaseDocuments API リクエストの最大数。 | 
| (ナレッジベース) 1 秒あたりの IngestKnowledgeBaseDocuments リクエスト数 | サポートされている各リージョン：5 | いいえ | 1 秒あたりの IngestKnowledgeBaseDocuments API リクエストの最大数。 | 
| (ナレッジベース) IngestKnowledgeBaseDocuments の合計ペイロードサイズ | サポートされている各リージョン: 6 | いいえ | IngestKnowledgeBaseDocuments リクエストの合計ペイロードの最大サイズ (MB)。 | 
| (ナレッジベース) テキストコンテンツを含む取り込みジョブファイルサイズ | サポートされている各リージョン: 50 | いいえ | 取り込みジョブ内のテキストコンテンツ (.txt、.pdf、.docx ファイルなど) を含むファイルの最大サイズ (MB 単位）。 | 
| (ナレッジベース) 取り込みジョブのサイズ | サポートされている各リージョン: 100 | いいえ | 取り込みジョブの最大サイズ (GB)。 | 
| (ナレッジベース) アカウントあたりのナレッジベース数 | サポートされている各リージョン: 100 | いいえ | アカウントあたりのナレッジベースの最大数。 | 
| (ナレッジベース) 1 秒あたりの ListDataSources リクエスト数 | サポートされている各リージョン: 10 | いいえ | 1 秒あたりの ListDataSources API リクエストの最大数。 | 
| (ナレッジベース) 1 秒あたりの ListIngestionJobs リクエスト数 | サポートされている各リージョン: 10 | いいえ | 1 秒あたりの ListIngestionJobs API リクエストの最大数。 | 
| (ナレッジベース) 1 秒あたりの ListKnowledgeBaseDocuments リクエスト数 | サポートされている各リージョン：5 | いいえ | 1 秒あたりの ListKnowledgeBaseDocuments API リクエストの最大数。 | 
| (ナレッジベース) 1 秒あたりの ListKnowledgeBases リクエスト数 | サポートされている各リージョン: 10 | いいえ | 1 秒あたりの ListKnowledgeBases API リクエストの最大数。 | 
| (ナレッジベース) BDA パーサーのファイルの最大数 | サポートされている各リージョン: 1,000 | いいえ | Amazon Bedrock Data Automation をパーサーとして使用できるファイルの最大数。 | 
| (ナレッジベース) パーサーとしての基盤モデルのファイルの最大数 | サポートされている各リージョン: 1,000 | いいえ | 基盤モデルをパーサーとして使用できるファイルの最大数。 | 
| (ナレッジベース) 1 秒あたりの Rerank リクエスト数 | サポートされている各リージョン: 10 | いいえ | 1 秒あたりの Rerank API リクエストの最大数。 | 
| (ナレッジベース) 1 秒あたりの Retrieve リクエスト数 | サポートされている各リージョン: 20 | いいえ | 1 秒あたりの Retrieve API リクエストの最大数。 | 
| (ナレッジベース) 1 秒あたりの RetrieveAndGenerate リクエスト数 | サポートされている各リージョン: 20 | いいえ | 1 秒あたりの RetrieveAndGenerate API リクエストの最大数。 | 
| (ナレッジベース) 1 秒あたりの RetrieveAndGenerateStream リクエスト数 | サポートされている各リージョン: 20 | いいえ | 1 秒あたりの RetrieveAndGenerateStream API リクエストの最大数。 | 
| (ナレッジベース) 1 秒あたりの StartIngestionJob リクエスト数 | サポートされている各リージョン: 0.1 | いいえ | 1 秒あたりの StartIngestionJob API リクエストの最大数。 | 
| (ナレッジベース) 1 秒あたりの UpdateDataSource リクエスト数 | サポートされている各リージョン: 2 | いいえ | 1 秒あたりの UpdateDataSource API のリクエストの最大数。 | 
| (ナレッジベース) 1 秒あたりの UpdateKnowledgeBase リクエスト数 | サポートされている各リージョン: 2 | いいえ | 1 秒あたりの UpdateKnowledgeBase API リクエストの最大数。 | 
| (ナレッジベース) ユーザークエリサイズ | サポートされている各リージョン: 1,000 | いいえ | ユーザークエリの最大サイズ (文字数)。 | 
| (モデルのカスタマイズ) アカウントあたりのカスタムモデル | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-CB5B847D)  | アカウントのカスタムモデルの最大数。 | 
| (モデルのカスタマイズ) 進行中のカスタムモデルのデプロイ | サポートされている各リージョン: 2 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-430C95DD)  | 進行中のカスタムモデルのデプロイの最大数 | 
| (モデルのカスタマイズ) カスタマイズ蒸留ジョブの最大入力ファイルサイズ | サポートされている各リージョン: 2 GB | いいえ | カスタマイズ蒸留ジョブの最大入力ファイルサイズ。 | 
| (モデルのカスタマイズ) カスタマイズ蒸留ジョブの最大行長 | サポートされている各リージョン: 16 キロバイト | いいえ | カスタマイズ蒸留ジョブの入力ファイルの最大行長。 | 
| (モデルのカスタマイズ) カスタマイズ蒸留ジョブのプロンプトの最大数 | サポートされている各リージョン: 15,000 | いいえ | カスタマイズ蒸留ジョブに必要なプロンプトの最大数。 | 
| (モデルのカスタマイズ) Amazon Nova Canvas ファインチューニングジョブのトレーニングレコードの最大数 | サポートされている各リージョン: 10,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D3D1200C)  | Amazon Nova Canvas ファインチューニングジョブで許可されるレコードの最大数。 | 
| (モデルのカスタマイズ) Amazon Nova Micro V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長 | サポートされている各リージョン: 32,000 | いいえ | Amazon Nova Micro V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長。 | 
| (モデルのカスタマイズ) Amazon Nova V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長 | サポートされている各リージョン: 32,000 | いいえ | Amazon Nova V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長。 | 
| (モデルのカスタマイズ) Anthropic Claude 3 haiku 20240307 V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長 | サポートされている各リージョン: 32,000 | いいえ | Anthropic Claude 3 haiku 20240307 V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長。 | 
| (モデルのカスタマイズ) Llama 3.1 70B Instruct V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長 | サポートされている各リージョン: 16,000 | いいえ | Llama 3.1 70B Instruct V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長。 | 
| (モデルのカスタマイズ) Llama 3.1 8B Instruct V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長 | サポートされている各リージョン: 32,000 | いいえ | Llama 3.1 8B Instruct V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長。 | 
| (モデルのカスタマイズ) カスタマイズ蒸留ジョブのプロンプトの最小数 | サポートされている各リージョン: 100 | いいえ | カスタマイズ蒸留ジョブに必要なプロンプトの最小数。 | 
| (モデルのカスタマイズ) スケジュールされたカスタマイズジョブ | サポートされている各リージョン: 10 | いいえ | スケジュールされたカスタマイズジョブの最大数。 | 
| (モデルカスタマイズ) Amazon Nova 2 Lite の 1 分あたりのオンデマンドカスタムモデルデプロイリクエストの合計 | サポートされている各リージョン: 2,000 | いいえ | Amazon Nova 2 Lite の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりのオンデマンドカスタムモデルデプロイリクエストの入出力の合計 | 
| (モデルのカスタマイズ) Amazon Nova Lite の 1 分あたりのオンデマンドカスタムモデルデプロイリクエストの合計 | サポートされている各リージョン: 2,000 | いいえ | Amazon Nova Lite の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりの入出力オンデマンドカスタムモデルデプロイリクエストの合計 | 
| (モデルのカスタマイズ) Amazon Nova Micro の 1 分あたりのオンデマンドカスタムモデルデプロイリクエストの合計 | サポートされている各リージョン: 2,000 | いいえ | Amazon Nova Micro の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりの入出力オンデマンドカスタムモデルデプロイリクエストの合計 | 
| (モデルのカスタマイズ) Amazon Nova Pro の 1 分あたりのオンデマンドカスタムモデルデプロイリクエストの合計 | サポートされている各リージョン: 200 | いいえ | Amazon Nova Pro の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりの入出力オンデマンドカスタムモデルデプロイリクエストの合計 | 
| (モデルのカスタマイズ) Meta Llama 3.3 70B Instruct の 1 分あたりのオンデマンドカスタムモデルデプロイリクエストの合計 | サポートされている各リージョン: 400 | いいえ | Meta Llama 3.3 70B Instruct の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりの入出力オンデマンドカスタムモデルデプロイリクエストの合計 | 
| (モデルカスタマイズ) Amazon Nova 2 Lite の 1 日あたりのオンデマンドカスタムモデルデプロイトークンの合計 | サポートされている各リージョン: 5,760,000,000 | いいえ | Amazon Nova 2 Lite の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 日あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計 | 
| (モデルのカスタマイズ) Amazon Nova Lite の 1 日あたりのオンデマンドカスタムモデルデプロイトークンの合計 | サポートされている各リージョン: 5,760,000,000 | いいえ | Amazon Nova Lite の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 日あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計 | 
| (モデルのカスタマイズ) Amazon Nova Micro の 1 日あたりのオンデマンドカスタムモデルデプロイトークンの合計 | サポートされている各リージョン: 5,760,000,000 | いいえ | Amazon Nova Micro の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 日あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計 | 
| (モデルのカスタマイズ) Amazon Nova Pro の 1 日あたりのオンデマンドカスタムモデルデプロイトークンの合計 | サポートされている各リージョン: 1,152,000,000 | いいえ | Amazon Nova Pro の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 日あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計 | 
| (モデルのカスタマイズ) Meta Llama 3.3 70B Instruct の 1 日あたりのオンデマンドカスタムモデルデプロイトークンの合計 | サポートされている各リージョン: 432,000,000 | いいえ | Meta Llama 3.3 70B Instruct の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 日あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計 | 
| (モデルカスタマイズ) Amazon Nova 2 Lite の 1 分あたりのオンデマンドカスタムモデルデプロイトークンの合計 | サポートされている各リージョン: 4,000,000 | いいえ | Amazon Nova 2 Lite の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計 | 
| (モデルのカスタマイズ) Amazon Nova Lite の 1 分あたりのオンデマンドカスタムモデルデプロイトークンの合計 | サポートされている各リージョン: 4,000,000 | いいえ | Amazon Nova Lite の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計 | 
| (モデルのカスタマイズ) Amazon Nova Micro の 1 分あたりのオンデマンドカスタムモデルデプロイトークンの合計 | サポートされている各リージョン: 4,000,000 | いいえ | Amazon Nova Micro の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計 | 
| (モデルのカスタマイズ) Amazon Nova Pro の 1 分あたりのオンデマンドカスタムモデルデプロイトークンの合計 | サポートされている各リージョン: 800,000 | いいえ | Amazon Nova Pro の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計 | 
| (モデルのカスタマイズ) Meta Llama 3.3 70B Instruct の 1 分あたりのオンデマンドカスタムモデルデプロイトークンの合計 | サポートされている各リージョン: 300,000 | いいえ | Meta Llama 3.3 70B Instruct の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計 | 
| (モデルのカスタマイズ) Amazon Nova 2 Lite ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 20,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-82EE9228)  | Amazon Nova 2 Lite ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの合計最大数。 | 
| (モデルのカスタマイズ) Amazon Nova Lite ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 20,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-031F46A7)  | Amazon Nova Lite ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 | 
| (モデルのカスタマイズ) Amazon Nova Micro ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 20,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-EC6A6ABC)  | Amazon Nova Micro ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 | 
| (モデルのカスタマイズ) Amazon Nova Pro ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 20,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-70FC4C0E)  | Amazon Nova Pro ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 | 
| (モデルのカスタマイズ) Claude 3 Haiku v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-679179D2)  | Claude 3 Haiku ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 | 
| (モデルのカスタマイズ) Claude 3-5-Haiku v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-ADA98D8D)  | Claude 3-5-Haiku ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 | 
| (モデルのカスタマイズ) Meta Llama 2 13B v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-68AE6C02)  | Meta Llama 2 13B ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 | 
| (モデルのカスタマイズ) Meta Llama 2 70B v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5A222661)  | Meta Llama 2 70B ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 | 
| (モデルのカスタマイズ) Meta Llama 3.1 70B Instruct v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-63EC9D04)  | Meta Llama 3.1 70B Instruct ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 | 
| (モデルのカスタマイズ) Meta Llama 3.1 8B Instruct v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-34C933D1)  | Meta Llama 3.1 8B Instruct ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 | 
| (モデルのカスタマイズ) Meta Llama 3.2 11B Instruct v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E5FD5C04)  | Meta Llama 3.2 11B Instruct ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 | 
| (モデルのカスタマイズ) Meta Llama 3.2 1B Instruct v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-70B8359C)  | Meta Llama 3.2 1B Instruct ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 | 
| (モデルのカスタマイズ) Meta Llama 3.2 3B Instruct v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-75A18A04)  | Meta Llama 3.2 3B Instruct ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 | 
| (モデルのカスタマイズ) Meta Llama 3.2 90B Instruct v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8076814C)  | Meta Llama 3.2 90B Instruct ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 | 
| (モデルのカスタマイズ) Meta Llama 3.3 70B Instruct v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-48C95F85)  | Meta Llama 3.3 70B Instruct ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 | 
| (モデルのカスタマイズ) Titan Image Generator G1 V1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-73BBA086)  | Titan Image Generator ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 | 
| (モデルのカスタマイズ) Titan Image Generator G1 V2 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F15FCC01)  | Titan Image Generator V2 ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 | 
| (モデルのカスタマイズ) Titan Multimodal Embeddings G1 v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン：50,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-BB313AA3)  | Titan Multimodal Embeddings ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 | 
| (モデルのカスタマイズ) Titan Text G1 – Express v1 の継続的な事前トレーニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-CDD9DC4A)  | Titan Text Express の継続的な事前トレーニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 | 
| (モデルのカスタマイズ) Titan Text G1 – Express v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-79BA683B)  | Titan Text Express ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 | 
| (モデルのカスタマイズ) Titan Text G1 – Lite v1 の継続的な事前トレーニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-91554672)  | Titan Text Lite の継続的な事前トレーニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 | 
| (モデルのカスタマイズ) Titan Text G1 – Lite v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-3B82104D)  | Titan Text Lite ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 | 
| (モデルのカスタマイズ) Titan Text G1 – Premier v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 20,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C0CACF50)  | Titan Text Premier ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 | 
| (モデルのカスタマイズ) カスタムモデルのデプロイの合計数 | サポートされている各リージョン: 10 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1EF80F3E)  | カスタムモデルのデプロイの合計数 | 
| (プロンプト管理) 1 秒あたりの CreatePrompt リクエスト数 | サポートされている各リージョン: 2 | いいえ | 1 秒あたりの CreatePrompt リクエストの最大数。 | 
| (プロンプト管理) 1 秒あたりの CreatePromptVersion リクエスト数 | サポートされている各リージョン: 2 | いいえ | 1 秒あたりの CreatePromptVersion リクエストの最大数。 | 
| (プロンプト管理) 1 秒あたりの DeletePrompt リクエスト数 | サポートされている各リージョン: 2 | いいえ | 1 秒あたりの DeletePrompt リクエストの最大数。 | 
| (プロンプト管理) 1 秒あたりの GetPrompt リクエスト数 | サポートされている各リージョン: 10 | いいえ | 1 秒あたりの GetPrompt リクエストの最大数。 | 
| (プロンプト管理) 1 秒あたりの ListPrompts リクエスト数 | サポートされている各リージョン: 10 | いいえ | 1 秒あたりの ListPrompts リクエストの最大数。 | 
| (プロンプト管理) アカウントあたりのプロンプト | サポートされている各リージョン: 500 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B783C50B)  | プロンプトの最大数。 | 
| (プロンプト管理) 1 秒あたりの UpdatePrompt リクエスト数 | サポートされている各リージョン: 2 | いいえ | 1 秒あたりの UpdatePrompt リクエストの最大数。 | 
| (プロンプト管理) プロンプトあたりのバージョン | サポートされている各リージョン: 10 | いいえ | プロンプトあたりのバージョンの最大数。 | 
| エージェントあたりの API | サポートされている各リージョン: 11 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-6B2DA87E)  | エージェントに追加できる API の最大数。 | 
| エージェントあたりのアクショングループ | サポートされている各リージョン: 20 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5DAAE567)  | エージェントに追加できるアクショングループの最大数。 | 
| エージェントあたりのエージェントコラボレーター | サポートされている各リージョン: 1,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-EAFCD549)  | エージェントに追加できるコラボレーターエージェントの最大数。 | 
| アカウントあたりのエージェント | サポートされている各リージョン: 1,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-97D79C54)  | 1 つのアカウントのエージェントの最大数。 | 
| 1 秒あたりの AssociateAgentKnowledgeBase リクエスト数 | サポートされている各リージョン: 6 | いいえ | 1 秒あたりの AssociateAgentKnowledgeBase API リクエストの最大数。 | 
| エージェントあたりの関連付けられたエイリアス | サポートされている各リージョン: 10 | いいえ | エージェントに関連付けられるエイリアスの最大数。 | 
| エージェントあたりの関連付けられたナレッジベース | サポートされている各リージョン: 2 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-13143995)  | エージェントに関連付けられるナレッジベースの最大数。 | 
| Amazon Nova 2 マルチモーダル埋め込み V1 のバッチ推論入力ファイルサイズ (GB 単位) | サポートされている各リージョン: 1 | [いいえ] | Amazon Nova 2 マルチモーダル埋め込み V1 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| Amazon Nova Premier のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Amazon Nova Premier のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Claude 3 Haiku のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Claude 3 Haiku のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Claude 3 Opus のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Claude 3 Opus のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Claude 3 Sonnet のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Claude 3 Sonnet のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Claude 3.5 Haiku のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Claude 3.5 Haiku のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Claude 3.5 Sonnet のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Claude 3.5 Sonnet のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Claude 3.5 Sonnet v2 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Claude 3.5 Sonnet v2 のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Claude 3.7 Sonnet のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F8B0126D)  | Claude 3.7 Sonnet のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Claude Haiku 4.5 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Claude Haiku 4.5 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| Claude Opus 4.5 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Claude Opus 4.5 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| Claude Opus 4.6 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Claude Opus 4.6 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| Claude Sonnet 4 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F611997D)  | Claude Sonnet 4 のバッチ推論に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Claude Sonnet 4.5 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Claude Sonnet 4.5 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| Claude Sonnet 4.6 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Claude Sonnet 4.6 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| DeepSeek V3.2 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | DeepSeek V3.2 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| DeepSeek v3 のバッチ推論入力ファイルサイズ (GB 単位) | サポートされている各リージョン: 1 | [いいえ] | DeepSeek v3 のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Devstral 2 123B のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Devstral 2 123B のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| GLM 4.7 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | GLM 4.7 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| GLM 4.7 Flash のバッチ推論入力ファイルサイズ (GB 単位) | サポートされている各リージョン: 1 | [いいえ] | GLM 4.7 Flash のバッチ推論に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| GLM 5 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | GLM 5 のバッチ推論に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| Gemma 3 12B のバッチ推論入力ファイルサイズ (GB 単位) | サポートされている各リージョン: 1 | [いいえ] | Gemma 3 12B のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| Gemma 3 27B のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Gemma 3 27B のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| Gemma 3 4B のバッチ推論入力ファイルサイズ (GB 単位) | サポートされている各リージョン: 1 | [いいえ] | Gemma 3 4B のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| Kimi K2 thinking のバッチ推論入力ファイルサイズ (GB 単位) | サポートされている各リージョン: 1 | [いいえ] | Kimi K2 Think のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| Kimi K2.5 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Kimi K2.5 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| Llama 3.1 405B Instruct のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Llama 3.1 405B Instruct のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Llama 3.1 70B Instruct のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Llama 3.1 70B Instruct のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Llama 3.1 8B Instruct のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Llama 3.1 8B Instruct のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Llama 3.2 11B Instruct のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Llama 3.2 11B Instruct のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Llama 3.2 1B Instruct のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Llama 3.2 1B Instruct のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Llama 3.2 3B Instruct のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Llama 3.2 3B Instruct のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Llama 3.2 90B Instruct のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Llama 3.2 90B Instruct のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Llama 3.3 70B Instruct のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Llama 3.3 70B Instruct のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Llama 4 Maverick のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Llama 4 Maverick のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Llama 4 Scout のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Llama 4 Scout のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Magistral Small 2509 のバッチ推論入力ファイルサイズ (GB 単位) | サポートされている各リージョン: 1 | [いいえ] | Magistral Small 2509 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| MiniMax M2 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | MiniMax M2 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| MiniMax M2.1 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | MiniMax M2.1 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| MiniMax M2.5 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | MiniMax M2.5 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| Ministral 3 14B のバッチ推論入力ファイルサイズ (GB 単位) | サポートされている各リージョン: 1 | [いいえ] | Ministral 3 14B のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| Ministral 3 8B のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Ministral 3 8B のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| Ministral 3B のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Ministral 3B のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| Mistral Large 2 (24.07) のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Mistral Large 2 (24.07) のバッチ推論に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Mistral Large 3 のバッチ推論入力ファイルサイズ (GB 単位) | サポートされている各リージョン: 1 | [いいえ] | Mistral Large 3 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| Mistral Small のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Mistral Small のバッチ推論に送信される 1 つのファイルの最大サイズ (GB)。 | 
| NVIDIA Nemotron 3 Super 120B A12B のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | NVIDIA Nemotron 3 Super 120B A12B のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| NVIDIA Nemotron Nano 12B のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | NVIDIA Nemotron Nano 12B のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| NVIDIA Nemotron Nano 3 30B のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | NVIDIA Nemotron Nano 3 30B のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| NVIDIA Nemotron Nano 9B のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | NVIDIA Nemotron Nano 9B のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| Nova 2 Lite のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Nova 2 Lite のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| Nova Lite V1 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Nova Lite V1 のバッチ推論に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Nova Micro V1 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Nova Micro V1 のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Nova Pro V1 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Nova Pro V1 のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| OpenAI GPT OSS 120b のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | OpenAI GPT OSS 120b のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| OpenAI GPT OSS 20b のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | OpenAI GPT OSS 20b のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| OpenAI GPT OSS Safeguard 120b のバッチ推論入力ファイルサイズ (GB 単位) | サポートされている各リージョン: 1 | [いいえ] | OpenAI GPT OSS Safeguard 120b のバッチ推論に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| OpenAI GPT OSS Safeguard 20b のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | OpenAI GPT OSS Safeguard 20b のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| Qwen3 235B のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Qwen3 235B のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Qwen3 32B のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Qwen3 32B のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Qwen3 Coder 30B のバッチ推論入力ファイルサイズ (GB 単位) | サポートされている各リージョン: 1 | [いいえ] | Qwen3 Coder 30B のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Qwen3 Coder 480B のバッチ推論入力ファイルサイズ (GB 単位) | サポートされている各リージョン: 1 | [いいえ] | Qwen3 Coder 480B のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Qwen3 Coder Next のバッチ推論入力ファイルサイズ (GB 単位) | サポートされている各リージョン: 1 | [いいえ] | Qwen3 Coder Next のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| Qwen3 Next 80B のバッチ推論入力ファイルサイズ (GB 単位) | サポートされている各リージョン: 1 | [いいえ] | Qwen3 Next 80B のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| Qwen3 VL 235B のバッチ推論入力ファイルサイズ (GB 単位) | サポートされている各リージョン: 1 | [いいえ] | Qwen3 VL 235B のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| Titan Multimodal Embeddings G1 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Titan Multimodal Embeddings G1 のバッチ推論に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Titan Text Embeddings V2 のバッチ推論入力ファイルサイズ (GB 単位) | サポートされている各リージョン: 1 | [いいえ] | Titan Text Embeddings V2 のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 | 
| Voxtral Mini 3B 2507 のバッチ推論入力ファイルサイズ (GB 単位) | サポートされている各リージョン: 1 | [いいえ] | Voxtral Mini 3B 2507 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| Voxtral Small 24B 2507 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Voxtral Small 24B 2507 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| Writer Palmyra Vision 7B のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Writer Palmyra Vision 7B のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。 | 
| Qwen3 Next 80B のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Qwen3 Next 80B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| Amazon Nova 2 マルチモーダル埋め込み V1 のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン: 100 | いいえ | Amazon Nova 2 マルチモーダル埋め込み V1 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| Amazon Nova Premier のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Amazon Nova Premier のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Claude 3 Haiku のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Claude 3 Haiku のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Claude 3 Opus のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Claude 3 Opus のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Claude 3 Sonnet のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Claude 3 Sonnet のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Claude 3.5 Haiku のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Claude 3.5 Haiku のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Claude 3.5 Sonnet のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Claude 3.5 Sonnet のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Claude 3.5 Sonnet v2 のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Claude 3.5 Sonnet v2 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Claude 3.7 Sonnet のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン： 5 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-02D6293C)  | Claude 3.7 Sonnet のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Claude Haiku 4.5 のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Claude Haiku 4.5 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| Claude Opus 4.5 のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | Claude Opus 4.5 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| Claude Opus 4.6 のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | Claude Opus 4.6 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| Claude Sonnet 4 のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン： 5 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E31283B0)  | Claude Sonnet 4 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Claude Sonnet 4.5 のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Claude Sonnet 4.5 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| Claude Sonnet 4.6 のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | Claude Sonnet 4.6 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| DeepSeek V3.2 のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | DeepSeek V3.2 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| DeepSeek v3 のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | DeepSeek v3 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Devstral 2 123B のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | Devstral 2 123B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| GLM 4.7 のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | GLM 4.7 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| GLM 4.7 Flash のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | GLM 4.7 Flash のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| GLM 5 のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | GLM 5 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| Gemma 3 12B のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Gemma 3 12B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| Gemma 3 27B のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | Gemma 3 27B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| Gemma 3 4B のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Gemma 3 4B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| Kimi K2 thinking のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | Kimi K2 Think のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| Kimi K2.5 のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | Kimi K2.5 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| Llama 3.1 405B Instruct のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Llama 3.1 405B Instruct のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Llama 3.1 70B Instruct のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Llama 3.1 70B Instruct のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Llama 3.1 8B Instruct のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Llama 3.1 8B Instruct のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Llama 3.2 11B Instruct のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Llama 3.2 11B Instruct のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Llama 3.2 1B Instruct のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Llama 3.2 1B Instruct のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Llama 3.2 3B Instruct のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Llama 3.2 3B Instruct のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Llama 3.2 90B Instruct のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Llama 3.2 90B Instruct のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Llama 3.3 70B Instruct のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Llama 3.3 70B Instruct のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Llama 4 Maverick のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Llama 4 Maverick のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Llama 4 Scout のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Llama 4 Scout のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Magistral Small 2509 のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | Magistral Small 2509 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| MiniMax M2 のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | MiniMax M2 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| MiniMax M2.1 のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | MiniMax M2.1 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| MiniMax M2.5 のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | MiniMax M2.5 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| Ministral 3 14B のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | Ministral 3 14B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| Ministral 3 8B のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Ministral 3 8B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| Ministral 3B のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Ministral 3B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| Mistral Large 2 (24.07) のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Mistral Large 2 (24.07) のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Mistral Large 3 のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | Mistral Large 3 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| Mistral Small のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Mistral Small のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| NVIDIA Nemotron 3 Super 120B A12B のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | NVIDIA Nemotron 3 Super 120B A12B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| NVIDIA Nemotron Nano 12B のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | NVIDIA Nemotron Nano 12B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| NVIDIA Nemotron Nano 3 30B のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | NVIDIA Nemotron Nano 3 30B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| NVIDIA Nemotron Nano 9B のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | NVIDIA Nemotron Nano 9B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| Nova Lite V1 のバッチ推論ジョブサイズ (GB) | me-central-1: 5<br />他のサポートされている各リージョン: 100 | いいえ | Nova Lite V1 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Nova Micro V1 のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Nova Micro V1 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Nova Pro V1 のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン: 100 | いいえ | Nova Pro V1 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| OpenAI GPT OSS 120b のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | OpenAI GPT OSS 120b のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| OpenAI GPT OSS 20b のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | OpenAI GPT OSS 20b のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| OpenAI GPT OSS Safeguard 120b のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | OpenAI GPT OSS Safeguard 120b のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| OpenAI GPT OSS Safeguard 20b のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | OpenAI GPT OSS Safeguard 20b のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| Qwen3 235B のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Qwen3 235B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Qwen3 32B のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | Qwen3 32B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Qwen3 Coder 30B のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | Qwen3 Coder 30B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Qwen3 Coder 480B のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | Qwen3 Coder 480B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Qwen3 Coder Next のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | Qwen3 Coder Next のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| Qwen3 VL 235B のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | Qwen3 VL 235B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| Titan Multimodal Embeddings G1 のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン：5 | いいえ | Titan Multimodal Embeddings G1 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Titan Text Embeddings V2 のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | Titan Text Embeddings V2 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 | 
| Voxtral Mini 3B 2507 のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | Voxtral Mini 3B 2507 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| Voxtral Small 24B 2507 のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | Voxtral Small 24B 2507 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| Writer Palmyra Vision 7B のバッチ推論ジョブサイズ (GB 単位) | サポートされている各リージョン：5 | いいえ | Writer Palmyra Vision 7B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。 | 
| エージェント指示の文字 | サポートされている各リージョン: 20,000 | いいえ | エージェントに対する指示の最大文字数。 | 
| 同時モデルインポートジョブ | サポートされている各リージョン: 1 | [いいえ] | 同時進行中のモデルインポートジョブの最大数。 | 
| 1 秒あたりの CreateAgent リクエスト数 | サポートされている各リージョン: 6 | いいえ | 1 秒あたりの CreateAgent API リクエストの最大数。 | 
| 1 秒あたりの CreateAgentActionGroup リクエスト数 | サポートされている各リージョン: 12 | いいえ | 1 秒あたりの CreateAgentActionGroup API リクエストの最大数。 | 
| 1 秒あたりの CreateAgentAlias リクエスト数 | サポートされている各リージョン: 2 | いいえ | 1 秒あたりの CreateAgentAlias API リクエストの最大数。 | 
| Anthropic Claude 3.5 Haiku の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 2,000 | いいえ | InvokeModel と InvokeModelWithResponseStream を 1 分間に呼び出すことができる最大回数。クォータには、Anthropic Claude 3.5 Haiku の InvokeModel トークンと InvokeModelWithResponseStream トークンの合計が考慮されます。 | 
| Anthropic Claude 3.5 Sonnet V2 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | us-west-2: 500<br />他のサポートされている各リージョン: 100 | いいえ | Anthropic Claude 3.5 Sonnet V2 で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| Anthropic Claude 3.5 Haiku の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 4,000,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4BF37C17)  | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Anthropic Claude 3.5 Haiku の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude 3.5 Sonnet V2 の 1 分あたりのクロスリージョンモデル推論トークン数 | us-west-2: 4,000,000<br />サポートされている他の各リージョン: 800,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FF8B4E28)  | Anthropic Claude 3.5 Sonnet V2 でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| Amazon Nova 2 Lite のクロスリージョンモデル推論リクエスト/分 | サポートされている各リージョン: 2,000 | いいえ | Amazon Nova 2 Lite のモデル推論に 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Amazon Nova 2 Omni のクロスリージョンモデル推論リクエスト/分 | サポートされている各リージョン: 2,000 | いいえ | Amazon Nova 2 Omni のモデル推論に 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Amazon Nova 2 Pro Preview のクロスリージョンモデル推論リクエスト/分 | サポートされている各リージョン: 100 | いいえ | Amazon Nova 2 Pro Preview でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Amazon Nova Lite の 1 分あたりのクロスリージョンモデル推論リクエスト数 | us-east-1: 4,000<br />us-east-2: 4,000<br />us-west-1: 4,000<br />us-west-2: 4,000<br />サポートされている他の各リージョン: 400 | いいえ | Amazon Nova Lite でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Amazon Nova Micro の 1 分あたりのクロスリージョンモデル推論リクエスト数 | us-east-1: 4,000<br />us-east-2: 4,000<br />us-west-2: 4,000<br />サポートされている他の各リージョン: 400 | いいえ | Amazon Nova Micro でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Amazon Nova Premier V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 500 | いいえ | Amazon Nova Premier V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Amazon Nova Pro の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 500 | いいえ | Amazon Nova Pro でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Anthropic Claude 3 Haiku の 1 分あたりのクロスリージョンモデル推論リクエスト数 | us-east-1: 2,000<br />us-west-2: 2,000<br />ap-northeast-1: 400<br />ap-southeast-1: 400<br />他のサポートされている各リージョン: 800 | いいえ | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Anthropic Claude 3 Haiku の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| Anthropic Claude 3 Opus の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 100 | いいえ | Anthropic Claude 3 Opus でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Anthropic Claude 3 Sonnet の 1 分あたりのクロスリージョンモデル推論リクエスト数 | us-east-1: 1,000<br />us-west-2: 1,000<br />他のサポートされている各リージョン: 200 | いいえ | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Anthropic Claude 3 Sonnet の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| Anthropic Claude 3.5 Sonnet の 1 分あたりのクロスリージョンモデル推論リクエスト数 | us-west-2: 500<br />ap-northeast-1: 40<br />ap-southeast-1: 40<br />eu-central-1: 40<br />eu-west-1: 40<br />eu-west-3: 40<br />他のサポートされている各リージョン: 100 | いいえ | Anthropic Claude 3.5 Sonnet で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| Anthropic Claude 3.7 Sonnet V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | us-east-1: 250<br />us-east-2: 250<br />us-west-2: 250<br />eu-central-1: 100<br />eu-north-1: 100<br />eu-west-1: 100<br />eu-west-3: 100<br />他のサポートされている各リージョン: 50 | いいえ | Anthropic Claude 3.7 Sonnet V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Anthropic Claude Haiku 4.5 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 10,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-CCA5DF70)  | Anthropic Claude Haiku 4.5 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Anthropic Claude Opus 4 V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 200 | いいえ | Anthropic Claude Opus 4 V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Anthropic Claude Opus 4.1 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 50 | いいえ | Anthropic Claude Opus 4.1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Anthropic Claude Opus 4.5 のクロスリージョンモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-27989F42)  | Anthropic Claude Opus 4.5 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Anthropic Claude Opus 4.6 V1 のクロスリージョンモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-11DFF789)  | Anthropic Claude Opus 4.6 V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Anthropic Claude Sonnet 4 V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 200 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-559DCC33)  | Anthropic Claude Sonnet 4 V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Anthropic Claude Sonnet 4 V1 1M Context Length の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン： 5 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-534E5E05)  | Anthropic Claude Sonnet 4 V1 1M Context Length でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Anthropic Claude Sonnet 4.5 V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 10,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4A6BFAB1)  | Anthropic Claude Sonnet 4.5 V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Anthropic Claude Sonnet 4.5 V1 1M Context Length の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 1,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-A052927A)  | Anthropic Claude Sonnet 4.5 V1 1M Context Length でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Anthropic Claude Sonnet 4.6 のクロスリージョンモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-00FF3314)  | Anthropic Claude Sonnet 4.6 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Cohere Embed V4 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 2,000 | いいえ | Cohere Embed V4 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| DeepSeek R1 V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 200 | いいえ | DeepSeek R1 V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Meta Llama 3.1 405B Instruct の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 400 | いいえ | Meta Llama 3.1 405B Instruct でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Meta Llama 3.1 70B Instruct の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 800 | いいえ | Meta Llama 3.1 70B Instruct でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Meta Llama 3.1 8B Instruct の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 1,600 | いいえ | Meta Llama 3.1 8B Instruct でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Meta Llama 3.2 1B Instruct の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 1,600 | いいえ | Meta Llama 3.2 1B Instruct でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Meta Llama 3.2 3B Instruct の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 1,600 | いいえ | Meta Llama 3.2 3B Instruct で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のリクエストの合計が考慮されます。 | 
| Meta Llama 3.3 70B Instruct の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 800 | いいえ | Meta Llama 3.3 70B Instruct でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Meta Llama 4 Maverick V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 800 | いいえ | Meta Llama 4 Maverick V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Meta Llama 4 Scout V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 800 | いいえ | Meta Llama 4 Scout V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Mistral Pixtral Large 25.02 V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 10 | いいえ | Mistral Pixtral Large 25.02 V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Stable Image Conservative Upscale の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 4 | いいえ | Stable Image Conservative Upscale でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Stable Image Control Sketch の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 20 | いいえ | Stable Image Control Sketch でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Stable Image Control Structure の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 20 | いいえ | Stable Image Control Structure でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Stable Image Creative Upscale の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 4 | いいえ | Stable Image Creative Upscale でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Stable Image Erase Object の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 20 | いいえ | Stable Image Erase Object でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Stable Image Fast Upscale の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 20 | いいえ | Stable Image Fast Upscale でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Stable Image Inpaint の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 20 | いいえ | Stable Image Inpaint でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Stable Image Outpaint の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 4 | いいえ | Stable Image Outpaint でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Stable Image Remove Background の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 20 | いいえ | Stable Image Remove Background でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Stable Image Search and Recolor の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 20 | いいえ | Stable Image Search and Recolor でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Stable Image Search and Replace の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 20 | いいえ | Stable Image Search and Replace でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Stable Image Style Guide の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 20 | いいえ | Stable Image Style Guide でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Stable Image Style Transfer の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 20 | いいえ | Stable Image Style Transfer でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Twelve Labs Marengo の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 200 | いいえ | Twelve Labs Marengo でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Twelve Labs Pegasus の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 120 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-6E046197)  | Twelve Labs Pegasus でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| TwelveLabs Marengo Embed 3.0 のクロスリージョンモデル推論リクエスト/分 | サポートされている各リージョン: 1,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E5197E26)  | TwelveLabs Marengo Embed 3.0 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Writer AI Palmyra X4 V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 10 | いいえ | Writer AI Palmyra X4 V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Writer AI Palmyra X5 V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 10 | いいえ | Writer AI Palmyra X5 V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Amazon Nova 2 Lite のクロスリージョンモデル推論トークン/分 | サポートされている各リージョン: 8,000,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C6F5908D)  | Amazon Nova 2 Lite のモデル推論に 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Amazon Nova 2 Omni のクロスリージョンモデル推論トークン/分 | サポートされている各リージョン: 8,000,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-2438ED67)  | Amazon Nova 2 Omni のモデル推論に 1 分で送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Amazon Nova 2 Pro Preview のクロスリージョンモデル推論トークン/分 | サポートされている各リージョン: 1,000,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F0AF140A)  | Amazon Nova 2 Pro Preview でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Amazon Nova Lite の 1 分あたりのクロスリージョンモデル推論トークン数 | us-east-1: 8,000,000<br />us-east-2: 8,000,000<br />us-west-1: 8,000,000<br />us-west-2: 8,000,000<br />サポートされている他の各リージョン: 400,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7C42E72A)  | Amazon Nova Lite でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Amazon Nova Micro の 1 分あたりのクロスリージョンモデル推論トークン数 | us-east-1: 8,000,000<br />us-east-2: 8,000,000<br />us-west-2: 8,000,000<br />サポートされている他の各リージョン: 400,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-DC7FF66C)  | Amazon Nova Micro でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Amazon Nova Premier V1 の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 2,000,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-AA7FE948)  | Amazon Nova Premier V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Amazon Nova Pro の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 2,000,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C0326783)  | Amazon Nova Pro でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude 3 Haiku の 1 分あたりのクロスリージョンモデル推論トークン数 | us-east-1: 4,000,000<br />us-west-2: 4,000,000<br />ap-northeast-1: 400,000<br />ap-southeast-1: 400,000<br />サポートされている他の各リージョン: 600,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-DCADBC78)  | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Anthropic Claude 3 Haiku の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude 3 Opus の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 800,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-6C86825E)  | Anthropic Claude 3 Opus でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude 3 Sonnet の 1 分あたりのクロスリージョンモデル推論トークン数 | us-east-1: 2,000,000<br />us-west-2: 2,000,000<br />サポートされている他の各リージョン: 400,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5DF13F64)  | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Anthropic Claude 3 Sonnet の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude 3.5 Sonnet の 1 分あたりのクロスリージョンモデル推論トークン数 | us-west-2: 4,000,000<br />ap-northeast-1: 400,000<br />ap-southeast-1: 400,000<br />eu-central-1: 400,000<br />eu-west-1: 400,000<br />eu-west-3: 400,000<br />サポートされている他の各リージョン: 800,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-479B647F)  | Anthropic Claude 3.5 Sonnet でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| Anthropic Claude 3.7 Sonnet V1 の 1 分あたりのクロスリージョンモデル推論トークン数 | us-east-1: 1,000,000<br />us-east-2: 1,000,000<br />us-west-2: 1,000,000<br />eu-central-1: 100,000<br />eu-north-1: 100,000<br />eu-west-1: 100,000<br />eu-west-3: 100,000<br />サポートされている他の各リージョン: 50,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-6E888CC2)  | Anthropic Claude 3.7 Sonnet V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Haiku 4.5 の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 5,000,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-58BE175A)  | Anthropic Claude Haiku 4.5 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Opus 4 V1 の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 200,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-29C2B0A3)  | Anthropic Claude Opus 4 V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Opus 4.1 の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 500,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-BD85BFCD)  | Anthropic Claude Opus 4.1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Opus 4.5 のクロスリージョンモデル推論トークン/分 | サポートされている各リージョン: 2,000,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7007E9C9)  | Anthropic Claude Opus 4.5 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Opus 4.6 V1 のクロスリージョンモデル推論トークン/分 | サポートされている各リージョン: 3,000,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-0AD9BBE8)  | Anthropic Claude Opus 4.6 V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Opus 4.7 のクロスリージョンモデル推論トークン/分 | サポートされている各リージョン: 30,000,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5DB28B7B)  | Anthropic Claude Opus 4.7 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Sonnet 4 V1 の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 200,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-59759B4A)  | Anthropic Claude Sonnet 4 V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Sonnet 4 V1 1M Context Length の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 1,000,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1FA095B8)  | Anthropic Claude Sonnet 4 V1 1M Context Length でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Sonnet 4.5 V1 の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 5,000,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F4DDD3EB)  | Anthropic Claude Sonnet 4.5 V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Sonnet 4.5 V1 1M Context Length の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 1,000,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8EA73537)  | Anthropic Claude Sonnet 4.5 V1 1M Context Length でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Sonnet 4.6 のクロスリージョンモデル推論トークン/分 | サポートされている各リージョン: 6,000,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-15B8E632)  | Anthropic Claude Sonnet 4.6 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Cohere Embed V4 の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 300,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4C3F0FE6)  | Cohere Embed V4 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| DeepSeek R1 V1 の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 200,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-06B03968)  | DeepSeek R1 V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Meta Llama 3.1 405B Instruct の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 800,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9913DEEF)  | Meta Llama 3.1 405B Instruct でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Meta Llama 3.1 70B Instruct の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 600,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-92E68994)  | Meta Llama 3.1 70B Instruct でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Meta Llama 3.1 8B Instruct の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 600,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9782749C)  | Meta Llama 3.1 8B Instruct でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Meta Llama 3.2 1B Instruct の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 600,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-BD9FDA6F)  | Meta Llama 3.2 1B Instruct でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Meta Llama 3.2 3B Instruct の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 600,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-0B2687F4)  | Meta Llama 3.2 3B Instruct でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のトークンの合計が考慮されます。 | 
| Meta Llama 3.3 70B Instruct の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 600,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-0E7AA8B7)  | Meta Llama 3.3 70B Instruct でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Meta Llama 4 Maverick V1 の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 600,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-DE3FBBF4)  | Meta Llama 4 Maverick V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Meta Llama 4 Scout V1 の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 600,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-532E6630)  | Meta Llama 4 Scout V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Mistral Pixtral Large 25.02 V1 の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 80,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4B9F76B0)  | Mistral Pixtral Large 25.02 V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Writer AI Palmyra X4 V1 の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 150,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FF1F238B)  | Writer AI Palmyra X4 V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Writer AI Palmyra X5 V1 の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 150,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-90DFE70F)  | Writer AI Palmyra X5 V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| アカウントあたりの作成中ステータスのカスタムモデル | サポートされている各リージョン: 2 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C02E1E99)  | 作成中ステータスのカスタムモデルの最大数。 | 
| 1 秒あたりの DeleteAgent リクエスト数 | サポートされている各リージョン: 2 | いいえ | DeleteAgent API リクエストの 1 秒あたりの最大数。 | 
| 1 秒あたりの DeleteAgentActionGroup リクエスト数 | サポートされている各リージョン: 2 | いいえ | DeleteAgentActionGroup API リクエストの 1 秒あたりの最大数。 | 
| 1 秒あたりの DeleteAgentAlias リクエスト数 | サポートされている各リージョン: 2 | いいえ | DeleteAgentAlias API リクエストの 1 秒あたりの最大数。 | 
| 1 秒あたりの DeleteAgentVersion リクエスト数 | サポートされている各リージョン: 2 | いいえ | DeleteAgentVersion API リクエストの 1 秒あたりの最大数。 | 
| 1 秒あたりの DisassociateAgentKnowledgeBase リクエスト数 | サポートされている各リージョン: 4 | いいえ | DisassociateAgentKnowledgeBase API リクエストの 1 秒あたりの最大数。 | 
| エージェントあたりの有効アクショングループ数 | サポートされている各リージョン: 15 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-14A16430)  | エージェントで有効にできるアクショングループの最大数。 | 
| 推論プロファイルあたりのエンドポイント数 | サポートされている各リージョン：5 | いいえ | 推論プロファイル内のエンドポイントの最大数。エンドポイントは、モデルと、モデルへの呼び出しリクエストの送信先のリージョンによって定義されます。 | 
| 1 秒あたりの GetAgent リクエスト数 | サポートされている各リージョン: 15 | いいえ | GetAgent API リクエストの 1 秒あたりの最大数。 | 
| 1 秒あたりの GetAgentActionGroup リクエスト数 | サポートされている各リージョン: 20 | いいえ | GetAgentActionGroup API リクエストの 1 秒あたりの最大数。 | 
| 1 秒あたりの GetAgentAlias リクエスト数 | サポートされている各リージョン: 10 | いいえ | GetAgentAlias API リクエストの 1 秒あたりの最大数。 | 
| 1 秒あたりの GetAgentKnowledgeBase リクエスト数 | サポートされている各リージョン: 15 | いいえ | GetAgentKnowledgeBase API リクエストの 1 秒あたりの最大数。 | 
| 1 秒あたりの GetAgentVersion リクエスト数 | サポートされている各リージョン: 10 | いいえ | GetAgentVersion API リクエストの 1 秒あたりの最大数。 | 
| Amazon Nova 2 Lite のグローバルクロスリージョンモデル推論リクエスト/分 | サポートされている各リージョン: 2,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D5F39C2F)  | Amazon Nova 2 Lite でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Amazon Nova 2 Omni のグローバルクロスリージョンモデル推論リクエスト/分 | サポートされている各リージョン: 2,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-DCD79770)  | Amazon Nova 2 Omni でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Amazon Nova 2 Pro Preview のグローバルクロスリージョンモデル推論リクエスト/分 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-A3425ABD)  | Amazon Nova 2 Pro Preview でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Anthropic Claude Haiku 4.5 の 1 分あたりのグローバルクロスリージョンモデル推論リクエスト数 | me-central-1: 1,000<br />他のサポートされている各リージョン: 10,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E5084BBA)  | Anthropic Claude Haiku 4.5 でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Anthropic Claude Opus 4.5 のグローバルクロスリージョンモデル推論リクエスト/分 | me-central-1: 500<br />他のサポートされている各リージョン: 10,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-58424D95)  | Anthropic Claude Opus 4.5 でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Anthropic Claude Opus 4.6 V1 のグローバルクロスリージョンモデル推論リクエスト/分 | me-central-1: 500<br />他のサポートされている各リージョン: 10,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-3DD46812)  | Anthropic Claude Opus 4.6 V1 でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Anthropic Claude Opus 4.6 V1 1M コンテキスト長に対する 1 分あたりのグローバルクロスリージョンモデル推論リクエスト | サポートされている各リージョン： 5 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-CDA5906C)  | Anthropic Claude Opus 4.6 V1 1M コンテキストの長さについて、モデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Anthropic Claude Sonnet 4 V1 の 1 分あたりのグローバルクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 200 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C63AA5DA)  | Anthropic Claude Sonnet 4 V1 でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Anthropic Claude Sonnet 4.5 V1 の 1 分あたりのグローバルクロスリージョンモデル推論リクエスト数 | me-central-1: 1,000<br />他のサポートされている各リージョン: 10,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-DB84CE56)  | Anthropic Claude Sonnet 4.5 V1 でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Anthropic Claude Sonnet 4.5 V1 1M Context Length の 1 分あたりのグローバルクロスリージョンモデル推論リクエスト数 | me-central-1: 5<br />他のサポートされている各リージョン: 1,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C0D53EFB)  | Anthropic Claude Sonnet 4.5 V1 1M Context Length でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Anthropic Claude Sonnet 4.6 のグローバルクロスリージョンモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F6E116D7)  | Anthropic Claude Sonnet 4.6 でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Anthropic Claude Sonnet 4.6 1M 万コンテキスト長に対する 1 分あたりのグローバルクロスリージョンモデル推論リクエスト | サポートされている各リージョン: 500 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B117CDDA)  | Anthropic Claude Sonnet 4.6 1M コンテキストの長さについて、モデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Cohere Embed V4 の 1 分あたりのグローバルクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 2,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7089DC7D)  | Cohere Embed V4 でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Amazon Nova 2 Lite のグローバルクロスリージョンモデル推論トークン/日 | サポートされている各リージョン: 11,520,000,000 | いいえ | Amazon Nova 2 Lite のモデル推論に 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Amazon Nova 2 Omni のグローバルクロスリージョンモデル推論トークン/日 | サポートされている各リージョン: 11,520,000,000 | いいえ | Amazon Nova 2 Omni のモデル推論に 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Amazon Nova 2 Pro Preview のグローバルクロスリージョンモデル推論トークン/日 | サポートされている各リージョン: 1,440,000,000 | いいえ | Amazon Nova 2 Pro Preview のモデル推論に 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Haiku 4.5 の 1 日あたりのグローバルクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 7,200,000,000 | いいえ | Anthropic Claude Haiku 4.5 でモデル推論のために 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Opus 4.5 のグローバルクロスリージョンモデル推論トークン | サポートされている各リージョン: 2,880,000,000 | いいえ | Anthropic Claude Opus 4.5 でモデル推論のために 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Opus 4.6 V1 のグローバルクロスリージョンモデル推論トークン/日 | me-central-1: 2,880,000,000<br />サポートされている他の各リージョン: 4,320,000,000 | いいえ | Anthropic Claude Opus 4.6 V1 でモデル推論のために 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Opus 4.6 V1 1M Context Length のグローバルクロスリージョンモデル推論トークン | サポートされている各リージョン: 1,440,000,000 | いいえ | Anthropic Claude Opus 4.6 V1 1M Context Length のモデル推論に 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Opus 4.7 のグローバルクロスリージョンモデル推論トークン | サポートされている各リージョン: 43,200,000,000 | いいえ | Anthropic Claude Opus 4.7 でモデル推論のために 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Sonnet 4 V1 の 1 日あたりのグローバルクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 288,000,000 | いいえ | Anthropic Claude Sonnet 4 V1 でモデル推論のために 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Sonnet 4.5 V1 の 1 日あたりのグローバルクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 7,200,000,000 | いいえ | Anthropic Claude Sonnet 4.5 V1 でモデル推論のために 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Sonnet 4.5 V1 1M Context Length の 1 日あたりのグローバルクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 1,440,000,000 | いいえ | Anthropic Claude Sonnet 4.5 V1 1M Context Length でモデル推論のために 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Sonnet 4.6 のグローバルクロスリージョンモデル推論トークン | me-central-1: 7,200,000,000<br />サポートされている他の各リージョン: 8,640,000,000 | いいえ | Anthropic Claude Sonnet 4.6 でモデル推論のために 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Sonnet 4.6 1M 万コンテキスト長の 1 日あたりのグローバルクロスリージョンモデル推論トークン | サポートされている各リージョン: 1,440,000,000 | いいえ | Anthropic Claude Sonnet 4.6 1M Context Length のモデル推論に 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Cohere Embed V4 の 1 日あたりのグローバルクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 432,000,000 | いいえ | Cohere Embed V4 でモデル推論のために 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Amazon Nova 2 Lite のグローバルクロスリージョンモデル推論トークン/分 | サポートされている各リージョン: 8,000,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-71C69B70)  | Amazon Nova 2 Lite のモデル推論に 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Amazon Nova 2 Omni のグローバルクロスリージョンモデル推論トークン/分 | サポートされている各リージョン: 8,000,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-21800074)  | Amazon Nova 2 Omni のモデル推論に 1 分で送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Amazon Nova 2 Pro Preview のグローバルクロスリージョンモデル推論トークン/分 | サポートされている各リージョン: 1,000,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-6B796A8E)  | Amazon Nova 2 Pro Preview でモデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Haiku 4.5 の 1 分あたりのグローバルクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 5,000,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9A11C666)  | Anthropic Claude Haiku 4.5 でモデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Opus 4.5 のグローバルクロスリージョンモデル推論トークン/分 | サポートされている各リージョン: 2,000,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-3ABF6ACC)  | Anthropic Claude Opus 4.5 でモデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Opus 4.6 V1 のグローバルクロスリージョンモデル推論トークン/分 | me-central-1: 2,000,000<br />サポートされている他の各リージョン: 3,000,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-3DCCFAA4)  | Anthropic Claude Opus 4.6 V1 でモデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Opus 4.6 V1 1M コンテキスト長のグローバルクロスリージョンモデル推論トークン/分 | サポートされている各リージョン: 1,000,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4C59C1F4)  | Anthropic Claude Opus 4.6 V1 1M コンテキストの長さについて、モデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Opus 4.7 のグローバルクロスリージョンモデル推論トークン/分 | サポートされている各リージョン: 30,000,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-34152C1D)  | Anthropic Claude Opus 4.7 でモデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Sonnet 4 V1 の 1 分あたりのグローバルクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 200,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-97E41E39)  | Anthropic Claude Sonnet 4 V1 でモデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Sonnet 4.5 V1 の 1 分あたりのグローバルクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 5,000,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-27C57EE8)  | Anthropic Claude Sonnet 4.5 V1 でモデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Sonnet 4.5 V1 1M Context Length の 1 分あたりのグローバルクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 1,000,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4B26E44A)  | Anthropic Claude Sonnet 4.5 V1 1M Context Length でモデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Sonnet 4.6 のグローバルクロスリージョンモデル推論トークン/分 | me-central-1: 5,000,000<br />サポートされている他の各リージョン: 6,000,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7BEE40FB)  | Anthropic Claude Sonnet 4.6 でモデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Sonnet 4.6 1M 万コンテキスト長のグローバルクロスリージョンモデル推論トークン/分 | サポートされている各リージョン: 1,000,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-6955C77B)  | Anthropic Claude Sonnet 4.6 1M Context Length でモデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Cohere Embed V4 の 1 分あたりのグローバルクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 300,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-02DFBB76)  | Cohere Embed V4 でモデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| アカウントあたりのインポート済みモデル数 | サポートされている各リージョン: 3 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-45B04988)  | アカウント内のインポート済みモデルの最大数。 | 
| アカウントあたりの推論プロファイル数 | サポートされている各リージョン: 1,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-40EC9882)  | アカウント内の推論プロファイルの最大数。 | 
| 1 秒あたりの ListAgentActionGroups リクエスト数 | サポートされている各リージョン: 10 | いいえ | ListAgentActionGroups API リクエストの 1 秒あたりの最大数。 | 
| 1 秒あたりの ListAgentAliases リクエスト数 | サポートされている各リージョン: 10 | いいえ | ListAgentAliases API リクエストの 1 秒あたりの最大数。 | 
| 1 秒あたりの ListAgentKnowledgeBases リクエスト数 | サポートされている各リージョン: 10 | いいえ | ListAgentKnowledgeBases API リクエストの 1 秒あたりの最大数。 | 
| 1 秒あたりの ListAgentVersions リクエスト数 | サポートされている各リージョン: 10 | いいえ | ListAgentVersions API リクエストの 1 秒あたりの最大数。 | 
| 1 秒あたりの ListAgents リクエスト数 | サポートされている各リージョン: 10 | いいえ | ListAgents API リクエストの 1 秒あたりの最大数。 | 
| Amazon Nova 2 マルチモーダル埋め込み V1 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Amazon Nova 2 マルチモーダル埋め込み V1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Amazon Nova Premier のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Amazon Nova Premier のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Claude 3 Haiku のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Claude 3 Haiku のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Claude 3 Opus のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Claude 3 Opus のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Claude 3 Sonnet のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Claude 3 Sonnet のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Claude 3.5 Haiku のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Claude 3.5 Haiku のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Claude 3.5 Sonnet のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Claude 3.5 Sonnet のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Claude 3.5 Sonnet v2 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Claude 3.5 Sonnet v2 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Claude 3.7 Sonnet のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-BFA0FE84)  | Claude 3.7 Sonnet のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Claude Haiku 4.5 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Claude Haiku 4.5 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Claude Opus 4.5 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Claude Opus 4.5 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Claude Opus 4.6 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Claude Opus 4.6 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Claude Sonnet 4 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F72F26EE)  | Claude Sonnet 4 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Claude Sonnet 4.5 のバッチ推論ジョブあたりのレコードの最小数。 | サポートされている各リージョン: 100 | いいえ | Claude Sonnet 4.5 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Claude Sonnet 4.6 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Claude Sonnet 4.6 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| DeepSeek V3.2 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | DeepSeek V3.2 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| DeepSeek v3 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | DeepSeek v3 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Devstral 2 123B のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Devstral 2 123B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| GLM 4.7 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | GLM 4.7 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| GLM 4.7 Flash のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | GLM 4.7 Flash のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| GLM 5 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | GLM 5 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Gemma 3 12B のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Gemma 3 12B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Gemma 3 27B のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Gemma 3 27B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Gemma 3 4B のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Gemma 3 4B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Kimi K2 thinking のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Kimi K2 thinking のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Kimi K2.5 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Kimi K2.5 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Llama 3.1 405B Instruct のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Llama 3.1 405B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Llama 3.1 70B Instruct のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Llama 3.1 70B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Llama 3.1 8B Instruct のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Llama 3.1 8B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Llama 3.2 11B Instruct のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Llama 3.2 11B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Llama 3.2 1B Instruct のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Llama 3.2 1B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Llama 3.2 3B Instruct のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Llama 3.2 3B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Llama 3.2 90B Instruct のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Llama 3.2 90B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Llama 3.3 70B Instruct のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Llama 3.3 70B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Llama 4 Maverick のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Llama 4 Maverick のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Llama 4 Scout のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Llama 4 Scout のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Magistral Small 2509 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Magistral Small 2509 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| MiniMax M2 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | MiniMax M2 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| MiniMax M2.1 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | MiniMax M2.1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| MiniMax M2.5 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | MiniMax M2.5 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Ministral 3 14B のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Ministral 3 14B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Ministral 3 8B のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Ministral 3 8B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Ministral 3B のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Ministral 3B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Mistral Large 2 (24.07) のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Mistral Large 2 (24.07) のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Mistral Large 3 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Mistral Large 3 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Mistral Small のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Mistral Small のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| NVIDIA Nemotron 3 Super 120B A12B のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | NVIDIA Nemotron 3 Super 120B A12B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| NVIDIA Nemotron Nano 12B のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | NVIDIA Nemotron Nano 12B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| NVIDIA Nemotron Nano 3 30B のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | NVIDIA Nemotron Nano 3 30B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| NVIDIA Nemotron Nano 9B のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | NVIDIA Nemotron Nano 9B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Nova 2 Lite のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Nova 2 Lite のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Nova Lite V1 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Nova Lite V1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Nova Micro V1 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Nova Micro V1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Nova Pro V1 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Nova Pro V1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| OpenAI GPT OSS 120b のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | OpenAI GPT OSS 120b のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| OpenAI GPT OSS 20b のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | OpenAI GPT OSS 20b のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| OpenAI GPT OSS Safeguard 120b のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | OpenAI GPT OSS Safeguard 120b のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| OpenAI GPT OSS Safeguard 20b のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | OpenAI GPT OSS Safeguard 20b のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Qwen3 235B のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Qwen3 235B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Qwen3 32B のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Qwen3 32B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Qwen3 Coder 30B のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Qwen3 Coder 30B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Qwen3 Coder 480B のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Qwen3 Coder 480B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Qwen3 Coder Next のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Qwen3 Coder Next のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Qwen3 Next 80B のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Qwen3 Next 80B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Qwen3 VL 235B のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Qwen3 VL 235B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Titan Multimodal Embeddings G1 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Titan Multimodal Embeddings G1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Titan Text Embeddings V2 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Titan Text Embeddings V2 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Voxtral Mini 3B 2507 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Voxtral Mini 3B 2507 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Voxtral Small 24B 2507 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Voxtral Small 24B 2507 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Writer Palmyra Vision 7B のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | いいえ | Writer Palmyra Vision 7B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 | 
| Amazon Nova Pro V1 の 1 日あたりのモデル呼び出しの最大レイテンシー最適化トークン | サポートされている各リージョン: 57,600,000 | いいえ | Amazon Nova Pro V1 のレイテンシー最適化モデル推論に 1 日に送信できるトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| AI21 Labs Jamba 1.5 Large の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 432,000,000 | いいえ | AI21 Labs Jamba 1.5 Large のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| AI21 Labs Jamba 1.5 Mini の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 432,000,000 | いいえ | AI21 Labs Jamba 1.5 Mini のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Amazon Nova 2 Lite の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 5,760,000,000 | いいえ | Amazon Nova 2 Lite のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Amazon Nova 2 Omni の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 5,760,000,000 | いいえ | Amazon Nova 2 Omni のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Amazon Nova 2 Pro Preview の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 720,000,000 | いいえ | Amazon Nova 2 Pro Preview のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Amazon Nova Lite の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 5,760,000,000 | いいえ | Amazon Nova Lite のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Amazon Nova Micro の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 5,760,000,000 | いいえ | Amazon Nova Micro のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Amazon Nova Premier V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 1,440,000,000 | いいえ | Amazon Nova Premier V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Amazon Nova Pro の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 1,440,000,000 | いいえ | Amazon Nova Pro のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Anthropic Claude 3 Haiku の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | us-east-1: 2,880,000,000<br />us-west-2: 2,880,000,000<br />ap-northeast-1: 288,000,000<br />ap-southeast-1: 288,000,000<br />サポートされている他の各リージョン: 432,000,000 | いいえ | Anthropic Claude 3 Haiku のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Anthropic Claude 3.5 Haiku の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 2,880,000,000 | いいえ | Anthropic Claude 3.5 Haiku のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Anthropic Claude 3.5 Sonnet V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 2,880,000,000 | いいえ | Anthropic Claude 3.5 Sonnet V1 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Anthropic Claude 3.5 Sonnet V2 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | us-east-1: 2,880,000,000<br />us-west-2: 2,880,000,000<br />サポートされている他の各リージョン: 576,000,000 | いいえ | Anthropic Claude 3.5 Sonnet V2 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Anthropic Claude 3.7 Sonnet V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 720,000,000 | いいえ | Anthropic Claude 3.7 Sonnet V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Anthropic Claude Haiku 4.5 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 3,600,000,000 | いいえ | Anthropic Claude Haiku 4.5 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Anthropic Claude Opus 4 V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000 | いいえ | Anthropic Claude Opus 4 V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Anthropic Claude Opus 4.1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 360,000,000 | いいえ | Anthropic Claude Opus 4.1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Anthropic Claude Opus 4.5 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 1,440,000,000 | いいえ | Anthropic Claude Opus 4.5 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Anthropic Claude Opus 4.6 V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 2,160,000,000 | いいえ | Anthropic Claude Opus 4.6 V1 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Anthropic Claude Opus 4.7 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 21,600,000,000 | いいえ | Anthropic Claude Opus 4.7 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Anthropic Claude Sonnet 4 V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000 | いいえ | Anthropic Claude Sonnet 4 V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Anthropic Claude Sonnet 4 V1 1M Context Length の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 720,000,000 | いいえ | Anthropic Claude Sonnet 4 V1 1M Context Length のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Anthropic Claude Sonnet 4.5 V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 3,600,000,000 | いいえ | Anthropic Claude Sonnet 4.5 V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Anthropic Claude Sonnet 4.5 V1 1M Context Length の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 720,000,000 | いいえ | Anthropic Claude Sonnet 4.5 V1 1M Context Length のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Anthropic Claude Sonnet 4.6 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 4,320,000,000 | いいえ | Anthropic Claude Sonnet 4.6 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Cohere Embed V4 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 216,000,000 | いいえ | Cohere Embed V4 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| DeepSeek R1 V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000 | いいえ | DeepSeek R1 V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| DeepSeek V3 V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | DeepSeek V3 V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| DeepSeek V3.2 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | DeepSeek V3.2 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| GPT OSS Safeguard 120B の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | GPT OSS Safeguard 120B のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| GPT OSS Safeguard 20B の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | GPT OSS Safeguard 20B のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Gemma 3 12B の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Gemma 3 12B のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Gemma 3 27B の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Gemma 3 27B のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Gemma 3 4B の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Gemma 3 4B のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Kimi K2 thinking の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Kimi K2 thinking のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Magistral Small 1.2 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Magistral Small 1.2 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Meta Llama 3.2 11B 指示の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しの場合は 2 倍) | サポートされている各リージョン: 432,000,000 | いいえ | Meta Llama 3.2 11B 指示のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Meta Llama 3.2 1B 指示の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 432,000,000 | いいえ | Meta Llama 3.2 1B インストラクションのモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Meta Llama 3.2 3B 指示の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しの場合は 2 倍) | サポートされている各リージョン: 432,000,000 | いいえ | Meta Llama 3.2 3B インストラクションのモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Meta Llama 3.2 90B 指示の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しの場合は 2 倍) | サポートされている各リージョン: 432,000,000 | いいえ | Meta Llama 3.2 90B インストラクションのモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Meta Llama 4 Maverick V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しの場合は 2 倍) | サポートされている各リージョン: 432,000,000 | いいえ | Meta Llama 4 Maverick V1 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Meta Llama 4 Scout V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 432,000,000 | いいえ | Meta Llama 4 Scout V1 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| MiniMax M2.5 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | MiniMax M2.5 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Minimax M2 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Minimax M2 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Minimax M2.1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Minimax M2.1 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Ministral 14B 3.0 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Ministral 14B 3.0 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Ministral 3B 3.0 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Ministral 3B 3.0 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Ministral 8B 3.0 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Ministral 8B 3.0 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Mistral AI Mistral 7B Instruct の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しの場合は 2 倍) | サポートされている各リージョン: 432,000,000 | いいえ | Mistral AI Mistral 7B Instruct のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Mistral AI Mistral Large の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 432,000,000 | いいえ | Mistral AI Mistral Large のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Mistral AI Mistral Small の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 432,000,000 | いいえ | Mistral AI Mistral Small のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Mistral AI Mixtral 8X7B 指示の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 432,000,000 | いいえ | Mistral AI Mixtral 8X7B インストラクションのモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Mistral Devstral 2 123b の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Mistral Devstral 2 123b のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Mistral Large 3 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Mistral Large 3 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Mistral Pixtral Large 25.02 V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 57,600,000 | いいえ | Mistral Pixtral Large 25.02 V1 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Moonshot AI Kimi K2.5 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Moonshot AI Kimi K2.5 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| NVIDIA Nemotron 3 Super 120B A12B の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しの場合は 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | NVIDIA Nemotron 3 Super 120B A12B のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| NVIDIA Nemotron Nano 2 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | NVIDIA Nemotron Nano 2 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| NVIDIA Nemotron Nano 2 VL の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | NVIDIA Nemotron Nano 2 VL のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Nemotron Nano 3 30B の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Nemotron Nano 3 30B のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| OpenAI GPT OSS 120B の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | OpenAI GPT OSS 120B のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| OpenAI GPT OSS 20B の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | OpenAI GPT OSS 20B のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Qwen3 235B a22b 2507 V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Qwen3 235B a22b 2507 V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Qwen3 32B V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Qwen3 32B V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Qwen3 Coder 30B a3b V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Qwen3 Coder 30B a3b V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Qwen3 Coder 480B a35b V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しの場合は 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Qwen3 Coder 480B a35b V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Qwen3 Coder Next の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Qwen3 Coder Next のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Qwen3 Next 80B A3B の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Qwen3 Next 80B A3B のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Qwen3 VL 235B A22B の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Qwen3 VL 235B A22B のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Voxtral Mini 1.0 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Voxtral Mini 1.0 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Voxtral Small 1.0 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Voxtral Small 1.0 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Writer AI Palmyra X4 V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 108,000,000 | いいえ | Writer AI Palmyra X4 V1 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Writer AI Palmyra X5 V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 108,000,000 | いいえ | Writer AI Palmyra X5 V1 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Writer Palmyra Vision 7B の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Writer Palmyra Vision 7B のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Z.ai GLM 5 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Z.ai GLM 5 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Z.ai GLM-4.7 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Z.ai GLM-4.7 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| Z.ai GLM-4.7 Flash の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | いいえ | Z.ai GLM-4.7 Flash のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 | 
| ベースモデル全体におけるコミットメントのないプロビジョンドスループットのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FE44174A)  | ベースモデルのコミットメントのないプロビジョンドスループットに分散できるモデルユニットの最大数 | 
| カスタムモデル全体におけるコミットメントのないプロビジョンドスループットのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-BE77399C)  | カスタムモデルのコミットメントのないプロビジョンドスループットに分散できるモデルユニットの最大数 | 
| AI21 Labs Jurassic-2 Mid のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9342B636)  | AI21 Labs Jurassic-2 Mid のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| AI21 Labs Jurassic-2 Ultra のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-3F0ECEDC)  | AI21 Labs Jurassic-2 Ultra のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Amazon Nova 2 Lite V1.0 256K のプロビジョニング済みモデルあたりのモデルユニット | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-07D3BCF0)  | Amazon Nova 2 Lite V1.0 256K のプロビジョニング済みモデルに割り当てることができるモデルユニットの最大数。 | 
| Amazon Nova Canvas のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FD4A6FF9)  | Amazon Nova Canvas のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Amazon Titan Embeddings G1 – Text のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F879F645)  | Amazon Titan Embeddings G1 – Text のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Amazon Titan Image Generator G1 のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F424A1E3)  | Amazon Titan Image Generator G1 のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Amazon Titan Image Generator G2 のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-92F8A601)  | Amazon Titan Image Generator G2 のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Amazon Titan Lite V1 4K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-A4EBFDE7)  | Amazon Titan Text Lite V1 4K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Amazon Titan Multimodal Embeddings G1 のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-32F732DE)  | Amazon Titan Multimodal Embeddings G1 のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Amazon Titan Text Embeddings V2 のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1074C53D)  | Amazon Titan Text Embeddings V2 のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Amazon Titan Text G1 – Express 8K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8129BF10)  | Amazon Titan Text G1 – Express 8K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Amazon Titan Text Premier V1 32K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5056051A)  | Amazon Titan Text Premier V1 32K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Anthropic Claude 3 Haiku 200K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-EF415EF6)  | Anthropic Claude 3 Haiku 200K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Anthropic Claude 3 Haiku 48K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-3BE61D60)  | Anthropic Claude 3 Haiku 48K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Anthropic Claude 3 Sonnet 200K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1F7657F1)  | Anthropic Claude 3 Sonnet 200K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Anthropic Claude 3 Sonnet 28K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B3C19043)  | Anthropic Claude 3 Sonnet 28K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Anthropic Claude 3.5 Haiku 16K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D3E17A13)  | Anthropic Claude 3.5 Haiku 16K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Anthropic Claude 3.5 Haiku 200K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-921A310E)  | Anthropic Claude 3.5 Haiku 200K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Anthropic Claude 3.5 Haiku 64K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-43CD2FD9)  | Anthropic Claude 3.5 Haiku 64K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Anthropic Claude 3.5 Sonnet 18K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-259C746F)  | Anthropic Claude 3.5 Sonnet 18K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Anthropic Claude 3.5 Sonnet 200K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-2590C31B)  | Anthropic Claude 3.5 Sonnet 200K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Anthropic Claude 3.5 Sonnet 51K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-208A3F5C)  | Anthropic Claude 3.5 Sonnet 51K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Anthropic Claude 3.5 Sonnet V2 18K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-02710C34)  | Anthropic Claude 3.5 Sonnet V2 18K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Anthropic Claude 3.5 Sonnet V2 200K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-24060791)  | Anthropic Claude 3.5 Sonnet V2 200K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Anthropic Claude 3.5 Sonnet V2 51K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B2718619)  | Anthropic Claude 3.5 Sonnet V2 51K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Anthropic Claude 3.7 V1.0 Sonnet 18K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D09F1612)  | Anthropic Claude 3.7 V1.0 Sonnet 18K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Anthropic Claude 3.7 V1.0 Sonnet 200K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F4131C39)  | Anthropic Claude 3.7 V1.0 Sonnet 200K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Anthropic Claude 3.7 V1.0 Sonnet 51K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-0B0CDE73)  | Anthropic Claude 3.7 V1.0 Sonnet 51K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Anthropic Claude Instant V1 100K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4A6D2F15)  | Anthropic Claude Instant V1 100K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Anthropic Claude V2 100K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C4522D0D)  | Anthropic Claude V2 100K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Anthropic Claude V2 18K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-73573F44)  | Anthropic Claude V2 18K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Anthropic Claude V2.1 18K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7478F443)  | Anthropic Claude V2.1 18K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Anthropic Claude V2.1 200K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-A63633C5)  | Anthropic Claude V2.1 200K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Cohere Command のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5E29F315)  | Cohere Command のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Cohere Command Light のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-01F37E14)  | Cohere Command Light のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Cohere Command R のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F2469446)  | Cohere Command R 128k のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Cohere Command R Plus のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C549AE85)  | Cohere Command R Plus 128k のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Cohere Embed English のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-97A8CC77)  | Cohere Embed English のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Cohere Embed Multilingual のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1870BD3C)  | Cohere Embed Multilingual のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Meta Llama 2 13B のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-268D592E)  | Meta Llama 2 13B のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Meta Llama 2 70B のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-2EBEF050)  | Meta Llama 2 70B のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Meta Llama 2 Chat 13B のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-AC6F8476)  | Meta Llama 2 Chat 13B のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Meta Llama 2 Chat 70B のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E953E4AB)  | Meta Llama 2 Chat 70B のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Meta Llama 3 70B Instruct のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B3049E9B)  | Meta Llama 3 70B Instruct のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Meta Llama 3 8B Instruct のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-16711FC4)  | Meta Llama 3 8B Instruct のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Meta Llama 3.1 70B Instruct のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-DD7903AD)  | Meta Llama 3.1 70B Instruct のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Meta Llama 3.1 8B Instruct のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-3632DE15)  | Meta Llama 3.1 8B Instruct のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Meta Llama 3.2 11B Instruct のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1679CB40)  | Meta Llama 3.2 11B Instruct のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Meta Llama 3.2 1B Instruct のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B547321D)  | Meta Llama 3.2 1B Instruct のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Meta Llama 3.2 3B Instruct のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-12E68701)  | Meta Llama 3.2 3B Instruct のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Meta Llama 3.2 90B Instruct のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-DEE3A9C7)  | Meta Llama 3.2 90B Instruct のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Mistral Large 2407 のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-697D688A)  | Mistral Large 2407 のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Mistral Small のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7A8639EE)  | Mistral Small のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Stability.ai Stable Diffusion XL 0.8 のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-240F3183)  | Stability.ai Stable Diffusion XL 0.8 のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Stability.ai Stable Diffusion XL 1.0 のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9149A536)  | Stability.ai Stable Diffusion XL 1.0 のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Amazon Nova Micro (128k コンテキスト長バリアント) のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-AC096F71)  | Amazon Nova Micro (128k コンテキスト長バリアント) のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Amazon Nova Lite (24k コンテキスト長バリアント) のプロビジョンドモデルあたりのモデルユニット数  | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4532261E)  | Amazon Nova Lite (24k コンテキスト長バリアント) のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Amazon Nova Micro (24k コンテキスト長バリアント) のプロビジョンドモデルあたりのモデルユニット数  | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E0B2EE2A)  | Amazon Nova Micro (24k コンテキスト長バリアント) のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Amazon Nova Pro (24k コンテキスト長バリアント) のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9C8C5911)  | Amazon Nova Pro (24k コンテキスト長バリアント) のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Amazon Nova Lite (300k コンテキスト長バリアント) のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-127FC9D0)  | Amazon Nova Lite (300k コンテキスト長バリアント) のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Amazon Nova Pro (300k コンテキスト長バリアント) のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E48B7984)  | Amazon Nova Pro (300k コンテキスト長バリアント) のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 | 
| Meta Llama 4 Scout 17B Instruct 10M 用に作成されたプロビジョンドスループットのコミットメント付きモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-0D70E8DA)  | Meta Llama 4 Scout 17B Instruct 10M 用に作成されたプロビジョンドスループットにコミットメント付きで割り当てることができるモデルユニットの最大数。 | 
| Meta Llama 4 Scout 17B Instruct 128K 用に作成されたプロビジョンドスループットのコミットメント付きモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D682535A)  | Meta Llama 4 Scout 17B Instruct 128K 用に作成されたプロビジョンドスループットにコミットメント付きで割り当てることができるモデルユニットの最大数。 | 
| Meta Maverick 4 Scout 17B Instruct 128K 用に作成されたプロビジョンドスループットのコミットメント付きモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7C435546)  | Meta Llama 4 Maverick 17B Instruct 128K 用に作成されたプロビジョンドスループットにコミットメント付きで割り当てることができるモデルユニットの最大数。 | 
| Meta Maverick 4 Scout 17B Instruct 1M 用に作成されたプロビジョンドスループットのコミットメント付きモデルユニット数 | サポートされている各リージョン: 0 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8574D065)  | Meta Llama 4 Maverick 17B Instruct 1M 用に作成されたプロビジョンドスループットにコミットメント付きで割り当てることができるモデルユニットの最大数。 | 
| ベースモデル Amazon Nova 2 Lite V1.0 256K 用に作成されたプロビジョンドスループットのコミットなしモデルユニット | サポートされている各リージョン: 0 | いいえ | コミットメントなしでベースモデル Amazon Nova 2 Lite V1.0 256K 用に作成されたプロビジョンドスループットに割り当てることができるモデルユニットの最大数 | 
| カスタムモデル Amazon Nova 2 Lite V1.0 256K 用に作成されたプロビジョンドスループットのコミットなしモデルユニット | サポートされている各リージョン: 0 | いいえ | カスタムモデル Amazon Nova 2 Lite V1.0 256K 用に作成されたプロビジョンドスループットに割り当てることができるモデルユニットの最大数。コミットメントなし。 | 
| アカウントあたりのカスタムプロンプトルーターの数 | サポートされている各リージョン: 500 | いいえ | 各リージョンのアカウントごとに作成できるカスタムプロンプトルーターの最大数。 | 
| Amazon Nova Pro V1 のオンデマンド、レイテンシー最適化モデル推論リクエスト/分 | サポートされている各リージョン: 10 | いいえ | Amazon Nova Pro V1 のモデル推論に 1 分間に送信できるオンデマンドのレイテンシー最適化リクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| Meta Llama 3.1 405B Instruct の 1 分あたりのレイテンシー最適化済みオンデマンドモデル推論リクエスト数 | サポートされている各リージョン: 100 | いいえ | Meta Llama 3.1 405B Instruct でモデル推論のために 1 分間に送信できるレイテンシーが最適化されたオンデマンドリクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| Meta Llama 3.1 70B Instruct の 1 分あたりのレイテンシー最適化済みオンデマンドモデル推論リクエスト数 | サポートされている各リージョン: 100 | いいえ | Meta Llama 3.1 70B Instruct でモデル推論のために 1 分間に送信できるレイテンシーが最適化されたオンデマンドリクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| Amazon Nova Pro V1 のオンデマンド、レイテンシー最適化モデル推論トークン/分 | サポートされている各リージョン: 40,000 | いいえ | Amazon Nova Pro V1 のモデル推論に 1 分で送信できるオンデマンドのレイテンシー最適化トークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Meta Llama 3.1 405B Instruct の 1 分あたりのレイテンシー最適化済みオンデマンドモデル推論トークン数 | サポートされている各リージョン: 40,000 | いいえ | Meta Llama 3.1 405B Instruct でモデル推論のために 1 分間に送信できるレイテンシーが最適化されたオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Meta Llama 3.1 70B Instruct の 1 分あたりのレイテンシー最適化済みオンデマンドモデル推論トークン数 | サポートされている各リージョン: 40,000 | いいえ | Meta Llama 3.1 70B Instruct でモデル推論のために 1 分間に送信できるレイテンシーが最適化されたオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Amazon Nova 2 Multimodal Embeddings V1 のオンデマンドの InvokeModel 非同期同時リクエスト数 | サポートされている各リージョン: 30 | いいえ | Amazon Nova 2 Multimodal Embeddings V1 で送信できる非同期の同時モデル推論リクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| TwelveLabs Marengo Embed 3.0 のオンデマンド InvokeModel 非同期同時リクエスト | サポートされている各リージョン: 10 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-BC3096B9)  | TwelveLabs Marengo Embed 3.0 に送信できる非同期同時モデル推論リクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| Amazon Nova 2 Sonic のオンデマンド InvokeModel 同時リクエスト | サポートされている各リージョン: 20 | いいえ | Amazon Nova 2 Sonic に送信できる同時モデル推論リクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| Amazon Nova Reel1.0 のオンデマンドの InvokeModel 同時リクエスト数 | サポートされている各リージョン: 10 | いいえ | Amazon Nova Reel 1.0 で送信できる同時モデル推論リクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| Amazon Nova Reel1.1 のオンデマンドの InvokeModel 同時リクエスト数 | サポートされている各リージョン: 3 | いいえ | Amazon Nova Reel 1.1 で送信できる同時モデル推論リクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| Amazon Nova Sonic のオンデマンドの InvokeModel 同時リクエスト数 | サポートされている各リージョン: 20 | いいえ | Amazon Nova Sonic でモデル推論のために送信できる同時リクエストの最大数。 | 
| Twelve Labs Marengo のオンデマンドの InvokeModel 同時リクエスト数 | サポートされている各リージョン: 30 | いいえ | Twelve Labs Marengo でモデル推論のために送信できる InvokeModel の同時リクエストの最大数。 | 
| Twelve Labs Pegasus のオンデマンドの InvokeModel 同時リクエスト数 | サポートされている各リージョン: 30 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-CABD464E)  | Twelve Labs Pegasus でモデル推論のために送信できる InvokeModel の同時リクエストの最大数。 | 
| Anthropic Claude 3.5 Haiku の 1 分あたりのレイテンシー最適化済みオンデマンドモデル推論リクエスト数 | サポートされている各リージョン: 100 | いいえ | 1 分間にモデル推論を呼び出すことができる最大回数。レイテンシーの最適化が設定されている場合、クォータには Anthropic Claude 3.5 Haiku の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| Anthropic Claude 3.5 Haiku の 1 分あたりのレイテンシー最適化済みオンデマンドモデル推論トークン数 | サポートされている各リージョン: 500,000 | いいえ | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。レイテンシーの最適化が設定されている場合、クォータには Anthropic Claude 3.5 Haiku の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Luma Ray V2 のオンデマンドのモデル推論同時リクエスト数 | サポートされている各リージョン: 1 | [いいえ] | Luma Ray V2 でモデル推論のために送信できる同時リクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| AI21 Labs Jamba 1.5 Large の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 100 | いいえ | AI21 Labs Jamba 1.5 Large で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Converse と InvokeModel のリクエストの合計が考慮されます。 | 
| AI21 Labs Jamba 1.5 Mini の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 100 | いいえ | AI21 Labs Jamba 1.5 Mini で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Converse と InvokeModel のリクエストの合計が考慮されます。 | 
| Amazon Nova 2 Multimodal Embeddings V1 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 2,000 | いいえ | Amazon Nova 2 Multimodal Embeddings V1 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Amazon Nova Canvas の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 100 | いいえ | Amazon Nova Canvas でモデル推論のために 1 分間に送信できるリクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| Amazon Nova Lite の 1 分あたりのオンデマンドのモデル推論リクエスト数 | us-east-1: 2,000<br />eu-west-2: 2,000<br />他のサポートされている各リージョン: 200 | いいえ | Amazon Nova Lite でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Amazon Nova Micro の 1 分あたりのオンデマンドのモデル推論リクエスト数 | us-east-1: 2,000<br />eu-west-2: 2,000<br />他のサポートされている各リージョン: 200 | いいえ | Amazon Nova Micro でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Amazon Nova Pro の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 250 | いいえ | Amazon Nova Pro でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Amazon Rerank 1.0 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 200 | いいえ | Amazon Rerank 1.0 で 1 分間に InvokeModel を呼び出すことができる最大回数。 | 
| Amazon Titan Image Generator G1 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 60 | いいえ | Amazon Titan Image Generator G1 で 1 分間に InvokeModel を呼び出すことができる最大回数。 | 
| Amazon Titan Image Generator G1 V2 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 60 | いいえ | Amazon Titan Image Generator G1 V2 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Amazon Titan Multimodal Embeddings G1 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 2,000 | いいえ | Amazon Titan Multimodal Embeddings G1 で 1 分間に InvokeModel を呼び出すことができる最大回数。 | 
| Amazon Titan Text Embeddings の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 2,000 | いいえ | Amazon Titan Text Embeddings で 1 分間に InvokeModel を呼び出すことができる最大回数。 | 
| Amazon Titan Text Embeddings V2 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 6,000 | いいえ | Amazon Titan Text Embeddings V2 で 1 分間に InvokeModel を呼び出すことができる最大回数。 | 
| Amazon Titan Text Express の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | いいえ | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Amazon Titan Text Express の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| Amazon Titan Text Premier の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 100 | いいえ | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Amazon Titan Text Premier の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| Anthropic Claude 3 Haiku の 1 分あたりのオンデマンドのモデル推論リクエスト数 | us-east-1: 1,000<br />us-west-2: 1,000<br />ap-northeast-1: 200<br />ap-southeast-1: 200<br />サポートされている他の各リージョン: 400 | いいえ | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Anthropic Claude 3 Haiku の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| Anthropic Claude 3 Opus の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 50 | いいえ | Anthropic Claude 3 Opus でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Anthropic Claude 3 Sonnet の 1 分あたりのオンデマンドのモデル推論リクエスト数 | us-east-1: 500<br />us-west-2: 500<br />他のサポートされている各リージョン: 100 | いいえ | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Anthropic Claude 3 Sonnet の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| Anthropic Claude 3.5 Haiku の 1 分あたりのオンデマンドのモデル推論リクエスト数 | us-west-1: 400<br />他のサポートされている各リージョン: 1,000 | いいえ | Anthropic Claude 3.5 Haiku でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Anthropic Claude 3.5 Sonnet の 1 分あたりのオンデマンドのモデル推論リクエスト数 | us-west-2: 250<br />ap-northeast-1: 20<br />ap-southeast-1: 20<br />eu-central-1: 20<br />eu-west-1: 20<br />eu-west-3: 20<br />他のサポートされている各リージョン: 50 | いいえ | Anthropic Claude 3.5 Sonnet で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| Anthropic Claude 3.5 Sonnet V2 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | us-west-2: 250<br />他のサポートされている各リージョン: 50 | いいえ | Anthropic Claude 3.5 Sonnet V2 で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| Anthropic Claude 3.7 Sonnet V1 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 125 | いいえ | Anthropic Claude 3.7 Sonnet V1 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Anthropic Claude Opus 4.6 V1 のオンデマンドモデル推論リクエスト/分 | サポートされている各リージョン: 5,000 | いいえ | Anthropic Claude Opus 4.6 V1 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Anthropic Claude Sonnet 4.6 のオンデマンドモデル推論リクエスト/分 | サポートされている各リージョン: 5,000 | いいえ | Anthropic Claude Sonnet 4.6 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Cohere Command R の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | いいえ | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Cohere Command R 128k の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| Cohere Command R Plus の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | いいえ | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Cohere Command R Plus 128k の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| Cohere Embed English の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 2,000 | いいえ | Cohere Embed English で 1 分間に InvokeModel を呼び出すことができる最大回数。 | 
| Cohere Embed Multilingual の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 2,000 | いいえ | Cohere Embed Multilingual で 1 分間に InvokeModel を呼び出すことができる最大回数。 | 
| Cohere Embed V4 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 1,000 | いいえ | Cohere Embed V4 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Cohere Rerank 3.5 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 250 | いいえ | Cohere Rerank 3.5 で 1 分間に InvokeModel を呼び出すことができる最大回数。 | 
| DeepSeek V3 V1 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10,000 | いいえ | DeepSeek V3 V1 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| DeepSeek V3.2 のオンデマンドモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 | いいえ | DeepSeek V3.2 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| GPT OSS Safeguard 120B のオンデマンドモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 | いいえ | GPT OSS Safeguard 120B のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| GPT OSS Safeguard 20B のオンデマンドモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 | いいえ | GPT OSS Safeguard 20B のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Gemma 3 12B のオンデマンドモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 | いいえ | Gemma 3 12B のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Gemma 3 27B のオンデマンドモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 | いいえ | Gemma 3 27B のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Gemma 3 4B のオンデマンドモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 | いいえ | Gemma 3 4B のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Kimi K2 thinking の 1 分あたりのオンデマンドモデル推論リクエスト | サポートされている各リージョン: 10,000 | いいえ | Kimi K2 Thinking でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Magistral Small 1.2 のオンデマンドモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 | いいえ | Magistral Small 1.2 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Meta Llama 3 70B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | いいえ | Meta Llama 3 70B Instruct でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Meta Llama 3 8B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 800 | いいえ | Meta Llama 3 8B Instruct でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Meta Llama 3.1 405B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 200 | いいえ | Meta Llama 3.1 405B Instruct でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Meta Llama 3.1 70B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | いいえ | Meta Llama 3.1 70B Instruct でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Meta Llama 3.1 8B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 800 | いいえ | Meta Llama 3.1 8B Instruct でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Meta Llama 3.2 11B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | いいえ | Meta Llama 3.2 11B Instruct で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のリクエストの合計が考慮されます。 | 
| Meta Llama 3.2 1B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 800 | いいえ | Meta Llama 3.2 1B Instruct でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Meta Llama 3.2 3B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 800 | いいえ | Meta Llama 3.2 3B Instruct で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のリクエストの合計が考慮されます。 | 
| Meta Llama 3.2 90B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | いいえ | Meta Llama 3.2 90B Instruct で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のリクエストの合計が考慮されます。 | 
| Meta Llama 3.3 70B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | いいえ | Meta Llama 3.3 70B Instruct でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| MiniMax M2.5 の 1 分あたりのオンデマンドモデル推論リクエスト | サポートされている各リージョン: 10,000 | いいえ | MiniMax M2.5 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Minimax M2 の 1 分あたりのオンデマンドモデル推論リクエスト | サポートされている各リージョン: 10,000 | いいえ | Minimax M2 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Minimax M2.1 の 1 分あたりのオンデマンドモデル推論リクエスト | サポートされている各リージョン: 10,000 | いいえ | Minimax M2.1 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Ministral 14B 3.0 のオンデマンドモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 | いいえ | Ministral 14B 3.0 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Ministral 3B 3.0 のオンデマンドモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 | いいえ | Ministral 3B 3.0 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Ministral 8B 3.0 のオンデマンドモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 | いいえ | Ministral 8B 3.0 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Mistral 7B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 800 | いいえ | Mistral mistral-7b-instruct-v0 で 1 分間に InvokeModel を呼び出すことができる最大回数。 | 
| Mistral AI Mistral Small の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | いいえ | Mistral AI Mistral Small で 1 分間に InvokeModel と InvokeModelWithResponseStream を呼び出すことができる最大回数。 | 
| Mistral Devstral 2 123b のオンデマンドモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 | いいえ | Mistral Devstral 2 123b でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Mistral Large の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | いいえ | Mistral mistral-large-2402-v1 で 1 分間に InvokeModel と InvokeModelWithResponseStream を呼び出すことができる最大回数。 | 
| Mistral Large 2407 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | いいえ | Mistral Large 2407 で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のリクエストの合計が考慮されます。 | 
| Mistral Large 3 のオンデマンドモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 | いいえ | Mistral Large 3 のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Mistral Mixtral 8x7b Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | いいえ | Mistral mixtral-8x7b-v0 で 1 分間に InvokeModel を呼び出すことができる最大回数。 | 
| Moonshot AI Kimi K2.5 のオンデマンドモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 | いいえ | Moonshot AI Kimi K2.5 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| NVIDIA Nemotron 3 Super 120B A12B のオンデマンドモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 | いいえ | NVIDIA Nemotron 3 Super 120B A12B のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| NVIDIA Nemotron Nano 2 のオンデマンドモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 | いいえ | NVIDIA Nemotron Nano 2 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| NVIDIA Nemotron Nano 2 VL のオンデマンドモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 | いいえ | NVIDIA Nemotron Nano 2 VL のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Nemotron Nano 3 30B のオンデマンドモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 | いいえ | Nemotron Nano 3 30B のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| OpenAI GPT OSS 120B の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10,000 | いいえ | OpenAI GPT OSS 120B でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| OpenAI GPT OSS 20B の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10,000 | いいえ | OpenAI GPT OSS 20B でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Qwen3 235B a22b 2507 V1 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10,000 | いいえ | Qwen3 235B a22b 2507 V1 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Qwen3 32B V1 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10,000 | いいえ | Qwen3 32B V1 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Qwen3 Coder 30B a3b V1 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10,000 | いいえ | Qwen3 Coder 30B a3b V1 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Qwen3 Coder 480B a35b V1 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10,000 | いいえ | Qwen3 Coder 480B a35b V1 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Qwen3 Coder Next の 1 分あたりのオンデマンドモデル推論リクエスト | サポートされている各リージョン: 10,000 | いいえ | Qwen3 Coder Next のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Qwen3 Next 80B A3B のオンデマンドモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 | いいえ | Qwen3 Next 80B A3B のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Qwen3 VL 235B A22B のオンデマンドモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 | いいえ | Qwen3 VL 235B A22B のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Stability.ai Stable Diffusion 3 Large の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 15 | いいえ | Stability.ai Stable Diffusion 3 Large で 1 分間に InvokeModel を呼び出すことができる最大回数。 | 
| Stability.ai Stable Diffusion 3 Medium の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 60 | いいえ | Stability.ai Stable Diffusion 3 Medium で 1 分間に InvokeModel を呼び出すことができる最大回数。 | 
| Stability.ai Stable Diffusion 3.5 Large の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 15 | いいえ | Stability.ai Stable Diffusion 3.5 Large で 1 分間に InvokeModel を呼び出すことができる最大回数。 | 
| Stability.ai Stable Image Core の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 90 | いいえ | Stability.ai Stable Image Core で 1 分間に InvokeModel を呼び出すことができる最大回数。 | 
| Stability.ai Stable Image Ultra の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10 | いいえ | Stability.ai Stable Image Ultra で 1 分間に InvokeModel を呼び出すことができる最大回数。 | 
| Stable Image Conservative Upscale の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 2 | いいえ | Stable Image Conservative Upscale でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Stable Image Control Sketch の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10 | いいえ | Stable Image Control Sketch でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Stable Image Control Structure の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10 | いいえ | Stable Image Control Structure でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Stable Image Creative Upscale の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 2 | いいえ | Stable Image Creative Upscale でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Stable Image Erase Object の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10 | いいえ | Stable Image Erase Object でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Stable Image Fast Upscale の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10 | いいえ | Stable Image Fast Upscale でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Stable Image Inpaint の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10 | いいえ | Stable Image Inpaint でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Stable Image Outpaint の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 2 | いいえ | Stable Image Outpaint でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Stable Image Remove Background の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10 | いいえ | Stable Image Remove Background でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Stable Image Search and Recolor の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10 | いいえ | Stable Image Search and Recolor でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Stable Image Search and Replace の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10 | いいえ | Stable Image Search and Replace でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Stable Image Style Guide の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10 | いいえ | Stable Image Style Guide でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Stable Image Style Transfer の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10 | いいえ | Stable Image Style Transfer でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Twelve Labs Marengo の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 100 | いいえ | Twelve Labs Marengo でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Twelve Labs Pegasus の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 60 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5E8692C5)  | Twelve Labs Pegasus でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| TwelveLabs Marengo Embed 3.0 のオンデマンドモデル推論リクエスト/分 | サポートされている各リージョン: 500 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8CBCC2C0)  | TwelveLabs Marengo Embed 3.0 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Voxtral Mini 1.0 のオンデマンドモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 | いいえ | Voxtral Mini 1.0 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Voxtral Small 1.0 のオンデマンドモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 | いいえ | Voxtral Small 1.0 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Writer Palmyra Vision 7B のオンデマンドモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 | いいえ | Writer Palmyra Vision 7B のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Z.ai GLM 5 の 1 分あたりのオンデマンドモデル推論リクエスト | サポートされている各リージョン: 10,000 | いいえ | Z.ai GLM 5 のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Z.ai GLM-4.7 の 1 分あたりのオンデマンドモデル推論リクエスト | サポートされている各リージョン: 10,000 | いいえ | Z.ai GLM-4.7 のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| Z.ai GLM-4.7 Flash のオンデマンドモデル推論リクエスト/分 | サポートされている各リージョン: 10,000 | いいえ | Z.ai GLM-4.7 Flash でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 | 
| AI21 Labs Jamba 1.5 Large の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | いいえ | AI21 Labs Jamba 1.5 Large でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、Converse と InvokeModel へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| AI21 Labs Jamba 1.5 Mini の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | いいえ | AI21 Labs Jamba 1.5 Mini でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、Converse と InvokeModel へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Amazon Nova Lite の 1 分あたりのオンデマンドモデル推論トークン数 | us-east-1: 4,000,000<br />eu-west-2: 4,000,000<br />サポートされている他の各リージョン: 200,000 | いいえ | Amazon Nova Lite でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Amazon Nova Micro の 1 分あたりのオンデマンドモデル推論トークン数 | us-east-1: 4,000,000<br />eu-west-2: 4,000,000<br />サポートされている他の各リージョン: 200,000 | いいえ | Amazon Nova Micro でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Amazon Nova Pro の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 1,000,000 | いいえ | Amazon Nova Pro でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Amazon Titan Image Generator G1 V2 の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 2,000 | いいえ | Amazon Titan Image Generator G1 V2 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Amazon Titan Multimodal Embeddings G1 の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | いいえ | Amazon Titan Multimodal Embeddings G1 で 1 分間に InvokeModel を通じて提供できるトークンの最大数。 | 
| Amazon Titan Text Embeddings の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | いいえ | Amazon Titan Text Embeddings で 1 分間に InvokeModel を通じて提供できるトークンの最大数。 | 
| Amazon Titan Text Embeddings V2 の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | いいえ | Amazon Titan Text Embeddings V2 で 1 分間に InvokeModel を通じて提供できるトークンの最大数。 | 
| Amazon Titan Text Express の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | いいえ | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Amazon Titan Text Express の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Amazon Titan Text Premier の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | いいえ | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Amazon Titan Text Premier の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude 3 Haiku の 1 分あたりのオンデマンドモデル推論トークン数 | us-east-1: 2,000,000<br />us-west-2: 2,000,000<br />ap-northeast-1: 200,000<br />ap-southeast-1: 200,000<br />サポートされている他の各リージョン: 300,000 | いいえ | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Anthropic Claude 3 Haiku の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude 3 Opus の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 400,000 | いいえ | Anthropic Claude 3 Opus でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude 3 Sonnet の 1 分あたりのオンデマンドモデル推論トークン数 | us-east-1: 1,000,000<br />us-west-2: 1,000,000<br />サポートされている他の各リージョン: 200,000 | いいえ | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Anthropic Claude 3 Sonnet の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude 3.5 Haiku の 1 分あたりのオンデマンドモデル推論トークン数 | us-west-1: 300,000<br />サポートされている他の各リージョン: 2,000,000 | いいえ | Anthropic Claude 3.5 Haiku でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude 3.5 Sonnet の 1 分あたりのオンデマンドモデル推論トークン数 | us-west-2: 2,000,000<br />ap-northeast-1: 200,000<br />ap-southeast-1: 200,000<br />eu-central-1: 200,000<br />eu-west-1: 200,000<br />eu-west-3: 200,000<br />サポートされている他の各リージョン: 400,000 | いいえ | Anthropic Claude 3.5 Sonnet でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| Anthropic Claude 3.5 Sonnet V2 の 1 分あたりのオンデマンドモデル推論トークン数 | us-west-2: 2,000,000<br />サポートされている他の各リージョン: 400,000 | いいえ | Anthropic Claude 3.5 Sonnet V2 でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 | 
| Anthropic Claude 3.7 Sonnet V1 の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 500,000 | いいえ | Anthropic Claude 3.7 Sonnet V1 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Opus 4.6 V1 のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 1,500,000 | いいえ | Anthropic Claude Opus 4.6 V1 のモデル推論に 1 分で送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Anthropic Claude Sonnet 4.6 のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 3,000,000 | いいえ | Anthropic Claude Sonnet 4.6 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Cohere Command R の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | いいえ | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Cohere Command R 128k の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Cohere Command R Plus の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | いいえ | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Cohere Command R Plus 128k の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Cohere Embed English の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | いいえ | Cohere Embed English で 1 分間に InvokeModel を通じて提供できるトークンの最大数。 | 
| Cohere Embed Multilingual の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | いいえ | Cohere Embed Multilingual で 1 分間に InvokeModel を通じて提供できるトークンの最大数。 | 
| Cohere Embed V4 の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 150,000 | いいえ | Cohere Embed V4 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| DeepSeek V3 V1 の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 100,000,000 | いいえ | DeepSeek V3 V1 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| DeepSeek V3.2 のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | DeepSeek V3.2 のモデル推論に 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| GPT OSS Safeguard 120B のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | GPT OSS Safeguard 120B のモデル推論に 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| GPT OSS Safeguard 20B のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | GPT OSS Safeguard 20B のモデル推論に 1 分で送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Gemma 3 12B のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | Gemma 3 12B のモデル推論に 1 分で送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Gemma 3 27B のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | Gemma 3 27B のモデル推論に 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Gemma 3 4B のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | Gemma 3 4B のモデル推論に 1 分で送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Kimi K2 thinking のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | Kimi K2 thinking のモデル推論に 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Magistral Small 1.2 のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | Magistral Small 1.2 のモデル推論に 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Meta Llama 3 70B Instruct の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | いいえ | Meta Llama 3 70B Instruct でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Meta Llama 3 8B Instruct の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | いいえ | Meta Llama 3 8B Instruct でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Meta Llama 3.1 405B Instruct の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 400,000 | いいえ | Meta Llama 3.1 405B Instruct でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Meta Llama 3.1 70B Instruct の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | いいえ | Meta Llama 3.1 70B Instruct でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Meta Llama 3.1 8B Instruct の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | いいえ | Meta Llama 3.1 8B Instruct でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Meta Llama 3.2 11B Instruct の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | いいえ | Meta Llama 3.2 11B Instruct でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のトークンの合計が考慮されます。 | 
| Meta Llama 3.2 1B Instruct の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | いいえ | Meta Llama 3.2 1B Instruct でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Meta Llama 3.2 3B Instruct の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | いいえ | Meta Llama 3.2 3B Instruct でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のトークンの合計が考慮されます。 | 
| Meta Llama 3.2 90B Instruct の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | いいえ | Meta Llama 3.2 90B Instruct でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のトークンの合計が考慮されます。 | 
| Meta Llama 3.3 70B Instruct の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | いいえ | Meta Llama 3.3 70B Instruct でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| MiniMax M2.5 のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | MiniMax M2.5 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Minimax M2 のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | Minimax M2 のモデル推論に 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Minimax M2.1 のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | Minimax M2.1 のモデル推論に 1 分で送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Ministral 14B 3.0 のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | Ministral 14B 3.0 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Ministral 3B 3.0 のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | Ministral 3B 3.0 でモデル推論に 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Ministral 8B 3.0 のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | Ministral 8B 3.0 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Mistral AI Mistral 7B Instruct の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | いいえ | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Mistral AI Mistral 7B Instruct の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Mistral AI Mistral Large の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | いいえ | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Mistral AI Mistral Large の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Mistral AI Mistral Small の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | いいえ | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Mistral AI Mistral Small の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Mistral AI Mixtral 8X7BB Instruct の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | いいえ | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Mistral AI Mixtral 8X7B Instruct の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Mistral Devstral 2 123b のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | Mistral Devstral 2 123b のモデル推論に 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Mistral Large 2407 の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | いいえ | Mistral Large 2407 でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のトークンの合計が考慮されます。 | 
| Mistral Large 3 のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | Mistral Large 3 のモデル推論に 1 分で送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Moonshot AI Kimi K2.5 のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | Moonshot AI Kimi K2.5 のモデル推論に 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| NVIDIA Nemotron 3 Super 120B A12B のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | NVIDIA Nemotron 3 Super 120B A12B のモデル推論に 1 分で送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| NVIDIA Nemotron Nano 2 のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | NVIDIA Nemotron Nano 2 のモデル推論に 1 分で送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| NVIDIA Nemotron Nano 2 VL のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | NVIDIA Nemotron Nano 2 VL のモデル推論に 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Nemotron Nano 3 30B のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | Nemotron Nano 3 30B のモデル推論に 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| OpenAI GPT OSS 120B の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 100,000,000 | いいえ | OpenAI GPT OSS 120B でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| OpenAI GPT OSS 20B の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 100,000,000 | いいえ | OpenAI GPT OSS 20B でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Qwen3 235B a22b 2507 V1 の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 100,000,000 | いいえ | Qwen3 235B a22b 2507 V1 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Qwen3 32B V1 の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 100,000,000 | いいえ | Qwen3 32B V1 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Qwen3 Coder 30B a3b V1 の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 100,000,000 | いいえ | Qwen3 Coder 30B a3b V1 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Qwen3 Coder 480B a35b V1 の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 100,000,000 | いいえ | Qwen3 Coder 480B a35b V1 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Qwen3 Coder Next のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | Qwen3 Coder Next のモデル推論に 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Qwen3 Next 80B A3B のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | Qwen3 Next 80B A3B のモデル推論に 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Qwen3 VL 235B A22B のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | Qwen3 VL 235B A22B のモデル推論に 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Voxtral Mini 1.0 のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | Voxtral Mini 1.0 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Voxtral Small 1.0 のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | Voxtral Small 1.0 のモデル推論に 1 分で送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Writer Palmyra Vision 7B のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | Writer Palmyra Vision 7B のモデル推論に 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Z.ai GLM 5 のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | Z.ai GLM 5 のモデル推論に 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Z.ai GLM-4.7 のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | Z.ai GLM-4.7 のモデル推論に 1 分で送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| Z.ai GLM-4.7 Flash のオンデマンドモデル推論トークン/分 | サポートされている各リージョン: 100,000,000 | いいえ | Z.ai GLM-4.7 Flash のモデル推論に 1 分で送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 | 
| 関数ごとのパラメータ数 | サポートされている各リージョン： 5 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4B4330A0)  | アクショングループ関数に含めることができるパラメータの最大数。 | 
| 1 秒あたりの PrepareAgent リクエスト数 | サポートされている各リージョン: 2 | いいえ | PrepareAgent API リクエストの 1 秒あたりの最大数。 | 
| Amazon Nova 2 マルチモーダル埋め込み V1 のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7DCA4380)  | Amazon Nova 2 マルチモーダル埋め込み V1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Amazon Nova Premier のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-131D4EED)  | Amazon Nova Premier のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Claude 3 Haiku のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1F644C2A)  | Claude 3 Haiku のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Claude 3 Opus のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E8FA49DB)  | Claude 3 Opus のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Claude 3 Sonnet のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-16E25672)  | Claude 3 Sonnet のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Claude 3.5 Haiku のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-274AA31F)  | Claude 3.5 Haiku のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Claude 3.5 Sonnet のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1E2B9998)  | Claude 3.5 Sonnet のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Claude 3.5 Sonnet v2 のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-6EBFEB27)  | Claude 3.5 Sonnet v2 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Claude 3.7 Sonnet のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FABEE48F)  | Claude 3.7 Sonnet のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Claude Haiku 4.5 のバッチ推論ジョブあたりのレコード | me-central-1: 50,000<br />他のサポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-28612175)  | Claude Haiku 4.5 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Claude Opus 4.5 のバッチ推論ジョブあたりのレコード | me-central-1: 50,000<br />他のサポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-2767B9A9)  | Claude Opus 4.5 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Claude Opus 4.6 のバッチ推論ジョブあたりのレコード | me-central-1: 50,000<br />他のサポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9AA02BEF)  | Claude Opus 4.6 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Claude Sonnet 4 のバッチ推論ジョブあたりのレコード数 | me-central-1: 50,000<br />他のサポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8A6B31EE)  | Claude Sonnet 4 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Claude Sonnet 4.5 のバッチ推論ジョブあたりのレコード | me-central-1: 50,000<br />他のサポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FFFEDD8D)  | Claude Sonnet 4.5 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Claude Sonnet 4.6 のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-01A2DC4B)  | Claude Sonnet 4.6 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| DeepSeek V3.2 のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-73951D97)  | DeepSeek V3.2 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| DeepSeek v3 のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-35900968)  | DeepSeek v3 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Devstral 2 123B のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-11C1CE94)  | Devstral 2 123B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| GLM 4.7 のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-ECA45411)  | GLM 4.7 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| GLM 4.7 Flash のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-BB255931)  | GLM 4.7 Flash のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| GLM 5 のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-64CF3679)  | GLM 5 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Gemma 3 12B のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5A51050A)  | Gemma 3 12B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Gemma 3 27B のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-ECD87E6C)  | Gemma 3 27B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Gemma 3 4B のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E1D21B18)  | Gemma 3 4B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Kimi K2 thinking のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-CEEE0EE8)  | Kimi K2 thinking のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Kimi K2.5 のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-63010E1B)  | Kimi K2.5 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Llama 3.1 405B Instruct のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-AA411D03)  | Llama 3.1 405B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Llama 3.1 70B Instruct のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8D07E980)  | Llama 3.1 70B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Llama 3.1 8B Instruct のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FA06C205)  | Llama 3.1 8B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Llama 3.2 11B Instruct のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-95CACD43)  | Llama 3.2 11B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Llama 3.2 1B Instruct のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FF73AE42)  | Llama 3.2 1B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Llama 3.2 3B Instruct のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-982DE2DB)  | Llama 3.2 3B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Llama 3.2 90B Instruct のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4821684D)  | Llama 3.2 90B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Llama 3.3 70B Instruct のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E293C7C7)  | Llama 3.3 70B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Llama 4 Maverick のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-6FAB43BE)  | Llama 4 Maverick のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Llama 4 Scout のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D41E62E4)  | Llama 4 Scout のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Magistral Small 2509 のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-78C12D54)  | Magistral Small 2509 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| MiniMax M2 のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-CDF99FD2)  | MiniMax M2 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| MiniMax M2.1 のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4D2272DC)  | MiniMax M2.1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| MiniMax M2.5 のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C4659D61)  | MiniMax M2.5 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Ministral 3 14B のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-DBFC8DC8)  | Ministral 3 14B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Ministral 3 8B のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1F923A43)  | Ministral 3 8B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Ministral 3B のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1AD2F2A2)  | Ministral 3B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Mistral Large 2 (24.07) のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-CA80888F)  | Mistral Large 2 (24.07) のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Mistral Large 3 のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-90807536)  | Mistral Large 3 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Mistral Small のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-072E11FC)  | Mistral Small のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| NVIDIA Nemotron 3 Super 120B A12B のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-196A63C0)  | NVIDIA Nemotron 3 Super 120B A12B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| NVIDIA Nemotron Nano 12B のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-214BEB81)  | NVIDIA Nemotron Nano 12B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| NVIDIA Nemotron Nano 3 30B のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-87934C8F)  | NVIDIA Nemotron Nano 3 30B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| NVIDIA Nemotron Nano 9B のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5325EC5D)  | NVIDIA Nemotron Nano 9B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Nova 2 Lite のバッチ推論ジョブあたりのレコード | me-central-1: 50,000<br />他のサポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-ECCE76C6)  | Nova 2 Lite のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Nova Lite V1 のバッチ推論ジョブあたりのレコード数 | me-central-1: 50,000<br />他のサポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-916C9264)  | Nova Lite V1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Nova Micro V1 のバッチ推論ジョブあたりのレコード数 | me-central-1: 50,000<br />他のサポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-57DC56A1)  | Nova Micro V1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Nova Pro V1 のバッチ推論ジョブあたりのレコード数 | me-central-1: 50,000<br />他のサポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-89197AE6)  | Nova Pro V1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| OpenAI GPT OSS 120b のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-3C5D1B25)  | OpenAI GPT OSS 120b のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| OpenAI GPT OSS 20b のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F361DF0F)  | OpenAI GPT OSS 20b のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| OpenAI GPT OSS Safeguard 120b のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1D2360E7)  | OpenAI GPT OSS Safeguard 120b のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| OpenAI GPT OSS Safeguard 20b のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-142AED8F)  | OpenAI GPT OSS Safeguard 20b のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Qwen3 235B のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C19807B8)  | Qwen3 235B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Qwen3 32B のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-DF5FF3C8)  | Qwen3 32B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Qwen3 Coder 30B のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-38EFD889)  | Qwen3 Coder 30B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Qwen3 Coder 480B のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-BF9B3702)  | Qwen3 Coder 480B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Qwen3 Coder Next のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-273728E2)  | Qwen3 Coder Next のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Qwen3 Next 80B のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-320BE465)  | Qwen3 Next 80B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Qwen3 VL 235B のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1F7ACACC)  | Qwen3 VL 235B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Titan Multimodal Embeddings G1 のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-3BD2251E)  | Titan Multimodal Embeddings G1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Titan Text Embeddings V2 のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-AAC5F6D6)  | Titan Text Embeddings V2 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Voxtral Mini 3B 2507 のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-CD4E1CD6)  | Voxtral Mini 3B 2507 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Voxtral Small 24B 2507 のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FE086D36)  | Voxtral Small 24B 2507 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Writer Palmyra Vision 7B のバッチ推論ジョブあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-121F4E1E)  | Writer Palmyra Vision 7B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 | 
| Amazon Nova 2 マルチモーダル埋め込み V1 のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7EAC9E78)  | Amazon Nova 2 マルチモーダル埋め込み V1 のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| Amazon Nova Premier のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-169A395B)  | Amazon Nova Premier のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Claude 3 Haiku のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-EBB72C32)  | Claude 3 Haiku のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Claude 3 Opus のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-642905B5)  | Claude 3 Opus のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Claude 3 Sonnet のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E93C745B)  | Claude 3 Sonnet のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Claude 3.5 Haiku のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C39B6D57)  | Claude 3.5 Haiku のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Claude 3.5 Sonnet のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5AB0EE48)  | Claude 3.5 Sonnet のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Claude 3.5 Sonnet v2 のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-897F8151)  | Claude 3.5 Sonnet v2 のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Claude 3.7 Sonnet のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-A985813D)  | Claude 3.7 Sonnet のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Claude Haiku 4.5 のバッチ推論ジョブあたりの入力ファイルあたりのレコード | me-central-1: 50,000<br />他のサポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9EDE6039)  | Claude Haiku 4.5 のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| Claude Opus 4.5 のバッチ推論ジョブあたりの入力ファイルあたりのレコード | me-central-1: 50,000<br />他のサポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F7440010)  | Claude Opus 4.5 のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| Claude Opus 4.6 のバッチ推論ジョブあたりの入力ファイルあたりのレコード | me-central-1: 50,000<br />他のサポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D8E451A7)  | Claude Opus 4.6 のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| Claude Sonnet 4 のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | me-central-1: 50,000<br />他のサポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-02DB18B4)  | Claude Sonnet 4 のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Claude Sonnet 4.5 のバッチ推論ジョブあたりの入力ファイルあたりのレコード | me-central-1: 50,000<br />他のサポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4DFF050E)  | Claude Sonnet 4.5 のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| Claude Sonnet 4.6 のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-391CEF89)  | Claude Sonnet 4.6 のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| DeepSeek V3.2 のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9E38DD81)  | DeepSeek V3.2 のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| DeepSeek v3 のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-48DD3868)  | DeepSeek v3 のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Devstral 2 123B のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-92349F9F)  | Devstral 2 123B のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| GLM 4.7 のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7BE9625C)  | GLM 4.7 のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| GLM 4.7 Flash のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8CE8B022)  | GLM 4.7 Flash のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| GLM 5 のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8A232422)  | GLM 5 のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| Gemma 3 12B のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-114ABFC3)  | Gemma 3 12B のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| Gemma 3 27B のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FD7B3EB8)  | Gemma 3 27B のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| Gemma 3 4B のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-65D1D550)  | Gemma 3 4B のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| Kimi K2 thinking のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-852FB779)  | Kimi K2 thinking のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| Kimi K2.5 のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-15B51EC1)  | Kimi K2.5 のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| Llama 3.1 405B Instruct のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8651ED26)  | Llama 3.1 405B Instruct のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Llama 3.1 70B Instruct のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E038D932)  | Llama 3.1 70B Instruct のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Llama 3.1 8B Instruct のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-AFE8E0CD)  | Llama 3.1 8B Instruct のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Llama 3.2 11B Instruct のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D30E6B4B)  | Llama 3.2 11B Instruct のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Llama 3.2 1B Instruct のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-478319B0)  | Llama 3.2 1B Instruct のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Llama 3.2 3B Instruct のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F2E6F90D)  | Llama 3.2 3B Instruct のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Llama 3.2 90B Instruct のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-51B0DEE7)  | Llama 3.2 90B Instruct のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Llama 3.3 70B Instruct のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F77743B5)  | Llama 3.3 70B Instruct のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Llama 4 Maverick のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B4B995D8)  | Llama 4 Maverick のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Llama 4 Scout のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-92E7FE32)  | Llama 4 Scout のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Magistral Small 2509 のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-37A44E24)  | Magistral Small 2509 のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| MiniMax M2 のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F2107865)  | MiniMax M2 のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| MiniMax M2.1 のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FB43CE55)  | MiniMax M2.1 のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| MiniMax M2.5 のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-BC9ED53F)  | MiniMax M2.5 のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| Ministral 3 14B のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E3C8B9C9)  | Ministral 3 14B のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| Ministral 3 8B のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1401504A)  | Ministral 3 8B のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| Ministral 3B のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9335BC45)  | Ministral 3B のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| Mistral Large 2 (24.07) のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-BAE2EB93)  | Mistral Large 2 (24.07) のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Mistral Large 3 のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B1E4F57A)  | Mistral Large 3 のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| Mistral Small のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E6489B37)  | Mistral Small のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| NVIDIA Nemotron 3 Super 120B A12B のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-69AC41C2)  | NVIDIA Nemotron 3 Super 120B A12B のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| NVIDIA Nemotron Nano 12B のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FDE45816)  | NVIDIA Nemotron Nano 12B のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| NVIDIA Nemotron Nano 3 30B のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-AE040A57)  | NVIDIA Nemotron Nano 3 30B のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| NVIDIA Nemotron Nano 9B のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F225D073)  | NVIDIA Nemotron Nano 9B のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| Nova 2 Lite のバッチ推論ジョブあたりの入力ファイルあたりのレコード | me-central-1: 50,000<br />他のサポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4A832410)  | Nova 2 Lite のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| Nova Lite V1 のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | me-central-1: 50,000<br />他のサポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B8626674)  | Nova Lite V1 のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Nova Micro V1 のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | me-central-1: 50,000<br />他のサポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D56DF585)  | Nova Micro V1 のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Nova Pro V1 のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | me-central-1: 50,000<br />他のサポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9B651738)  | Nova Pro V1 のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| OpenAI GPT OSS 120b のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9EF11C18)  | OpenAI GPT OSS 120b のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| OpenAI GPT OSS 20b のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-EF804815)  | OpenAI GPT OSS 20b のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| OpenAI GPT OSS Safeguard 120b のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-EDE20AF1)  | OpenAI GPT OSS Safeguard 120b のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| OpenAI GPT OSS Safeguard 20b のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-135AE4B7)  | OpenAI GPT OSS Safeguard 20b のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| Qwen3 235B のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FD509977)  | Qwen3 235B のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Qwen3 32B のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-28258E5D)  | Qwen3 32B のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Qwen3 Coder 30B のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-46EFABBA)  | Qwen3 Coder 30B のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Qwen3 Coder 480B のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-AE136EE5)  | Qwen3 Coder 480B のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Qwen3 Coder Next のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-0D1F6A84)  | Qwen3 Coder Next のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| Qwen3 Next 80B のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-962E1C58)  | Qwen3 Next 80B のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| Qwen3 VL 235B のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-DFE5A893)  | Qwen3 VL 235B のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| Titan Multimodal Embeddings G1 のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-81E26054)  | Titan Multimodal Embeddings G1 のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Titan Text Embeddings V2 のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D1151D45)  | Titan Text Embeddings V2 のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 | 
| Voxtral Mini 3B 2507 のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7C1813A6)  | Voxtral Mini 3B 2507 のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| Voxtral Small 24B 2507 のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-DE84A1A0)  | Voxtral Small 24B 2507 のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| Writer Palmyra Vision 7B のバッチ推論ジョブあたりの入力ファイルあたりのレコード | サポートされている各リージョン: 100,000 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8A361B65)  | Writer Palmyra Vision 7B のバッチ推論ジョブの入力ファイル内のレコードの最大数。 | 
| Amazon Nova 2 マルチモーダル埋め込み V1 の基本モデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-AF2A00BD)  | Amazon Nova 2 マルチモーダル埋め込み V1 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| Amazon Nova Premier のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-654787A4)  | Amazon Nova Premier のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Claude 3 Haiku のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1570CF9E)  | Claude 3 Haiku のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Claude 3 Opus のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9A0F509C)  | Claude 3 Opus のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Claude 3 Sonnet のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-67BD0D49)  | Claude 3 Sonnet のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Claude 3.5 Haiku のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-220B8A25)  | Claude 3.5 Haiku のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Claude 3.5 Sonnet のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4E7EE0B5)  | Claude 3.5 Sonnet のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Claude 3.5 Sonnet v2 のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C2FA9AEC)  | Claude 3.5 Sonnet v2 のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Claude 3.7 Sonnet のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E455959C)  | Claude 3.7 Sonnet のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Claude Haiku 4.5 のベースモデルを使用した進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | me-central-1: 20<br />他のサポートされている各リージョン: 100 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-63020993)  | Claude Haiku 4.5 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| Claude Opus 4.5 のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | me-central-1: 20<br />他のサポートされている各リージョン: 100 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E83AC604)  | Claude Opus 4.5 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| Claude Opus 4.6 のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | me-central-1: 20<br />他のサポートされている各リージョン: 100 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B0F56DCF)  | Claude Opus 4.6 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| Claude Sonnet 4 のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | me-central-1: 20<br />他のサポートされている各リージョン: 100 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-79EFF176)  | Claude Sonnet 4 のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Claude Sonnet 4.5 のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計。 | me-central-1: 20<br />他のサポートされている各リージョン: 100 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-A0300844)  | Claude Sonnet 4.5 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| Claude Sonnet 4.6 のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-3030E098)  | Claude Sonnet 4.6 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| DeepSeek V3.2 のベースモデルを使用した進行中および送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D1C9F3B9)  | DeepSeek V3.2 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| DeepSeek v3 のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1C19AAE8)  | DeepSeek v3 のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Devstral 2 123B のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-95CB8E2F)  | Devstral 2 123B のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| GLM 4.7 のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-EA873E18)  | GLM 4.7 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| GLM 4.7 Flash のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E453CCF3)  | GLM 4.7 Flash のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| GLM 5 のベースモデルを使用した進行中および送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5BA88337)  | GLM 5 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| Gemma 3 12B のベースモデルを使用した進行中および送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-71A1F0FA)  | Gemma 3 12B のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| Gemma 3 27B のベースモデルを使用した進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C6AAFCD0)  | Gemma 3 27B のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| Gemma 3 4B のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-DC465F65)  | Gemma 3 4B のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| Kimi K2 thinking の基本モデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-78B4AF01)  | Kimi K2 thinking のベースモデルを使用して、進行中および送信されたバッチ推論ジョブの最大数。 | 
| Kimi K2.5 のベースモデルを使用した進行中および送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-EC77BD96)  | Kimi K2.5 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| Llama 3.1 405B Instruct のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-A0AAB785)  | Llama 3.1 405B Instruct のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Llama 3.1 70B Instruct のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-62E2A345)  | Llama 3.1 70B Instruct のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Llama 3.1 8B Instruct のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-391478D2)  | Llama 3.1 8B Instruct のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Llama 3.2 11B Instruct のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-3CCB3548)  | Llama 3.2 11B Instruct のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Llama 3.2 1B Instruct のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8CC57EDA)  | Llama 3.2 1B Instruct のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Llama 3.2 3B Instruct のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-059C1AAB)  | Llama 3.2 3B Instruct のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Llama 3.2 90B Instruct のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-89923E2C)  | Llama 3.2 90B Instruct のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Llama 3.3 70B Instruct のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FE24F76E)  | Llama 3.3 70B Instruct のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Llama 4 Maverick のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4E7DDF49)  | Llama 4 Maverick のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Llama 4 Scout のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B1E11F5B)  | Llama 4 Scout のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Magistral Small 2509 の基本モデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-53B814D7)  | Magistral Small 2509 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| MiniMax M2 の基本モデルを使用した進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-A94DA744)  | MiniMax M2 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| MiniMax M2.1 の基本モデルを使用した進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C05EB25B)  | MiniMax M2.1 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| MiniMax M2.5 の基本モデルを使用した進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B49AA29C)  | MiniMax M2.5 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| Ministral 3 14B のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-29BDACF9)  | Ministral 3 14B のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの最大数。 | 
| Ministral 3 8B のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-89117837)  | Ministral 3 8B のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの最大数。 | 
| Ministral 3B のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D13C968B)  | Ministral 3B のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| Mistral Large 2 (24.07) のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5D367E5C)  | Mistral Large 2 (24.07) のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Mistral Large 3 の基本モデルを使用した進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-090C78B9)  | Mistral Large 3 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| Mistral Small のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-A986092E)  | Mistral Small のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| NVIDIA Nemotron 3 Super 120B A12B のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-6D88F00E)  | NVIDIA Nemotron 3 Super 120B A12B のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| NVIDIA Nemotron Nano 12B のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-EEE88DB2)  | NVIDIA Nemotron Nano 12B のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| NVIDIA Nemotron Nano 3 30B のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-0ED8E85F)  | NVIDIA Nemotron Nano 3 30B のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| NVIDIA Nemotron Nano 9B のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-864449ED)  | NVIDIA Nemotron Nano 9B のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| Nova 2 Lite のベースモデルを使用した進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | me-central-1: 20<br />他のサポートされている各リージョン: 100 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-10F69CA1)  | Nova 2 Lite のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| Nova Lite V1 のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | me-central-1: 20<br />他のサポートされている各リージョン: 100 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E2ED42E6)  | Nova Lite V1 のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Nova Micro V1 のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | me-central-1: 20<br />他のサポートされている各リージョン: 100 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-564C017C)  | Nova Micro V1 のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Nova Pro V1 のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | me-central-1: 20<br />他のサポートされている各リージョン: 100 |  [あり](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FE130012)  | Nova Pro V1 のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| OpenAI GPT OSS 120b のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-07844084)  | OpenAI GPT OSS 120b のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| OpenAI GPT OSS 20b のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-50CC95A8)  | OpenAI GPT OSS 20b のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| OpenAI GPT OSS Safeguard 120b のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D9E467C0)  | OpenAI GPT OSS Safeguard 120b のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| OpenAI GPT OSS Safeguard 20b の基本モデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-811E997F)  | OpenAI GPT OSS Safeguard 20b のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| Qwen3 235B のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-91E3DBE2)  | Qwen3 235B のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Qwen3 32B のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7B9A79C8)  | Qwen3 32B のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Qwen3 Coder 30B のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F30EAB98)  | Qwen3 Coder 30B のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Qwen3 Coder 480B のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-A02F87EC)  | Qwen3 Coder 480B のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Qwen3 Coder Next の基本モデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-091EBF74)  | Qwen3 Coder Next のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| Qwen3 Next 80B のベースモデルを使用した進行中および送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-EA6F6B5F)  | Qwen3 Next 80B のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| Qwen3 VL 235B のベースモデルを使用した進行中および送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-990A2394)  | Qwen3 VL 235B のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| Titan Multimodal Embeddings G1 のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7F2C6F33)  | Titan Multimodal Embeddings G1 のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Titan Text Embeddings V2 のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1AC1CABC)  | Titan Text Embeddings V2 のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Voxtral Mini 3B 2507 のベースモデルを使用した進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-BA72E406)  | Voxtral Mini 3B 2507 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| Voxtral Small 24B 2507 のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C540484E)  | Voxtral Small 24B 2507 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| Writer Palmyra Vision 7B の基本モデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計 | サポートされている各リージョン: 100 |  [可能](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-88DE0CAC)  | Writer Palmyra Vision 7B のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。 | 
| Titan Multimodal Embeddings G1 のカスタムモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 3 | いいえ | Titan Multimodal Embeddings G1 のカスタムモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Titan Text Embeddings V2 のカスタムモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 3 | いいえ | Titan Text Embeddings V2 のカスタムモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 | 
| Bedrock Data Automation ランタイムのスロットルレート制限: ListTagsForResource | サポートされている各リージョン: 25/秒 | いいえ | Bedrock Data Automation ランタイムの最大数: 現在のリージョンでアカウントごと、1 秒あたりに実行できる ListTagsForResource リクエスト数 | 
| Bedrock Data Automation ランタイムのスロットルレート制限: TagResource | サポートされている各リージョン: 25/秒 | いいえ | Bedrock Data Automation ランタイムの最大数: 現在のリージョンでアカウントごと、1 秒あたりに実行できる TagResource リクエスト数 | 
| Bedrock Data Automation ランタイムのスロットルレート制限: UntagResource | サポートされている各リージョン: 25/秒 | いいえ | Bedrock Data Automation ランタイムの最大数: 現在のリージョンでアカウントごと、1 秒あたりに実行できる UntagResource リクエスト数 | 
| Bedrock Data Automation のスロットルレート制限: ListTagsForResource | サポートされている各リージョン: 25/秒 | いいえ | Bedrock Data Automation の最大数: 現在のリージョンでアカウントごと、1 秒あたりに実行できる ListTagsForResource リクエスト数 | 
| Bedrock Data Automation のスロットルレート制限: TagResource | サポートされている各リージョン: 25/秒 | いいえ | Bedrock Data Automation の最大数: 現在のリージョンでアカウントごと、1 秒あたりに実行できる TagResource リクエスト数 | 
| Bedrock Data Automation のスロットルレート制限: UntagResource | サポートされている各リージョン: 25/秒 | いいえ | Bedrock Data Automation の最大数: 現在のリージョンでアカウントごと、1 秒あたりに実行できる UntagResource リクエスト数 | 
| CreateBlueprint のスロットルレート制限 | サポートされている各リージョン: 5/秒 | いいえ | 現在のリージョンでアカウントごと、1 秒あたりに実行できる CreateBlueprint リクエストの最大数 | 
| CreateBlueprintVersion のスロットルレート制限 | サポートされている各リージョン: 5/秒 | いいえ | 現在のリージョンでアカウントごと、1 秒あたりに実行できる CreateBlueprintVersion リクエストの最大数 | 
| CreateDataAutomationProject のスロットルレート制限 | サポートされている各リージョン: 5/秒 | いいえ | 現在のリージョンでアカウントごと、1 秒あたりに実行できる CreateDataAutomationProject リクエストの最大数 | 
| DeleteBlueprint のスロットルレート制限 | サポートされている各リージョン: 5/秒 | いいえ | 現在のリージョンでアカウントごと、1 秒あたりに実行できる DeleteBlueprint リクエストの最大数 | 
| DeleteDataAutomationProject のスロットルレート制限 | サポートされている各リージョン: 5/秒 | いいえ | 現在のリージョンでアカウントごと、1 秒あたりに実行できる DeleteDataAutomationProject リクエストの最大数 | 
| GetBlueprint のスロットルレート制限 | サポートされている各リージョン: 5/秒 | いいえ | 現在のリージョンでアカウントごと、1 秒あたりに実行できる GetBlueprint リクエストの最大数 | 
| GetDataAutomationProject のスロットルレート制限 | サポートされている各リージョン: 5/秒 | いいえ | 現在のリージョンでアカウントごと、1 秒あたりに実行できる GetDataAutomationProject リクエストの最大数 | 
| GetDataAutomationStatus のスロットルレート制限 | サポートされている各リージョン：10/秒 | いいえ | 現在のリージョンでアカウントごと、1 秒あたりに実行できる GetDataAutomationStatus リクエストの最大数 | 
| InvokeDataAutomationAsync のスロットルレート制限 | サポートされている各リージョン：10/秒 | いいえ | 現在のリージョンでアカウントごと、1 秒あたりに実行できる InvokeDataAutomationAsync リクエストの最大数 | 
| ListBlueprints のスロットルレート制限 | サポートされている各リージョン: 5/秒 | いいえ | 現在のリージョンでアカウントごと、1 秒あたりに実行できる ListBlueprints リクエストの最大数 | 
| ListDataAutomationProjects のスロットルレート制限 | サポートされている各リージョン: 5/秒 | いいえ | 現在のリージョンでアカウントごと、1 秒あたりに実行できる ListDataAutomationProjects リクエストの最大数 | 
| UpdateBlueprint のスロットルレート制限 | サポートされている各リージョン: 5/秒 | いいえ | 現在のリージョンでアカウントごと、1 秒あたりに実行できる UpdateBlueprint リクエストの最大数 | 
| UpdateDataAutomationProject のスロットルレート制限 | サポートされている各リージョン: 5/秒 | いいえ | 現在のリージョンでアカウントごと、1 秒あたりに実行できる UpdateDataAutomationProject リクエストの最大数 | 
| 1 秒あたりの UpdateAgent リクエスト数 | サポートされている各リージョン: 4 | いいえ | UpdateAgent API リクエストの 1 秒あたりの最大数。 | 
| 1 秒あたりの UpdateAgentActionGroup リクエスト数 | サポートされている各リージョン: 6 | いいえ | UpdateAgentActionGroup API リクエストの 1 秒あたりの最大数。 | 
| 1 秒あたりの UpdateAgentAlias リクエスト数 | サポートされている各リージョン: 2 | いいえ | UpdateAgentAlias API リクエストの 1 秒あたりの最大数。 | 
| 1 秒あたりの UpdateAgentKnowledgeBase リクエスト数 | サポートされている各リージョン: 4 | いいえ | UpdateAgentKnowledgeBase API リクエストの 1 秒あたりの最大数。 | 

**注記**  
アカウントのクォータ引き上げをリクエストするには、以下のステップを実行します。  
クォータが **[あり]** とマークされている場合は、「Service Quotas ユーザーガイド」の「[Requesting a Quota Increase](https://docs.aws.amazon.com/servicequotas/latest/userguide/request-quota-increase.html)」に記載の手順でクォータを調整できます。
クォータが **[なし]** とマークされている場合は、[制限引き上げのフォーム](https://console.aws.amazon.com/support/home#/case/create?issueType=service-limit-increase)を使用して引き上げを検討するようリクエストを送信できます。
モデルを問わず、以下のクォータの引き上げを一緒にリクエストすることができます。  
{{${model}}} の 1 分あたりのクロスリージョン InvokeModel トークン
{{${model}}} の 1 分あたりのクロスリージョン InvokeModel リクエスト
{{${model}}} の 1 分あたりのオンデマンド InvokeModel トークン
{{${model}}} の 1 分あたりのオンデマンド InvokeModel リクエスト
上記のクォータの任意の組み合わせの引き上げをリクエストするには、「Service Quotas ユーザーガイド」の「[Requesting a Quota Increase](https://docs.aws.amazon.com/servicequotas/latest/userguide/request-quota-increase.html)」に記載の手順に沿って **{{${model}}} の 1 分あたりのクロスリージョン InvokeModel トークン**のクォータの引き上げをリクエストしてください。その後、サポートチームからお客様にご連絡し、その他の 3 つのクォータを引き上げるオプションを提供いたします。圧倒的な需要により、既存のクォータ割り当てを消費するトラフィックを生成するお客様に優先権が与えられます。この条件を満たしていない場合、リクエストは拒否されることがあります。