기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# Amazon Bedrock 엔드포인트 및 할당량
<a name="bedrock"></a>

 AWS 서비스에 프로그래밍 방식으로 연결하려면 endpoint. AWS services를 사용합니다.이 서비스는 서비스가 지원하는 일부 또는 모든 AWS 리전에서 IPv4 엔드포인트, 듀얼 스택 엔드포인트 및 FIPS 엔드포인트와 같은 엔드포인트 유형을 제공합니다. 일부 서비스는 글로벌 엔드포인트를 제공합니다. 자세한 내용은 [AWS 서비스 엔드포인트](rande.md) 단원을 참조하십시오.

한도라고도 하는 서비스 할당량은 AWS 계정의 최대 서비스 리소스 또는 작업 수입니다. 자세한 내용은 [AWS 서비스 할당량](aws_service_limits.md) 단원을 참조하십시오.

다음은 이 서비스에 대한 서비스 엔드포인트 및 서비스 할당량입니다.

## Amazon Bedrock 서비스 엔드포인트
<a name="bedrock_region"></a>

### Amazon Bedrock 컨트롤 플레인 API
<a name="br-cp"></a>

다음 표에는 Amazon Bedrock에서 관리, 학습 및 배포 모델에 대해 지원하는 리전별 엔드포인트 목록이 나와 있습니다. [Amazon Bedrock API 작업](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_Operations_Amazon_Bedrock.html)에 다음 엔드포인트를 사용하세요.


| 리전 이름 | 리전 | 엔드포인트 | 프로토콜 | 
| --- | --- | --- | --- | 
| 미국 동부(오하이오) | us-east-2 |  bedrock.us-east-2.amazonaws.com <br /> bedrock-fips.us-east-2.amazonaws.com  | HTTPS<br />HTTPS | 
| 미국 동부(버지니아 북부) | us-east-1 |  bedrock.us-east-1.amazonaws.com <br /> bedrock-fips.us-east-1.amazonaws.com  | HTTPS<br />HTTPS | 
| 미국 서부(캘리포니아 북부) | us-west-1 |  bedrock.us-west-1.amazonaws.com <br /> bedrock-fips.us-west-1.amazonaws.com  | HTTPS<br />HTTPS | 
| 미국 서부(오리곤) | us-west-2 |  bedrock.us-west-2.amazonaws.com <br /> bedrock-fips.us-west-2.amazonaws.com  | HTTPS<br />HTTPS | 
| 아프리카(케이프타운) | af-south-1 |  bedrock.af-south-1.amazonaws.com  | HTTPS | 
| 아시아 태평양(하이데라바드) | ap-south-2 |  bedrock.ap-south-2.amazonaws.com  | HTTPS | 
| 아시아 태평양(자카르타) | ap-southeast-3 |  bedrock.ap-southeast-3.amazonaws.com  | HTTPS | 
| 아시아 태평양(말레이시아) | ap-southeast-5 |  bedrock.ap-southeast-5.amazonaws.com  | HTTPS | 
| 아시아 태평양(멜버른) | ap-southeast-4 |  bedrock.ap-southeast-4.amazonaws.com  | HTTPS | 
| 아시아 태평양(뭄바이) | ap-south-1 |  bedrock.ap-south-1.amazonaws.com  | HTTPS | 
| 아시아 태평양(뉴질랜드) | ap-southeast-6 |  bedrock.ap-southeast-6.amazonaws.com  | HTTPS | 
| 아시아 태평양(오사카) | ap-northeast-3 |  bedrock.ap-northeast-3.amazonaws.com  | HTTPS | 
| 아시아 태평양(서울) | ap-northeast-2 |  bedrock.ap-northeast-2.amazonaws.com  | HTTPS | 
| 아시아 태평양(싱가포르) | ap-southeast-1 |  bedrock.ap-southeast-1.amazonaws.com  | HTTPS | 
| 아시아 태평양(시드니) | ap-southeast-2 |  bedrock.ap-southeast-2.amazonaws.com  | HTTPS | 
| 아시아 태평양(타이베이) | ap-east-2 |  bedrock.ap-east-2.amazonaws.com  | HTTPS | 
| 아시아 태평양(태국) | ap-southeast-7 |  bedrock.ap-southeast-7.amazonaws.com  | HTTPS | 
| 아시아 태평양(도쿄) | ap-northeast-1 |  bedrock.ap-northeast-1.amazonaws.com  | HTTPS | 
| 캐나다(중부) | ca-central-1 |  bedrock.ca-central-1.amazonaws.com <br /> bedrock-fips.ca-central-1.amazonaws.com  | HTTPS<br />HTTPS | 
| 캐나다 서부(캘거리) | ca-west-1 |  bedrock.ca-west-1.amazonaws.com <br /> bedrock-fips.ca-west-1.amazonaws.com  | HTTPS<br />HTTPS | 
| 유럽(프랑크푸르트) | eu-central-1 |  bedrock.eu-central-1.amazonaws.com  | HTTPS | 
| 유럽(아일랜드) | eu-west-1 |  bedrock.eu-west-1.amazonaws.com  | HTTPS | 
| 유럽(런던) | eu-west-2 |  bedrock.eu-west-2.amazonaws.com  | HTTPS | 
| 유럽(밀라노) | eu-south-1 |  bedrock.eu-south-1.amazonaws.com  | HTTPS | 
| 유럽(파리) | eu-west-3 |  bedrock.eu-west-3.amazonaws.com  | HTTPS | 
| 유럽(스페인) | eu-south-2 |  bedrock.eu-south-2.amazonaws.com  | HTTPS | 
| 유럽(스톡홀름) | eu-north-1 |  bedrock.eu-north-1.amazonaws.com  | HTTPS | 
| 유럽(취리히) | eu-central-2 |  bedrock.eu-central-2.amazonaws.com  | HTTPS | 
| 이스라엘(텔아비브) | il-central-1 |  bedrock.il-central-1.amazonaws.com  | HTTPS | 
| 멕시코(중부) | mx-central-1 |  bedrock.mx-central-1.amazonaws.com  | HTTPS | 
| 중동(바레인) | me-south-1 |  bedrock.me-south-1.amazonaws.com  | HTTPS | 
| 중동(UAE) | me-central-1 |  bedrock.me-central-1.amazonaws.com  | HTTPS | 
| 남아메리카(상파울루) | sa-east-1 |  bedrock.sa-east-1.amazonaws.com  | HTTPS | 
|  AWS GovCloud(미국 동부) | us-gov-east-1 |  bedrock.us-gov-east-1.amazonaws.com <br /> bedrock-fips.us-gov-east-1.amazonaws.com  | HTTPS<br />HTTPS | 
|  AWS GovCloud(미국 서부) | us-gov-west-1 |  bedrock.us-gov-west-1.amazonaws.com <br /> bedrock-fips.us-gov-west-1.amazonaws.com  | HTTPS<br />HTTPS | 

### Amazon Bedrock 런타임 API
<a name="br-rt"></a>

다음 표에는 Amazon Bedrock가 Amazon Bedrock에서 호스팅된 모델에 대한 추론 요청 생성을 지원하는 리전별 엔드포인트 목록이 나와 있습니다. [Amazon Bedrock 런타임 API 작업](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_Operations_Amazon_Bedrock_Runtime.html)에 다음 엔드포인트를 사용하세요.


| 리전 이름 | 리전 | 엔드포인트 | 프로토콜 | 
| --- | --- | --- | --- | 
| 미국 동부(오하이오) | us-east-2 |  bedrock-runtime.us-east-2.amazonaws.com <br /> bedrock-runtime-fips.us-east-2.amazonaws.com  | HTTPS<br />HTTPS | 
| 미국 동부(버지니아 북부) | us-east-1 |  bedrock-runtime.us-east-1.amazonaws.com <br /> bedrock-runtime-fips.us-east-1.amazonaws.com  | HTTPS<br />HTTPS | 
| 미국 서부(오리건) | us-west-2 |  bedrock-runtime.us-west-2.amazonaws.com <br /> bedrock-runtime-fips.us-west-2.amazonaws.com  | HTTPS<br />HTTPS | 
| 아시아 태평양(하이데라바드) | ap-south-2 |  bedrock-runtime.ap-south-2.amazonaws.com  | HTTPS | 
| 아시아 태평양(뭄바이) | ap-south-1 |  bedrock-runtime.ap-south-1.amazonaws.com  | HTTPS | 
| 아시아 태평양(오사카) | ap-northeast-3 |  bedrock-runtime.ap-northeast-3.amazonaws.com  | HTTPS | 
| 아시아 태평양(서울) | ap-northeast-2 |  bedrock-runtime.ap-northeast-2.amazonaws.com  | HTTPS | 
| 아시아 태평양(싱가포르) | ap-southeast-1 |  bedrock-runtime.ap-southeast-1.amazonaws.com  | HTTPS | 
| 아시아 태평양(시드니) | ap-southeast-2 |  bedrock-runtime.ap-southeast-2.amazonaws.com  | HTTPS | 
| 아시아 태평양(도쿄) | ap-northeast-1 |  bedrock-runtime.ap-northeast-1.amazonaws.com  | HTTPS | 
| 캐나다(중부) | ca-central-1 |  bedrock-runtime.ca-central-1.amazonaws.com <br /> bedrock-runtime-fips.ca-central-1.amazonaws.com  | HTTPS<br />HTTPS | 
| 유럽(프랑크푸르트) | eu-central-1 |  bedrock-runtime.eu-central-1.amazonaws.com  | HTTPS | 
| 유럽(아일랜드) | eu-west-1 |  bedrock-runtime.eu-west-1.amazonaws.com  | HTTPS | 
| 유럽(런던) | eu-west-2 |  bedrock-runtime.eu-west-2.amazonaws.com  | HTTPS | 
| 유럽(밀라노) | eu-south-1 |  bedrock-runtime.eu-south-1.amazonaws.com  | HTTPS | 
| 유럽(파리) | eu-west-3 |  bedrock-runtime.eu-west-3.amazonaws.com  | HTTPS | 
| 유럽(스페인) | eu-south-2 |  bedrock-runtime.eu-south-2.amazonaws.com  | HTTPS | 
| 유럽(스톡홀름) | eu-north-1 |  bedrock-runtime.eu-north-1.amazonaws.com  | HTTPS | 
| 유럽(취리히) | eu-central-2 |  bedrock-runtime.eu-central-2.amazonaws.com  | HTTPS | 
| 남아메리카(상파울루) | sa-east-1 |  bedrock-runtime.sa-east-1.amazonaws.com  | HTTPS | 
|  AWS GovCloud(미국 동부) | us-gov-east-1 |  bedrock-runtime.us-gov-east-1.amazonaws.com <br /> bedrock-runtime-fips.us-gov-east-1.amazonaws.com  | HTTPS<br />HTTPS | 
|  AWS GovCloud(미국 서부) | us-gov-west-1 |  bedrock-runtime.us-gov-west-1.amazonaws.com <br /> bedrock-runtime-fips.us-gov-west-1.amazonaws.com  | HTTPS<br />HTTPS | 

### Amazon Bedrock 빌드 API용 에이전트
<a name="bra-bt"></a>

다음 표에는 Amazon Bedrock Agents가 에이전트 및 지식 기반을 생성하고 관리하기 위해 지원하는 리전별 엔드포인트 목록이 나와 있습니다. [Amazon Bedrock Agents API 작업](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_Operations_Agents_for_Amazon_Bedrock.html)에 다음 엔드포인트를 사용하세요.


- **미국 동부(버지니아 북부)**
  - **리전:** us-east-1
  - **엔드포인트:** bedrock-agent.us-east-1.amazonaws.com / **프로토콜:** HTTPS
  - **엔드포인트:** bedrock-agent-fips.us-east-1.amazonaws.com / **프로토콜:** HTTPS

- **미국 서부(오레곤)**
  - **리전:** us-west-2
  - **엔드포인트:** bedrock-agent.us-west-2.amazonaws.com / **프로토콜:** HTTPS
  - **엔드포인트:** bedrock-agent-fips.us-west-2.amazonaws.com / **프로토콜:** HTTPS

- **아시아 태평양(싱가포르)**
  - **리전:** ap-southeast-1
  - **엔드포인트:** bedrock-agent.ap-southeast-1.amazonaws.com
  - **프로토콜:** HTTPS

- **아시아 태평양(시드니)**
  - **리전:** ap-southeast-2
  - **엔드포인트:** bedrock-agent.ap-southeast-2.amazonaws.com
  - **프로토콜:** HTTPS

- **아시아 태평양(도쿄)**
  - **리전:** ap-northeast-1
  - **엔드포인트:** bedrock-agent.ap-northeast-1.amazonaws.com
  - **프로토콜:** HTTPS

- **아시아 태평양(서울)**
  - **리전:** ap-northeast-2
  - **엔드포인트:** bedrock-agent.ap-northeast-2.amazonaws.com
  - **프로토콜:** HTTPS

- **캐나다(중부)**
  - **리전:** ca-central-1
  - **엔드포인트:** bedrock-agent.ca-central-1.amazonaws.com
  - **프로토콜:** HTTPS

- **유럽(프랑크푸르트)**
  - **리전:** eu-central-1
  - **엔드포인트:** bedrock-agent.eu-central-1.amazonaws.com
  - **프로토콜:** HTTPS

- **유럽(아일랜드)**
  - **리전:** eu-west-1
  - **엔드포인트:** bedrock-agent.eu-west-1.amazonaws.com
  - **프로토콜:** HTTPS

- **유럽(런던)**
  - **리전:** eu-west-2
  - **엔드포인트:** bedrock-agent.eu-west-2.amazonaws.com
  - **프로토콜:** HTTPS

- **유럽(파리)**
  - **리전:** eu-west-3
  - **엔드포인트:** bedrock-agent.eu-west-3.amazonaws.com
  - **프로토콜:** HTTPS

- **아시아 태평양(뭄바이)**
  - **리전:** ap-south-1
  - **엔드포인트:** bedrock-agent.ap-south-1.amazonaws.com
  - **프로토콜:** HTTPS

- **남아메리카(상파울루)**
  - **리전:** sa-east-1
  - **엔드포인트:** bedrock-agent.sa-east-1.amazonaws.com
  - **프로토콜:** HTTPS


### Amazon Bedrock 런타임 API용 에이전트
<a name="bra-rt"></a>

다음 표에는 Agents for Amazon Bedrock가 에이전트 직접 호출 및 지식 기반 쿼리를 위해 지원하는 리전별 엔드포인트 목록이 나와 있습니다. [Agents for Amazon Bedrock 런타임 API 작업](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_Operations_Agents_for_Amazon_Bedrock_Runtime.html)에 다음 엔드포인트를 사용하세요.


- **미국 동부(버지니아 북부)**
  - **리전:** us-east-1
  - **엔드포인트:** bedrock-agent-runtime.us-east-1.amazonaws.com / **프로토콜:** HTTPS
  - **엔드포인트:** bedrock-agent-runtime-fips.us-east-1.amazonaws.com / **프로토콜:** HTTPS

- **미국 서부(오레곤)**
  - **리전:** us-west-2
  - **엔드포인트:** bedrock-agent-runtime.us-west-2.amazonaws.com / **프로토콜:** HTTPS
  - **엔드포인트:** bedrock-agent-runtime-fips.us-west-2.amazonaws.com / **프로토콜:** HTTPS

- **아시아 태평양(싱가포르)**
  - **리전:** ap-southeast-1
  - **엔드포인트:** bedrock-agent-runtime.ap-southeast-1.amazonaws.com
  - **프로토콜:** HTTPS

- **아시아 태평양(시드니)**
  - **리전:** ap-southeast-2
  - **엔드포인트:** bedrock-agent-runtime.ap-southeast-2.amazonaws.com
  - **프로토콜:** HTTPS

- **아시아 태평양(도쿄)**
  - **리전:** ap-northeast-1
  - **엔드포인트:** bedrock-agent-runtime.ap-northeast-1.amazonaws.com
  - **프로토콜:** HTTPS

- **아시아 태평양(서울)**
  - **리전:** ap-northeast-2
  - **엔드포인트:** bedrock-agent-runtime.ap-northeast-2.amazonaws.com
  - **프로토콜:** HTTPS

- **캐나다(중부)**
  - **리전:** ca-central-1
  - **엔드포인트:** bedrock-agent-runtime.ca-central-1.amazonaws.com
  - **프로토콜:** HTTPS

- **유럽(프랑크푸르트)**
  - **리전:** eu-central-1
  - **엔드포인트:** bedrock-agent-runtime.eu-central-1.amazonaws.com
  - **프로토콜:** HTTPS

- **유럽(파리)**
  - **리전:** eu-west-3
  - **엔드포인트:** bedrock-agent-runtime.eu-west-3.amazonaws.com
  - **프로토콜:** HTTPS

- **유럽(아일랜드)**
  - **리전:** eu-west-1
  - **엔드포인트:** bedrock-agent-runtime.eu-west-1.amazonaws.com
  - **프로토콜:** HTTPS

- **유럽(런던)**
  - **리전:** eu-west-2
  - **엔드포인트:** bedrock-agent-runtime.eu-west-2.amazonaws.com
  - **프로토콜:** HTTPS

- **아시아 태평양(뭄바이)**
  - **리전:** ap-south-1
  - **엔드포인트:** bedrock-agent-runtime.ap-south-1.amazonaws.com
  - **프로토콜:** HTTPS

- **남아메리카(상파울루)**
  - **리전:** sa-east-1
  - **엔드포인트:** bedrock-agent-runtime.sa-east-1.amazonaws.com
  - **프로토콜:** HTTPS


### Amazon Bedrock 데이터 자동화 API
<a name="brbda-bt"></a>

다음 표에는 Amazon Bedrock용 데이터 자동화에서 지원하는 리전별 엔드포인트 목록이 나와 있습니다. `runtime`이라는 단어를 사용하는 엔드포인트는 블루프린트 및 프로젝트를 직접 호출하여 파일에서 정보를 추출합니다. [Amazon Bedrock 데이터 자동화 런타임 API 작업](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_Operations_Runtime_for_Amazon_Bedrock_Data_Automation.html)에 다음 엔드포인트를 사용하세요. `runtime`이라는 단어가 없는 엔드포인트는 추출 지침을 제공하기 위해 블루프린트 및 프로젝트를 생성하는 데 사용됩니다. [Amazon Bedrock 데이터 자동화 API 빌드 타임 작업](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_Operations_Data_Automation_for_Amazon_Bedrock.html)에 다음 엔드포인트를 사용하세요.


| 리전 이름 | 리전 | 엔드포인트 | 프로토콜 | 
| --- | --- | --- | --- | 
| 미국 동부(오하이오) | us-east-2 |  bedrock-data-automation.us-east-2.amazonaws.com <br /> bedrock-data-automation-runtime.us-east-2.amazonaws.com <br /> bedrock-data-automation-fips.us-east-2.amazonaws.com <br /> bedrock-data-automation-runtime-fips.us-east-2.amazonaws.com  | HTTPS<br />HTTPS<br />HTTPS<br />HTTPS | 
| 미국 동부(버지니아 북부) | us-east-1 |  bedrock-data-automation.us-east-1.amazonaws.com <br /> bedrock-data-automation-runtime.us-east-1.api.aws <br /> bedrock-data-automation-runtime.us-east-1.amazonaws.com <br /> bedrock-data-automation.us-east-1.api.aws <br /> bedrock-data-automation-fips.us-east-1.amazonaws.com <br /> bedrock-data-automation-runtime-fips.us-east-1.api.aws <br /> bedrock-data-automation-runtime-fips.us-east-1.amazonaws.com <br /> bedrock-data-automation-fips.us-east-1.api.aws  | HTTPS<br />HTTPS<br />HTTPS<br />HTTPS<br />HTTPS<br />HTTPS<br />HTTPS<br />HTTPS | 
| 미국 서부(오리곤) | us-west-2 |  bedrock-data-automation.us-west-2.amazonaws.com <br /> bedrock-data-automation-runtime.us-west-2.api.aws <br /> bedrock-data-automation-runtime.us-west-2.amazonaws.com <br /> bedrock-data-automation.us-west-2.api.aws <br /> bedrock-data-automation-fips.us-west-2.amazonaws.com <br /> bedrock-data-automation-runtime-fips.us-west-2.api.aws <br /> bedrock-data-automation-runtime-fips.us-west-2.amazonaws.com <br /> bedrock-data-automation-fips.us-west-2.api.aws  | HTTPS<br />HTTPS<br />HTTPS<br />HTTPS<br />HTTPS<br />HTTPS<br />HTTPS<br />HTTPS | 
| 아시아 태평양(뭄바이) | ap-south-1 |  bedrock-data-automation.ap-south-1.amazonaws.com <br /> bedrock-data-automation-runtime.ap-south-1.amazonaws.com  | HTTPS<br />HTTPS | 
| 아시아 태평양(시드니) | ap-southeast-2 |  bedrock-data-automation.ap-southeast-2.amazonaws.com <br /> bedrock-data-automation-runtime.ap-southeast-2.amazonaws.com  | HTTPS<br />HTTPS | 
| 아시아 태평양(도쿄) | ap-northeast-1 |  bedrock-data-automation.ap-northeast-1.amazonaws.com <br /> bedrock-data-automation-runtime.ap-northeast-1.amazonaws.com  | HTTPS<br />HTTPS | 
| 캐나다(중부) | ca-central-1 |  bedrock-data-automation.ca-central-1.amazonaws.com <br /> bedrock-data-automation-runtime.ca-central-1.amazonaws.com <br /> bedrock-data-automation-fips.ca-central-1.amazonaws.com <br /> bedrock-data-automation-runtime-fips.ca-central-1.amazonaws.com  | HTTPS<br />HTTPS<br />HTTPS<br />HTTPS | 
| 유럽(프랑크푸르트) | eu-central-1 |  bedrock-data-automation.eu-central-1.amazonaws.com <br /> bedrock-data-automation-runtime.eu-central-1.amazonaws.com  | HTTPS<br />HTTPS | 
| 유럽(아일랜드) | eu-west-1 |  bedrock-data-automation.eu-west-1.amazonaws.com <br /> bedrock-data-automation-runtime.eu-west-1.amazonaws.com  | HTTPS<br />HTTPS | 
| 유럽(런던) | eu-west-2 |  bedrock-data-automation.eu-west-2.amazonaws.com <br /> bedrock-data-automation-runtime.eu-west-2.amazonaws.com  | HTTPS<br />HTTPS | 
| 유럽(스페인) | eu-south-2 |  bedrock-data-automation.eu-south-2.amazonaws.com <br /> bedrock-data-automation-runtime.eu-south-2.amazonaws.com  | HTTPS<br />HTTPS | 
|  AWS GovCloud(미국 서부) | us-gov-west-1 |  bedrock-data-automation.us-gov-west-1.amazonaws.com <br /> bedrock-data-automation-runtime.us-gov-west-1.amazonaws.com <br /> bedrock-data-automation-fips.us-gov-west-1.amazonaws.com <br /> bedrock-data-automation-runtime-fips.us-gov-west-1.amazonaws.com  | HTTPS<br />HTTPS<br />HTTPS<br />HTTPS | 

## Amazon Bedrock 서비스 할당량
<a name="limits_bedrock"></a>

**작은 정보**  
Amazon Bedrock에는 많은 수의 할당량이 있으므로 아래 표를 사용하는 대신 콘솔을 사용하여 서비스 할당량을 보는 것이 좋습니다. [Amazon Bedrock 할당량](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas)을 엽니다. 검색 필드를 사용하여 특정 할당량을 찾습니다. 기어 아이콘을 사용하여 한 페이지에 표시되는 할당량 수를 제어합니다.


| 이름 | 기본값 | 조정 가능 | 설명 | 
| --- | --- | --- | --- | 
| (고급 프롬프트 최적화) 계정당 활성 작업 | 지원되는 각 리전: 20개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B46DD052)  | 계정당 활성 고급 프롬프트 최적화(APO) 작업의 최대 수입니다. | 
| (고급 프롬프트 최적화) 계정당 비활성 작업 | 각 지원되는 리전: 5,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-0B66D421)  | 계정당 비활성 고급 프롬프트 최적화(APO) 작업의 최대 수입니다. | 
| (자동 추론) 정책의 주석 | 지원되는 각 리전: 10 | 아니요 | 자동 추론 정책의 최대 주석 수입니다. | 
| (자동 추론) 초당 CancelAutomatedReasoningPolicyBuildWorkflow 요청 | 지원되는 각 리전: 5개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7334E629)  | 초당 최대 CancelAutomatedReasoningPolicyBuildWorkflow API 요청 수입니다. | 
| (자동 추론) 정책당 동시 빌드 | 지원되는 각 리전: 2 | 아니요 | 자동 추론 정책당 최대 동시 빌드 수입니다. | 
| (자동 추론) 계정당 동시 정책 빌드 | 지원되는 각 리전: 5 | 아니요 | 한 계정에서 동시 자동 추론 정책 빌드의 최대 수입니다. | 
| (자동 추론) 초당 CreateAutomatedReasoningPolicy 요청 | 지원되는 각 리전: 5개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-6326A422)  | 초당 최대 CreateAutomatedReasoningPolicy API 요청 수입니다. | 
| (자동 추론) 초당 CreateAutomatedReasoningPolicyTestCase 요청 | 지원되는 각 리전: 5개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F5ACA0A6)  | 초당 최대 CreateAutomatedReasoningPolicyTestCase API 요청 수입니다. | 
| (자동 추론) 초당 CreateAutomatedReasoningPolicyVersion 요청 | 지원되는 각 리전: 5개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C5913DD6)  | 초당 최대 CreateAutomatedReasoningPolicyVersion API 요청 수입니다. | 
| (자동 추론) 초당 DeleteAutomatedReasoningPolicy 요청 | 지원되는 각 리전: 5개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-51CDA0E1)  | 초당 최대 DeleteAutomatedReasoningPolicy API 요청 수입니다. | 
| (자동 추론) 초당 DeleteAutomatedReasoningPolicyBuildWorkflow 요청 | 지원되는 각 리전: 5개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F20FBC17)  | 초당 최대 DeleteAutomatedReasoningPolicyBuildWorkflow API 요청 수입니다. | 
| (자동 추론) 초당 DeleteAutomatedReasoningPolicyTestCase 요청 | 지원되는 각 리전: 5개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-345B029F)  | 초당 최대 DeleteAutomatedReasoningPolicyTestCase API 요청 수입니다. | 
| (자동 추론) 초당 ExportAutomatedReasoningPolicyVersion 요청 | 지원되는 각 리전: 5개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9B17C979)  | 초당 최대 ExportAutomatedReasoningPolicyVersion API 요청 수입니다. | 
| (자동 추론) 초당 GetAutomatedReasoningPolicy 요청 | 지원되는 각 리전: 10개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4DBDD5C9)  | 초당 최대 GetAutomatedReasoningPolicy API 요청 수입니다. | 
| (자동 추론) 초당 GetAutomatedReasoningPolicyAnnotations 요청 | 지원되는 각 리전: 10개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-0CB120A9)  | 초당 최대 GetAutomatedReasoningPolicyAnnotations API 요청 수입니다. | 
| (자동 추론) 초당 GetAutomatedReasoningPolicyBuildWorkflow 요청 | 지원되는 각 리전: 10개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-749C38BD)  | 초당 최대 GetAutomatedReasoningPolicyBuildWorkflow API 요청 수입니다. | 
| (자동 추론) 초당 GetAutomatedReasoningPolicyBuildWorkflowResultAssets 요청 | 지원되는 각 리전: 10개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9B9B20DB)  | 초당 최대 GetAutomatedReasoningPolicyBuildWorkflowResultAssets API 요청 수입니다. | 
| (자동 추론) 초당 GetAutomatedReasoningPolicyNextScenario 요청 | 지원되는 각 리전: 10개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-EAD257E4)  | 초당 최대 GetAutomatedReasoningPolicyNextScenario API 요청 수입니다. | 
| (자동 추론) 초당 GetAutomatedReasoningPolicyTestCase 요청 | 지원되는 각 리전: 10개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7D9F04A9)  | 초당 최대 GetAutomatedReasoningPolicyTestCase API 요청 수입니다. | 
| (자동 추론) 초당 GetAutomatedReasoningPolicyTestResult 요청 | 지원되는 각 리전: 10개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8A686BB7)  | 초당 최대 GetAutomatedReasoningPolicyTestResult API 요청 수입니다. | 
| (자동 추론) 초당 ListAutomatedReasoningPolicies 요청 | 지원되는 각 리전: 5개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-99471E7A)  | 초당 최대 ListAutomatedReasoningPolicies API 요청 수입니다. | 
| (자동 추론) 초당 ListAutomatedReasoningPolicyBuildWorkflows 요청 | 지원되는 각 리전: 5개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-884C068A)  | 초당 최대 ListAutomatedReasoningPolicyBuildWorkflows API 요청 수입니다. | 
| (자동 추론) 초당 ListAutomatedReasoningPolicyTestCases 요청 | 지원되는 각 리전: 5개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5DD391B1)  | 초당 최대 ListAutomatedReasoningPolicyTestCases API 요청 수입니다. | 
| (자동 추론) 초당 ListAutomatedReasoningPolicyTestResults 요청 | 지원되는 각 리전: 5개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9D3DC9B2)  | 초당 최대 ListAutomatedReasoningPolicyTestResults API 요청 수입니다. | 
| (자동 추론) 계정당 정책 | 지원되는 각 리전: 100 | 아니요 | 한 계정의 최대 자동 추론 정책 수입니다. | 
| (자동 추론) 정책의 규칙 | 지원되는 각 리전: 500개 | 아니요 | 자동 추론 정책의 최대 규칙 수입니다. | 
| (자동 추론) 소스 문서 크기(MB) | 지원되는 각 리전: 5 | 아니요 | 자동 추론 정책을 생성하기 위한 최대 소스 문서 크기(MB)입니다. | 
| (자동 추론) 소스 문서 토큰 | 지원되는 각 리전: 122,880 | 아니요 | 자동 추론 정책을 생성할 때 소스 문서에 허용되는 최대 토큰 수입니다. | 
| (자동 추론) 초당 StartAutomatedReasoningPolicyBuildWorkflow 요청 | 각 지원되는 지역: 1 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B7BF1255)  | 초당 최대 StartAutomatedReasoningPolicyBuildWorkflow API 요청 수입니다. | 
| (자동 추론) 초당 StartAutomatedReasoningPolicyTestWorkflow 요청 | 각 지원되는 지역: 1 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-07D73971)  | 초당 최대 StartAutomatedReasoningPolicyTestWorkflow API 요청 수입니다. | 
| (자동 추론) 정책당 테스트 | 지원되는 각 리전: 100 | 아니요 | 자동 추론 정책당 최대 테스트 수입니다. | 
| (자동 추론) 정책당 유형 | 지원되는 각 리전: 50 | 아니요 | 자동 추론 정책의 최대 유형 수입니다. | 
| (자동 추론) 초당 UpdateAutomatedReasoningPolicy 요청 | 지원되는 각 리전: 5개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9EF56DA1)  | 초당 최대 UpdateAutomatedReasoningPolicy API 요청 수입니다. | 
| (자동 추론) 초당 UpdateAutomatedReasoningPolicyAnnotations 요청 | 지원되는 각 리전: 5개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F2DCFA42)  | 초당 최대 UpdateAutomatedReasoningPolicyAnnotations API 요청 수입니다. | 
| (자동 추론) 초당 UpdateAutomatedReasoningPolicyTestCase 요청 | 지원되는 각 리전: 5개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9D7C8A75)  | 초당 최대 UpdateAutomatedReasoningPolicyTestCase API 요청 수입니다. | 
| (자동 추론) 정책의 유형당 값 | 지원되는 각 리전: 50 | 아니요 | 자동 추론 정책에서 유형당 값의 최대 수입니다. | 
| (자동 추론) 정책의 변수 | 지원되는 각 리전: 200 | 아니요 | 자동 추론 정책의 최대 변수 수입니다. | 
| (자동 추론) 정책당 버전 | 지원되는 각 리전: 1,000 | 아니요 | 자동 추론 정책당 최대 버전 수입니다. | 
| (데이터 자동화) (콘솔) 최대 문서 파일 크기(MB) | 지원되는 각 리전: 200 | 아니요 | 콘솔의 최대 파일 크기 | 
| (데이터 자동화) (콘솔) 문서 파일당 최대 페이지 수 | 지원되는 각 리전: 20 | 아니요 | 콘솔에서 문서당 최대 페이지 수 | 
| (데이터 자동화) CreateBlueprint - 계정당 최대 블루프린트 수 | 지원되는 각 리전: 350 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-23CF4444)  | 계정당 최대 블루프린트 수 | 
| (데이터 자동화) CreateBlueprintVersion - 블루프린트당 최대 블루프린트 버전 수 | 지원되는 각 리전: 10개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-21EE8B55)  | 블루프린트당 최대 버전 수 | 
| (데이터 자동화) 필드의 설명 길이(문자) | 지원되는 각 리전: 300 | 아니요 | 필드의 최대 설명 길이(문자) | 
| (데이터 자동화) InvokeBlueprintOptimizationAsync - 최대 블루프린트 최적화 동시 작업 수 | 지원되는 각 리전: 3 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-54FAADA6)  | 블루프린트 최적화 비동기 열기 작업 호출의 최대 수 | 
| (데이터 자동화) InvokeBlueprintOptimizationAsync - 일일 최대 블루프린트 최적화 작업 수 | 지원되는 각 리전: 30개 | 아니요 | 일일 블루프린트 최적화 비동기 호출 작업의 최대 수 | 
| (데이터 자동화) InvokeDataAutomation(동기화) - 문서 - 최대 요청 수 | 지원되는 각 리전: 60개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8B289D99)  | 문서 양식의 분당 최대 InvokeDataAutomation 요청 수 | 
| (데이터 자동화) InvokeDataAutomation(동기화) - 이미지 - 최대 요청 수 | us-east-1: 200<br />us-west-2: 200<br />각각의 지원되는 다른 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-CF1B283E)  | 이미지 모달리티에 대한 분당 최대 InvokeDataAutomation 요청 수 | 
| (데이터 자동화) InvokeDataAutomationAsync - 오디오 - 최대 동시 작업 수 | us-east-1: 20<br />us-west-2: 20<br />각각의 지원되는 다른 리전: 2 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-3E961CAB)  | 오디오에 대해 열린 데이터 자동화 비동기 간접 호출 작업의 최대 수 | 
| (데이터 자동화) InvokeDataAutomationAsync - 문서 - 최대 동시 작업 수 | us-east-1: 25<br />us-west-2: 25<br />각각의 지원되는 다른 지역: 5 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9E3C255A)  | 문서에 대해 열린 데이터 자동화 비동기 간접 호출 작업의 최대 수 | 
| (데이터 자동화) InvokeDataAutomationAsync - 이미지 - 최대 동시 작업 수 | us-east-1: 20<br />us-west-2: 20<br />각각의 지원되는 다른 지역: 5 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-BDD176EF)  | 이미지에 대해 열린 데이터 자동화 비동기 간접 호출 작업의 최대 수 | 
| (데이터 자동화) InvokeDataAutomationAsync - 열린 작업의 최대 수 | 지원되는 각 리전: 1,800 | 아니요 | 이미지에 대해 열린 데이터 자동화 비동기 간접 호출 작업의 최대 수 | 
| (데이터 자동화) InvokeDataAutomationAsync - 비디오 - 최대 동시 작업 수 | us-east-1: 20<br />us-west-2: 20<br />지원되는 다른 각 리전: 3 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-895C7A6C)  | 비디오에 대해 열린 데이터 자동화 비동기 간접 호출 작업의 최대 수 | 
| (데이터 자동화) 최대 오디오 샘플 속도(Hz) | 지원되는 각 리전: 48,000 | 아니요 | 최대 오디오 샘플 속도 | 
| (데이터 자동화) 프로젝트당 최대 블루프린트(오디오) | 지원되는 각 리전: 1 | 아니요 | 오디오에 대한 프로젝트당 최대 블루프린트 수 | 
| (데이터 자동화) 프로젝트당 최대 블루프린트(문서) | 지원되는 각 리전: 40개 | 아니요 | 문서에 대한 프로젝트당 최대 블루프린트 수  | 
| (데이터 자동화) 프로젝트당 최대 블루프린트(이미지) | 지원되는 각 리전: 1 | 아니요 | 이미지에 대한 프로젝트당 최대 블루프린트 수 | 
| (데이터 자동화) 프로젝트당 최대 블루프린트(비디오) | 지원되는 각 리전: 1 | 아니요 | 비디오에 대한 프로젝트당 최대 블루프린트 수 | 
| (데이터 자동화) 최대 JSON 블루프린트 크기(문자) | 지원되는 각 리전: 100,000개 | 아니요 | JSON의 최대 크기(문자) | 
| (데이터 자동화) 필드 계층 구조의 최대 수준 | 지원되는 각 리전: 1 | 아니요 | 필드 계층 구조의 최대 수준 수 | 
| (데이터 자동화) 문서당 최대 페이지 수 | 지원되는 각 리전: 3,000 | 아니요 | 문서당 최대 페이지 수 | 
| (데이터 자동화) 최대 해상도 | 지원되는 각 리전: 8,000 | 아니요 | 이미지의 최대 해상도 | 
| (데이터 자동화) 최대 오디오 파일 크기(MB) | 지원되는 각 리전: 2,048개 | 아니요 | 오디오의 최대 파일 크기 | 
| (데이터 자동화) 최대 오디오 길이(분) | 지원되는 각 리전: 240 | 아니요 | 오디오의 최대 길이(분) | 
| (데이터 자동화) 최대 문서 파일 크기(MB) | 지원되는 각 리전: 500개 | 아니요 | 최대 파일 크기 | 
| (데이터 자동화) 최대 이미지 파일 크기(MB) | 지원되는 각 리전: 5 | 아니요 | 이미지의 최대 파일 크기 | 
| (데이터 자동화) 오디오 블루프린트의 최대 명령 필드 길이 - (문자) | 지원되는 각 리전: 500 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-00F9DD5C)  | 오디오 블루프린트에 대한 명령 필드의 최대 길이입니다. | 
| (데이터 자동화) 추론 시작 요청당 최대 블루프린트 수(오디오) | 지원되는 각 리전: 1 | 아니요 | 추론 시작 요청의 최대 인라인 블루프린트 수 | 
| (데이터 자동화) 추론 시작 요청당 최대 블루프린트 수(문서) | 지원되는 각 리전: 10 | 아니요 | 추론 시작 요청의 최대 인라인 블루프린트 수 | 
| (데이터 자동화) 추론 시작 요청당 최대 블루프린트 수(이미지) | 지원되는 각 리전: 1 | 아니요 | 추론 시작 요청의 최대 인라인 블루프린트 수 | 
| (데이터 자동화) 추론 시작 요청당 최대 블루프린트 수(비디오) | 지원되는 각 리전: 1 | 아니요 | 추론 시작 요청의 최대 인라인 블루프린트 수 | 
| (데이터 자동화) 블루프린트당 최대 목록 필드 수 | 지원되는 각 리전: 15 | 아니요 | 블루프린트당 최대 목록 필드 수 | 
| (데이터 자동화) 최대 비디오 파일 크기(MB) | 지원되는 각 리전: 10,240 | 아니요 | 비디오의 최대 파일 크기 | 
| (데이터 자동화) 최대 비디오 길이(분) | 지원되는 각 리전: 240 | 아니요 | 비디오의 최대 길이(분) | 
| (데이터 자동화) 최소 오디오 샘플 속도(Hz) | 지원되는 각 리전: 8,000 | 아니요 | 최소 오디오 샘플 속도 | 
| (데이터 자동화) 최소 오디오 길이(밀리초) | 지원되는 각 리전: 500개 | 아니요 | 오디오의 최소 길이(밀리초) | 
| (평가) 동시 자동 모델 평가 작업 수 | 지원되는 각 리전: 20 | 아니요 | 현재 리전의 이 계정에서 한 번에 지정할 수 있는 자동 모델 평가 작업의 최대 수입니다. | 
| (평가) 인간 작업자를 사용하는 동시 모델 평가 작업 수 | 지원되는 각 리전: 10 | 아니요 | 현재 리전의 이 계정에서 한 번에 지정할 수 있는 인간 작업자를 사용하는 모델 평가 작업의 최대 수입니다. | 
| (평가) 사용자 지정 지표 수 | 지원되는 각 리전: 10 | 아니요 | 인간 작업자를 사용하는 모델 평가 작업에서 지정할 수 있는 사용자 지정 지표의 최대 수입니다. | 
| (평가) 인적 기반 모델 평가 작업의 사용자 지정 프롬프트 데이터세트 수 | 지원되는 각 리전: 1 | 아니요 | 현재 리전에서 이 계정의 인적 기반 모델 평가 작업에서 지정할 수 있는 사용자 지정 프롬프트 데이터세트의 최대 수입니다. | 
| (평가) 작업당 데이터세트 수 | 지원되는 각 리전: 5 | 아니요 | 자동 모델 평가 작업에서 지정할 수 있는 최대 데이터세트 수입니다. 여기에는 사용자 지정 프롬프트 데이터세트와 기본 제공 프롬프트 데이터세트가 모두 포함됩니다. | 
| (평가) 평가 작업 수 | 지원되는 각 리전: 5,000개 | 아니요 | 현재 리전의 이 계정에서 생성할 수 있는 모델 평가의 최대 수입니다. | 
| (평가) 데이터세트당 지표 수 | 지원되는 각 리전: 3 | 아니요 | 자동 모델 평가 작업에서 데이터세트당 지정할 수 있는 최대 지표 수입니다. 여기에는 사용자 지정 지표와 기본 제공 지표가 모두 포함됩니다. | 
| (평가) 인간 작업자를 사용하는 모델 평가 작업의 모델 수 | 지원되는 각 리전: 2 | 아니요 | 인간 작업자를 사용하는 모델 평가 작업에서 지정할 수 있는 모델의 최대 수입니다. | 
| (평가) 자동 모델 평가 작업의 모델 수 | 지원되는 각 리전: 1 | 아니요 | 자동 모델 평가 작업에서 지정할 수 있는 최대 모델 수입니다. | 
| (평가) 사용자 지정 프롬프트 데이터세트의 프롬프트 수 | 지원되는 각 리전: 1,000 | 아니요 | 사용자 지정 프롬프트 데이터세트에 포함될 수 있는 최대 프롬프트 수입니다. | 
| (평가) 프롬프트 크기 | 지원되는 각 리전: 4 | 아니요 | 사용자 지정 프롬프트 데이터세트에서 개별 프롬프트의 최대 크기(KB)입니다. | 
| (평가) 작업자의 작업 시간 | 지원되는 각 리전: 30개 | 아니요 | 작업자가 작업을 완료하는 데 사용할 수 있는 최대 시간(일)입니다. | 
| (흐름) 흐름당 에이전트 노드 | 지원되는 각 리전: 20 | 아니요 | 최대 에이전트 노드 수입니다. | 
| (흐름) 흐름당 수집기 노드 | 지원되는 각 리전: 1 | 아니요 | 최대 수집기 노드 수입니다. | 
| (흐름) 흐름당 조건 노드 | 지원되는 각 리전: 5 | 아니요 | 최대 조건 노드 수입니다. | 
| (흐름) 조건 노드당 조건 | 지원되는 각 리전: 5 | 아니요 | 조건 노드당 최대 조건 수입니다. | 
| (흐름) 초당 CreateFlow 요청 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 CreateFlow 요청 수입니다. | 
| (흐름) 초당 CreateFlowAlias 요청 수 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 CreateFlowAlias 요청 수입니다. | 
| (흐름) 초당 CreateFlowVersion 요청 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 CreateFlowVersion 요청 수입니다. | 
| (흐름) 초당 DeleteFlow 요청 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 DeleteFlow 요청 수입니다. | 
| (흐름) 초당 DeleteFlowAlias 요청 수 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 DeleteFlowAlias 요청 수입니다. | 
| (흐름) 초당 DeleteFlowVersion 요청 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 DeleteFlowVersion 요청 수입니다. | 
| (흐름) 흐름당 흐름 별칭 | 지원되는 각 리전: 10 | 아니요 | 최대 흐름 별칭 수입니다. | 
| (흐름) 계정당 흐름 실행 | 지원되는 각 리전: 1,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F1613626)  | 계정당 최대 흐름 실행 수입니다. | 
| (흐름) 흐름당 흐름 버전 | 지원되는 각 리전: 10 | 아니요 | 최대 흐름 버전 수입니다. | 
| (흐름) 계정당 흐름 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D321719B)  | 계정당 최대 흐름 수입니다. | 
| (흐름) 초당 GetFlow 요청 | 지원되는 각 리전: 10 | 아니요 | 초당 최대 GetFlow 요청 수입니다. | 
| (흐름) 초당 GetFlowAlias 요청 | 지원되는 각 리전: 10 | 아니요 | 초당 최대 GetFlowAlias 요청 수입니다. | 
| (흐름) 초당 GetFlowVersion 요청 | 지원되는 각 리전: 10 | 아니요 | 초당 최대 GetFlowVersion 요청 수입니다. | 
| (흐름) 흐름당 인라인 코드 노드 | 지원되는 각 리전: 5 | 아니요 | 흐름당 최대 인라인 코드 노드 수입니다. | 
| (흐름) 흐름당 입력 노드 | 지원되는 각 리전: 1 | 아니요 | 최대 흐름 입력 노드 수입니다. | 
| (흐름) 흐름당 반복기 노드 | 지원되는 각 리전: 1 | 아니요 | 최대 반복기 노드 수입니다. | 
| (흐름) 흐름당 지식 기반 노드 | 지원되는 각 리전: 20 | 아니요 | 최대 지식 기반 노드 수입니다. | 
| (흐름) 흐름당 Lambda 함수 노드 | 지원되는 각 리전: 20 | 아니요 | 최대 Lambda 함수 노드 수입니다. | 
| (흐름) 흐름당 Lex 노드 | 지원되는 각 리전: 5 | 아니요 | 최대 Lex 노드 수입니다. | 
| (흐름) 초당 ListFlowAliases 요청 | 지원되는 각 리전: 10 | 아니요 | 초당 최대 ListFlowAliases 요청 수입니다. | 
| (흐름) 초당 ListFlowVersions 요청 | 지원되는 각 리전: 10 | 아니요 | 초당 최대 ListFlowVersions 요청 수입니다. | 
| (흐름) 초당 ListFlows 요청 | 지원되는 각 리전: 10 | 아니요 | 초당 최대 ListFlows 요청 수입니다. | 
| (흐름) 흐름당 출력 노드 | 지원되는 각 리전: 20 | 아니요 | 최대 흐름 출력 노드 수입니다. | 
| (흐름) 초당 PrepareFlow 요청 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 PrepareFlow 요청 수입니다. | 
| (흐름) 흐름당 프롬프트 노드 | 지원되는 각 리전: 20개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-0F2A24D7)  | 최대 프롬프트 노드 수입니다. | 
| (흐름) 흐름당 S3 검색 노드 | 지원되는 각 리전: 10 | 아니요 | 최대 S3 검색 노드 수입니다. | 
| (흐름) 흐름당 S3 스토리지 노드 | 지원되는 각 리전: 10 | 아니요 | 최대 S3 스토리지 노드 수입니다. | 
| (흐름) 흐름당 총 노드 | 지원되는 각 리전: 40개 | 아니요 | 흐름의 최대 노드 수입니다. | 
| (흐름) 초당 UpdateFlow 요청 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 UpdateFlow 요청 수입니다. | 
| (흐름) 초당 UpdateFlowAlias 요청 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 UpdateFlowAlias 요청 수입니다. | 
| (흐름) 초당 ValidateFlowDefinition 요청 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 ValidateFlowDefinition 요청 수입니다. | 
| (가드레일) 가드레일당 자동 추론 정책 | 지원되는 각 리전: 2 | 아니요 | 가드레일당 최대 자동 추론 정책 수입니다. | 
| (가드레일) 컨텍스트 근거 쿼리 길이(텍스트 단위) | 지원되는 각 리전: 1 | 아니요 | 컨텍스트 근거에 대한 쿼리의 최대 길이(텍스트 단위) | 
| (가드레일) 컨텍스트 근거 응답 길이(텍스트 단위) | 지원되는 각 리전: 5 | 아니요 | 컨텍스트 근거에 대한 응답의 최대 길이(텍스트 단위) | 
| (가드레일) 컨텍스트 근거 소스 길이(텍스트 단위) | us-east-1: 100<br />us-west-2: 100<br />각각의 지원되는 다른 리전: 50 | 아니요 | 컨텍스트 근거에 대한 근거 소스의 최대 길이(텍스트 단위) | 
| (가드레일) 주제당 예제 문구 | 지원되는 각 리전: 5 | 아니요 | 주제당 포함할 수 있는 최대 주제 예제 수 | 
| (가드레일) 계정당 가드레일 | 지원되는 각 리전: 100 | 아니요 | 계정의 최대 가드레일 수 | 
| (가드레일) 온디맨드 ApplyGuardrail 콘텐츠 필터 정책 초당 텍스트 단위 | us-east-1: 200<br />us-west-2: 200<br />각각의 지원되는 다른 리전: 25 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-01F3CD81)  | 콘텐츠 필터 정책에 대해 초당 처리할 수 있는 최대 텍스트 단위 수 | 
| (가드레일) 온디맨드 ApplyGuardrail 콘텐츠 필터 정책 초당 텍스트 단위(표준) | us-east-1: 200<br />us-east-2: 200<br />us-west-1: 200<br />us-west-2: 200<br />ap-northeast-1: 50<br />ap-northeast-2: 100<br />ap-south-1: 50<br />ap-southeast-1: 100<br />eu-central-1: 50<br />각각의 지원되는 다른 리전: 25 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-6B3D3DE4)  | 콘텐츠 필터 정책에 대해 초당 처리할 수 있는 최대 텍스트 단위 수입니다. 이는 표준 콘텐츠 정책 모델에 적용됩니다. | 
| (가드레일) 온디맨드 ApplyGuardrail 거부된 주제 정책 초당 텍스트 단위 | us-east-1: 50<br />us-west-2: 50<br />각각의 지원되는 다른 리전: 25 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-124DCF3D)  | 거부된 주제 정책에 대해 초당 처리할 수 있는 최대 텍스트 단위 수 | 
| (가드레일) 온디맨드 ApplyGuardrail 거부된 주제 정책 초당 텍스트 단위(표준) | us-east-1: 200<br />us-west-2: 200<br />각각의 지원되는 다른 리전: 25 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5755FAB6)  | 거부된 주제 정책에 대해 초당 처리할 수 있는 최대 텍스트 단위 수입니다. 이는 표준 주제 정책 모델에 적용됩니다. | 
| (가드레일) 온디맨드 ApplyGuardrail 민감한 정보 필터 정책 초당 텍스트 단위 | us-east-1: 500<br />us-east-2: 100<br />us-west-1: 50<br />us-west-2: 500<br />ap-northeast-1: 500<br />ap-northeast-2: 100<br />ap-south-1: 200<br />ap-southeast-1: 100<br />eu-central-1: 500<br />각각의 지원되는 다른 리전: 25 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-CFCAAB0E)  | 민감한 정보 필터 정책에 대해 초당 처리할 수 있는 최대 텍스트 단위 수 | 
| (가드레일) 온디맨드 ApplyGuardrail 단어 필터 정책 초당 텍스트 단위 | us-east-1: 500<br />us-east-2: 500<br />us-west-1: 500<br />us-west-2: 500<br />ap-northeast-1: 500<br />ap-northeast-2: 500<br />ap-south-1: 500<br />ap-southeast-1: 500<br />eu-central-1: 500<br />각각의 지원되는 다른 리전: 25 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9F4DB459)  | 단어 필터 정책에 대해 초당 처리할 수 있는 최대 텍스트 단위 수 | 
| (가드레일) 온디맨드 ApplyGuardrail 컨텍스트 근거 정책 초당 텍스트 단위 | 지원되는 각 리전: 106 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-086556D1)  | 컨텍스트 근거 정책에 대해 초당 처리할 수 있는 최대 텍스트 단위 수 | 
| (가드레일) 초당 온디맨드 ApplyGuardrail 요청 | us-east-1: 100<br />us-east-2: 100<br />us-west-1: 100<br />us-west-2: 100<br />ap-northeast-1: 100<br />ap-northeast-2: 100<br />ap-south-1: 100<br />ap-southeast-1: 100<br />eu-central-1: 100<br />각각의 지원되는 다른 리전: 25 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9072D6F0)  | 초당 허용되는 최대 ApplyGuardrail API 직접 호출 수 | 
| (가드레일) 민감한 정보 필터의 정규식 엔터티 | me-central-1: 10<br />지원되는 다른 각 리전: 30 | 아니요 | 민감한 정보 정책에 포함할 수 있는 가드레일 필터 정규식의 최대 수 | 
| (가드레일) 정규식 길이(문자) | 지원되는 각 리전: 500개 | 아니요 | 가드레일 필터 정규식의 최대 길이(문자) | 
| (가드레일) 가드레일당 주제 | 지원되는 각 리전: 30개 | 아니요 | 가드레일 주제 정책 전체에서 정의할 수 있는 최대 주제 수 | 
| (가드레일) 가드레일당 버전 | 지원되는 각 리전: 20 | 아니요 | 가드레일이 사용할 수 있는 최대 버전 수 | 
| (가드레일) 단어 길이(문자) | 지원되는 각 리전: 100 | 아니요 | 차단된 단어 목록에서 단어의 최대 길이(문자) | 
| (가드레일) 단어 정책당 단어 | 지원되는 각 리전: 10,000개 | 아니요 | 차단된 단어 목록에 포함할 수 있는 최대 단어 수 | 
| (지식 기반) 계정당 동시 IngestKnowledgeBaseDocuments 및 DeleteKnowledgeBaseDocuments 요청 | 지원되는 각 리전: 10 | 아니요 | 계정에서 동시에 실행할 수 있는 IngestKnowledgeBaseDocuments 및 DeleteKnowledgeBaseDocuments 요청의 최대 수입니다. | 
| (지식 기반) 계정당 동시 수집 작업 | 지원되는 각 리전: 5 | 아니요 | 계정에서 동시에 실행할 수 있는 최대 수집 작업 수입니다. | 
| (지식 기반) 데이터 소스당 동시 수집 작업 | 지원되는 각 리전: 1 | 아니요 | 데이터 소스에서 동시에 실행할 수 있는 최대 수집 작업 수입니다. | 
| (지식 기반) 지식 기반당 동시 수집 작업 | 지원되는 각 리전: 1 | 아니요 | 지식 기반에서 동시에 실행할 수 있는 최대 수집 작업 수입니다. | 
| (지식 기반) 초당 CreateDataSource 요청 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 CreateDataSource API 요청 수입니다. | 
| (지식 기반) 초당 CreateKnowledgeBase 요청 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 CreateKnowledgeBase API 요청 수입니다. | 
| (지식 기반) 지식 기반당 데이터 소스 | 지원되는 각 리전: 5 | 아니요 | 지식 기반당 최대 데이터 소스 수입니다. | 
| (지식 기반) 초당 DeleteDataSource 요청 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 DeleteDataSource API 요청 수입니다. | 
| (지식 기반) 초당 DeleteKnowledgeBase 요청 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 DeleteKnowledgeBase API 요청 수입니다. | 
| (지식 기반) 초당 DeleteKnowledgeBaseDocuments 요청 | 지원되는 각 리전: 5 | 아니요 | 초당 최대 DeleteKnowledgeBaseDocuments API 요청 수입니다. | 
| (지식 기반) 수집 작업당 추가 또는 업데이트할 파일 | 지원되는 각 리전: 5,000,000 | 아니요 | 수집 작업당 수집할 수 있는 신규 및 업데이트된 파일의 최대 수입니다. | 
| (지식 기반) 수집 작업당 삭제할 파일 | 지원되는 각 리전: 5,000,000 | 아니요 | 수집 작업당 삭제할 수 있는 최대 파일 수입니다. | 
| (지식 기반) IngestKnowledgeBaseDocuments 작업당 수집할 파일 | 지원되는 각 리전: 25 | 아니요 | IngestKnowledgeBaseDocuments 요청당 수집할 수 있는 최대 문서 수입니다. | 
| (지식 기반) 초당 GenerateQuery 요청 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 GenerateQuery API 요청 수입니다. | 
| (지식 기반) 초당 GetDataSource 요청 | 지원되는 각 리전: 10 | 아니요 | 초당 최대 GetDataSource API 요청 수입니다. | 
| (지식 기반) 초당 GetIngestionJob 요청 | 지원되는 각 리전: 10 | 아니요 | 초당 최대 GetIngestionJob API 요청 수입니다. | 
| (지식 기반) 초당 GetKnowledgeBase 요청 | 지원되는 각 리전: 10 | 아니요 | 초당 최대 GetKnowledgeBase API 요청 수입니다. | 
| (지식 기반) 초당 GetKnowledgeBaseDocuments 요청 | 지원되는 각 리전: 5 | 아니요 | 초당 최대 GetKnowledgeBaseDocuments API 요청 수입니다. | 
| (지식 기반) 초당 IngestKnowledgeBaseDocuments 요청 | 지원되는 각 리전: 5 | 아니요 | 초당 최대 IngestKnowledgeBaseDocuments API 요청 수입니다. | 
| (지식 기반) IngestKnowledgeBaseDocuments 총 페이로드 크기 | 지원되는 각 리전: 6개 | 아니요 | IngestKnowledgeBaseDocuments 요청에서 총 페이로드의 최대 크기(MB)입니다. | 
| (지식 기반) 텍스트 콘텐츠가 포함된 수집 작업 파일 크기 | 지원되는 각 리전: 50 | 아니요 | 수집 작업에서 텍스트 콘텐츠(예: .txt, .pdf 또는 .docx 파일)가 있는 파일의 최대 크기(MB). | 
| (지식 기반) 수집 작업 크기 | 지원되는 각 리전: 100 | 아니요 | 수집 작업의 최대 크기(GB)입니다. | 
| (지식 기반) 계정당 지식 기반 | 지원되는 각 리전: 100 | 아니요 | 계정당 최대 지식 기반 수입니다. | 
| (지식 기반) 초당 ListDataSources 요청 | 지원되는 각 리전: 10 | 아니요 | 초당 최대 ListDataSources API 요청 수입니다. | 
| (지식 기반) 초당 ListIngestionJobs 요청 | 지원되는 각 리전: 10 | 아니요 | 초당 최대 ListIngestionJobs API 요청 수입니다. | 
| (지식 기반) 초당 ListKnowledgeBaseDocuments 요청 | 지원되는 각 리전: 5 | 아니요 | 초당 최대 ListKnowledgeBaseDocuments API 요청 수입니다. | 
| (지식 기반) 초당 ListKnowledgeBases 요청 | 지원되는 각 리전: 10 | 아니요 | 초당 최대 ListKnowledgeBases API 요청 수입니다. | 
| (지식 기반) BDA 파서의 최대 파일 수 | 지원되는 각 리전: 1,000 | 아니요 | Amazon Bedrock Data Automation을 파서로 사용할 수 있는 최대 파일 수입니다. | 
| (지식 기반) 파운데이션 모델을 파서로 사용할 수 있는 최대 파일 수 | 지원되는 각 리전: 1,000 | 아니요 | 파운데이션 모델을 파서로 사용할 수 있는 최대 파일 수입니다. | 
| (지식 기반) 초당 Rerank 요청 | 지원되는 각 리전: 10 | 아니요 | 초당 최대 Rerank API 요청 수입니다. | 
| (지식 기반) 초당 Retrieve 요청 | 지원되는 각 리전: 20 | 아니요 | 초당 최대 Retrieve API 요청 수입니다. | 
| (지식 기반) 초당 RetrieveAndGenerate 요청 | 지원되는 각 리전: 20 | 아니요 | 초당 최대 RetrieveAndGenerate API 요청 수입니다. | 
| (지식 기반) 초당 RetrieveAndGenerateStream 요청 | 지원되는 각 리전: 20 | 아니요 | 초당 최대 RetrieveAndGenerateStream API 요청 수입니다. | 
| (지식 기반) 초당 StartIngestionJob 요청 | 지원되는 각 리전: 0.1 | 아니요 | 초당 최대 StartIngestionJob API 요청 수입니다. | 
| (지식 기반) 초당 UpdateDataSource 요청 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 UpdateDataSource API 요청 수입니다. | 
| (지식 기반) 초당 UpdateKnowledgeBase 요청 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 UpdateKnowledgeBase API 요청 수입니다. | 
| (지식 기반) 사용자 쿼리 크기 | 지원되는 각 리전: 1,000 | 아니요 | 사용자 쿼리의 최대 크기(문자)입니다. | 
| (모델 사용자 지정) 계정당 사용자 지정 모델 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-CB5B847D)  | 한 계정의 최대 사용자 지정 모델 수입니다. | 
| (모델 사용자 지정) 진행 중인 사용자 지정 모델 배포 | 지원되는 각 지역: 2 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-430C95DD)  | 진행 중인 사용자 지정 모델 배포의 최대 수 | 
| (모델 사용자 지정) 증류 사용자 지정 작업의 최대 입력 파일 크기 | 지원되는 각 리전: 2개기가바이트 | 아니요 | 증류 사용자 지정 작업의 최대 입력 파일 크기입니다. | 
| (모델 사용자 지정) 증류 사용자 지정 작업의 최대 줄 길이 | 지원되는 각 리전: 16KB | 아니요 | 증류 사용자 지정 작업을 위한 입력 파일의 최대 줄 길이입니다. | 
| (모델 사용자 지정) 증류 사용자 지정 작업의 최대 프롬프트 수 | 지원되는 각 리전: 15,000개 | 아니요 | 증류 사용자 지정 작업에 필요한 최대 프롬프트 수입니다. | 
| (모델 사용자 지정) Amazon Nova Canvas 미세 조정 작업의 최대 훈련 레코드 수 | 지원되는 각 리전: 10,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D3D1200C)  | Amazon Nova Canvas 미세 조정 작업에 허용되는 최대 레코드 수입니다. | 
| (모델 사용자 지정) Amazon Nova Micro V1 증류 사용자 지정 작업의 최대 학생 모델 미세 조정 컨텍스트 길이 | 지원되는 각 리전: 32,000 | 아니요 | Amazon Nova Micro V1 증류 사용자 지정 작업의 최대 학생 모델 미세 조정 컨텍스트 길이입니다. | 
| (모델 사용자 지정) Amazon Nova V1 증류 사용자 지정 작업의 최대 학생 모델 미세 조정 컨텍스트 길이 | 지원되는 각 리전: 32,000 | 아니요 | Amazon Nova V1 증류 사용자 지정 작업의 최대 학생 모델 미세 조정 컨텍스트 길이입니다. | 
| (모델 사용자 지정) Anthropic Claude 3 haiku 20240307 V1 증류 사용자 지정 작업의 최대 학생 모델 미세 조정 컨텍스트 길이 | 지원되는 각 리전: 32,000 | 아니요 | Anthropic Claude 3 haiku 20240307 V1 증류 사용자 지정 작업의 최대 학생 모델 미세 조정 컨텍스트 길이입니다. | 
| (모델 사용자 지정) Llama 3.1 70B Instruct V1 증류 사용자 지정 작업의 최대 학생 모델 미세 조정 컨텍스트 길이 | 지원되는 각 리전: 16,000 | 아니요 | Llama 3.1 70B Instruct V1 증류 사용자 지정 작업의 최대 학생 모델 미세 조정 컨텍스트 길이입니다. | 
| (모델 사용자 지정) Llama 3.1 8B Instruct V1 증류 사용자 지정 작업의 최대 학생 모델 미세 조정 컨텍스트 길이 | 지원되는 각 리전: 32,000 | 아니요 | Llama 3.1 8B Instruct V1 증류 사용자 지정 작업의 최대 학생 모델 미세 조정 컨텍스트 길이입니다. | 
| (모델 사용자 지정) 증류 사용자 지정 작업의 최소 프롬프트 수 | 지원되는 각 리전: 100 | 아니요 | 증류 사용자 지정 작업에 필요한 최소 프롬프트 수입니다. | 
| (모델 사용자 지정) 예약된 사용자 지정 작업 | 지원되는 각 리전: 10 | 아니요 | 예약된 사용자 지정 작업의 최대 수입니다. | 
| (모델 사용자 지정) Amazon Nova 2 Lite에 대한 분당 온디맨드 사용자 지정 모델 배포 요청의 합계 | 지원되는 각 리전: 2,000 | 아니요 | Amazon Nova 2 Lite에 대한 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 제출된 분당 입력 및 출력 온디맨드 사용자 지정 모델 배포 요청의 합계 | 
| (모델 사용자 지정) Amazon Nova Lite에서 분당 온디맨드 사용자 지정 모델 배포 요청의 합계 | 지원되는 각 리전: 2,000 | 아니요 | Amazon Nova Lite에서 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 제출된 분당 입력 및 출력 온디맨드 사용자 지정 모델 배포 요청의 합계 | 
| (모델 사용자 지정) Amazon Nova Micro에서 분당 온디맨드 사용자 지정 모델 배포 요청의 합계 | 지원되는 각 리전: 2,000 | 아니요 | Amazon Nova Micro에서 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 제출된 분당 입력 및 출력 온디맨드 사용자 지정 모델 배포 요청의 합계 | 
| (모델 사용자 지정) Amazon Nova Pro에서 분당 온디맨드 사용자 지정 모델 배포 요청의 합계 | 지원되는 각 리전: 200 | 아니요 | Amazon Nova Pro에서 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 제출된 분당 입력 및 출력 온디맨드 사용자 지정 모델 배포 요청의 합계 | 
| (모델 사용자 지정) Meta Llama 3.3 70B Instruct에서 분당 온디맨드 사용자 지정 모델 배포 요청의 합계 | 지원되는 각 리전: 400 | 아니요 | Meta Llama 3.3 70B Instruct에서 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 제출된 분당 입력 및 출력 온디맨드 사용자 지정 모델 배포 요청의 합계 | 
| (모델 사용자 지정) Amazon Nova 2 Lite에 대한 온디맨드 사용자 지정 모델 배포 토큰의 일일 합계 | 지원되는 각 리전: 5,760,000,000 | 아니요 | Amazon Nova 2 Lite에 대한 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 제출된 일일 입력 및 출력 온디맨드 사용자 지정 모델 배포 토큰의 합계 | 
| (모델 사용자 지정) Amazon Nova Lite에서 일일 온디맨드 사용자 지정 모델 배포 토큰의 합계 | 지원되는 각 리전: 5,760,000,000 | 아니요 | Amazon Nova Lite에서 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 제출된 일일 입력 및 출력 온디맨드 사용자 지정 모델 배포 토큰의 합계 | 
| (모델 사용자 지정) Amazon Nova Micro에서 일일 온디맨드 사용자 지정 모델 배포 토큰의 합계 | 지원되는 각 리전: 5,760,000,000 | 아니요 | Amazon Nova Micro에서 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 제출된 일일 입력 및 출력 온디맨드 사용자 지정 모델 배포 토큰의 합계 | 
| (모델 사용자 지정) Amazon Nova Pro에서 일일 온디맨드 사용자 지정 모델 배포 토큰의 합계 | 지원되는 각 리전: 1,152,000,000 | 아니요 | Amazon Nova Pro에서 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 제출된 일일 입력 및 출력 온디맨드 사용자 지정 모델 배포 토큰의 합계 | 
| (모델 사용자 지정) Meta Llama 3.3 70B Instruct에서 일일 온디맨드 사용자 지정 모델 배포 토큰의 합계 | 지원되는 각 리전: 432,000,000 | 아니요 | Meta Llama 3.3 70B Instruct에서 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 제출된 일일 입력 및 출력 온디맨드 사용자 지정 모델 배포 토큰의 합계 | 
| (모델 사용자 지정) Amazon Nova 2 Lite에 대한 분당 온디맨드 사용자 지정 모델 배포 토큰의 합계 | 지원되는 각 리전: 4,000,000 | 아니요 | Amazon Nova 2 Lite에 대한 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 제출된 분당 입력 및 출력 온디맨드 사용자 지정 모델 배포 토큰의 합계 | 
| (모델 사용자 지정) Amazon Nova Lite에서 분당 온디맨드 사용자 지정 모델 배포 토큰의 합계 | 지원되는 각 리전: 4,000,000 | 아니요 | Amazon Nova Lite에서 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 제출된 분당 입력 및 출력 온디맨드 사용자 지정 모델 배포 토큰의 합계 | 
| (모델 사용자 지정) Amazon Nova Micro에서 분당 온디맨드 사용자 지정 모델 배포 토큰의 합계 | 지원되는 각 리전: 4,000,000 | 아니요 | Amazon Nova Micro에서 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 제출된 분당 입력 및 출력 온디맨드 사용자 지정 모델 배포 토큰의 합계 | 
| (모델 사용자 지정) Amazon Nova Pro에서 분당 온디맨드 사용자 지정 모델 배포 토큰의 합계 | 지원되는 각 리전: 800,000 | 아니요 | Amazon Nova Pro에서 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 제출된 분당 입력 및 출력 온디맨드 사용자 지정 모델 배포 토큰의 합계 | 
| (모델 사용자 지정) Meta Llama 3.3 70B Instruct에서 분당 온디맨드 사용자 지정 모델 배포 토큰의 합계 | 지원되는 각 지역: 300,000 | 아니요 | Meta Llama 3.3 70B Instruct에서 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 제출된 분당 입력 및 출력 온디맨드 사용자 지정 모델 배포 토큰의 합계 | 
| (모델 사용자 지정) Amazon Nova 2 Lite 미세 조정 작업에 대한 훈련 및 검증 레코드의 합계 | 지원되는 각 리전: 20개,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-82EE9228)  | Amazon Nova 2 Lite 미세 조정 작업에 허용되는 훈련 및 검증 레코드의 최대 합계 수입니다. | 
| (모델 사용자 지정) Amazon Nova Lite 미세 조정 작업에서 훈련 및 검증 레코드의 합계 | 지원되는 각 리전: 20개,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-031F46A7)  | Amazon Nova Lite 미세 조정 작업에 허용되는 훈련 및 검증 레코드의 최대 합산 수입니다. | 
| (모델 사용자 지정) Amazon Nova Micro 미세 조정 작업에서 훈련 및 검증 레코드의 합계 | 지원되는 각 리전: 20개,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-EC6A6ABC)  | Amazon Nova Micro 미세 조정 작업에 허용되는 훈련 및 검증 레코드의 최대 합산 수입니다. | 
| (모델 사용자 지정) Amazon Nova Pro 미세 조정 작업에서 훈련 및 검증 레코드의 합계 | 지원되는 각 리전: 20개,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-70FC4C0E)  | Amazon Nova Pro 미세 조정 작업에 허용되는 훈련 및 검증 레코드의 최대 합산 수입니다. | 
| (모델 사용자 지정) Claude 3 Haiku v1 미세 조정 작업에서 훈련 및 검증 레코드의 합계 | 지원되는 각 리전: 10,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-679179D2)  | Claude 3 Haiku 미세 조정 작업에 허용되는 훈련 및 검증 레코드의 최대 합산 수입니다. | 
| (모델 사용자 지정) Claude 3-5-Haiku v1 미세 조정 작업에서 훈련 및 검증 레코드의 합계 | 지원되는 각 리전: 10,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-ADA98D8D)  | Claude 3-5-Haiku 미세 조정 작업에 허용되는 훈련 및 검증 레코드의 최대 합산 수입니다. | 
| (모델 사용자 지정) Meta Llama 2 13B v1 미세 조정 작업에서 훈련 및 검증 레코드의 합계 | 지원되는 각 리전: 10,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-68AE6C02)  | Meta Llama 2 13B 미세 조정 작업에 허용되는 훈련 및 검증 레코드의 최대 합산 수입니다. | 
| (모델 사용자 지정) Meta Llama 2 70B v1 미세 조정 작업에서 훈련 및 검증 레코드의 합계 | 지원되는 각 리전: 10,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5A222661)  | Meta Llama 2 70B 미세 조정 작업에 허용되는 훈련 및 검증 레코드의 최대 합산 수입니다. | 
| (모델 사용자 지정) Meta Llama 3.1 70B Instruct v1 미세 조정 작업에서 훈련 및 검증 레코드의 합계 | 지원되는 각 리전: 10,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-63EC9D04)  | Meta Llama 3.1 70B Instruct 미세 조정 작업에 허용되는 훈련 및 검증 레코드의 최대 합산 수입니다. | 
| (모델 사용자 지정) Meta Llama 3.1 8B Instruct v1 미세 조정 작업에서 훈련 및 검증 레코드의 합계 | 지원되는 각 리전: 10,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-34C933D1)  | Meta Llama 3.1 8B Instruct 미세 조정 작업에 허용되는 훈련 및 검증 레코드의 최대 합산 수입니다. | 
| (모델 사용자 지정) Meta Llama 3.2 11B Instruct v1 미세 조정 작업에서 훈련 및 검증 레코드의 합계 | 지원되는 각 리전: 10,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E5FD5C04)  | Meta Llama 3.2 11B Instruct 미세 조정 작업에 허용되는 훈련 및 검증 레코드의 최대 합산 수입니다. | 
| (모델 사용자 지정) Meta Llama 3.2 1B Instruct v1 미세 조정 작업에서 훈련 및 검증 레코드의 합계 | 지원되는 각 리전: 10,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-70B8359C)  | Meta Llama 3.2 1B Instruct 미세 조정 작업에 허용되는 훈련 및 검증 레코드의 최대 합산 수입니다. | 
| (모델 사용자 지정) Meta Llama 3.2 3B Instruct v1 미세 조정 작업에서 훈련 및 검증 레코드의 합계 | 지원되는 각 리전: 10,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-75A18A04)  | Meta Llama 3.2 3B Instruct 미세 조정 작업에 허용되는 훈련 및 검증 레코드의 최대 합산 수입니다. | 
| (모델 사용자 지정) Meta Llama 3.2 90B Instruct v1 미세 조정 작업에서 훈련 및 검증 레코드의 합계 | 지원되는 각 리전: 10,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8076814C)  | Meta Llama 3.2 90B Instruct 미세 조정 작업에 허용되는 훈련 및 검증 레코드의 최대 합산 수입니다. | 
| (모델 사용자 지정) Meta Llama 3.3 70B Instruct v1 미세 조정 작업에서 훈련 및 검증 레코드의 합계 | 지원되는 각 리전: 10,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-48C95F85)  | Meta Llama 3.3 70B Instruct 미세 조정 작업에 허용되는 훈련 및 검증 레코드의 최대 합산 수입니다. | 
| (모델 사용자 지정) Titan Image Generator G1 V1 미세 조정 작업에서 훈련 및 검증 레코드의 합계 | 지원되는 각 리전: 10,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-73BBA086)  | Titan Image Generator 미세 조정 작업에 허용되는 훈련 및 검증 레코드의 최대 합산 수입니다. | 
| (모델 사용자 지정) Titan Image Generator G1 V2 미세 조정 작업에서 훈련 및 검증 레코드의 합계 | 지원되는 각 리전: 10,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F15FCC01)  | Titan Image Generator V2 미세 조정 작업에 허용되는 훈련 및 검증 레코드의 최대 합산 수입니다. | 
| (모델 사용자 지정) Titan Multimodal Embeddings G1 v1 미세 조정 작업에서 훈련 및 검증 레코드의 합계 | 지원되는 각 리전: 50,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-BB313AA3)  | Titan Multimodal Embeddings 미세 조정 작업에 허용되는 훈련 및 검증 레코드의 최대 합산 수입니다. | 
| (모델 사용자 지정) Titan Text G1 - Express v1 지속적인 사전 훈련 작업에서 훈련 및 검증 레코드의 합계 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-CDD9DC4A)  | Titan Text Express 지속적인 사전 훈련 작업에 허용되는 훈련 및 검증 레코드의 최대 합산 수입니다. | 
| (모델 사용자 지정) Titan Text G1 - Express v1 미세 조정 작업에서 훈련 및 검증 레코드의 합계 | 지원되는 각 리전: 10,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-79BA683B)  | Titan Text Express 미세 조정 작업에 허용되는 훈련 및 검증 레코드의 최대 합산 수입니다. | 
| (모델 사용자 지정) Titan Text G1 - Lite v1 지속적인 사전 훈련 작업에서 훈련 및 검증 레코드의 합계 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-91554672)  | Titan Text Lite 지속적인 사전 훈련 작업에 허용되는 훈련 및 검증 레코드의 최대 합산 수입니다. | 
| (모델 사용자 지정) Titan Text G1 - Lite v1 미세 조정 작업에서 훈련 및 검증 레코드의 합계 | 지원되는 각 리전: 10,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-3B82104D)  | Titan Text Lite 미세 조정 작업에 허용되는 훈련 및 검증 레코드의 최대 합산 수입니다. | 
| (모델 사용자 지정) Titan Text G1 - Premier v1 미세 조정 작업에서 훈련 및 검증 레코드의 합계 | 지원되는 각 리전: 20개,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C0CACF50)  | Titan Text Premier 미세 조정 작업에 허용되는 훈련 및 검증 레코드의 최대 합산 수입니다. | 
| (모델 사용자 지정) 총 사용자 지정 모델 배포 수 | 지원되는 각 리전: 10개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1EF80F3E)  | 총 사용자 지정 모델 배포 수 | 
| (프롬프트 관리) 초당 CreatePrompt 요청 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 CreatePrompt 요청 수입니다. | 
| (프롬프트 관리) 초당 CreatePromptVersion 요청 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 CreatePromptVersion 요청 수입니다. | 
| (프롬프트 관리) 초당 DeletePrompt 요청 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 DeletePrompt 요청 수입니다. | 
| (프롬프트 관리) 초당 GetPrompt 요청 | 지원되는 각 리전: 10 | 아니요 | 초당 최대 GetPrompt 요청 수입니다. | 
| (프롬프트 관리) 초당 ListPrompts 요청 | 지원되는 각 리전: 10 | 아니요 | 초당 최대 ListPrompts 요청 수입니다. | 
| (프롬프트 관리) 계정당 프롬프트 | 지원되는 각 리전: 500 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B783C50B)  | 최대 프롬프트 수입니다. | 
| (프롬프트 관리) 초당 UpdatePrompt 요청 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 UpdatePrompt 요청 수입니다. | 
| (프롬프트 관리) 프롬프트당 버전 | 지원되는 각 리전: 10 | 아니요 | 프롬프트당 최대 버전 수입니다. | 
| 에이전트당 API | 지원되는 각 리전: 11 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-6B2DA87E)  | 에이전트에 추가할 수 있는 최대 API 수입니다. | 
| 에이전트당 작업 그룹 | 지원되는 각 리전: 20개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5DAAE567)  | 에이전트에 추가할 수 있는 최대 작업 그룹 수입니다. | 
| 에이전트당 에이전트 공동 작업자 | 지원되는 각 리전: 1,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-EAFCD549)  | 에이전트에 추가할 수 있는 최대 공동 작업자 에이전트 수입니다. | 
| 계정당 에이전트 | 지원되는 각 리전: 1,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-97D79C54)  | 한 계정의 최대 에이전트 수입니다. | 
| 초당 AssociateAgentKnowledgeBase 요청 | 지원되는 각 리전: 6개 | 아니요 | 초당 최대 AssociateAgentKnowledgeBase API 요청 수입니다. | 
| 에이전트당 연결된 별칭 | 지원되는 각 리전: 10 | 아니요 | 에이전트와 연결할 수 있는 최대 별칭 수입니다. | 
| 에이전트당 관련 지식 기반 | 지원되는 각 지역: 2 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-13143995)  | 에이전트와 연결할 수 있는 최대 지식 기반 수입니다. | 
| Amazon Nova 2 멀티모달 임베딩 V1의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Amazon Nova 2 멀티모달 임베딩 V1에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Amazon Nova Premier의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Amazon Nova Premier의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Claude 3 Haiku의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Claude 3 Haiku의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Claude 3 Opus의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Claude 3 Opus의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Claude 3 Sonnet의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Claude 3 Sonnet의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Claude 3.5 Haiku의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Claude 3.5 Haiku의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Claude 3.5 Sonnet의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Claude 3.5 Sonnet의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Claude 3.5 Sonnet v2의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Claude 3.5 Sonnet v2의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Claude 3.7 Sonnet의 배치 추론 입력 파일 크기(GB) | 각 지원되는 지역: 1 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F8B0126D)  | Claude 3.7 Sonnet의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Claude Haiku 4.5의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Claude Haiku 4.5에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Claude Opus 4.5의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Claude Opus 4.5에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Claude Opus 4.6의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Claude Opus 4.6에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Claude Sonnet 4의 배치 추론 입력 파일 크기(GB) | 각 지원되는 지역: 1 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F611997D)  | Claude Sonnet 4의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Claude Sonnet 4.5의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Claude Sonnet 4.5에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Claude Sonnet 4.6의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Claude Sonnet 4.6에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| DeepSeek V3.2의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | DeepSeek V3.2에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| DeepSeek v3의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | DeepSeek v3의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Devstral 2 123B의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Devstral 2 123B에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| GLM 4.7의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | GLM 4.7에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| GLM 4.7 플래시의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | GLM 4.7 Flash에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| GLM 5의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | GLM 5에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Gemma 3 12B의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Gemma 3 12B에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Gemma 3 27B의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Gemma 3 27B에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Gemma 3 4B의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Gemma 3 4B에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Kimi K2 Thinking의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Kimi K2 Thinking에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Kimi K2.5의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Kimi K2.5에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Llama 3.1 405B Instruct의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Llama 3.1 405B Instruct의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Llama 3.1 70B Instruct의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Llama 3.1 70B Instruct의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Llama 3.1 8B Instruct의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Llama 3.1 8B Instruct의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Llama 3.2 11B Instruct의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Llama 3.2 11B Instruct의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Llama 3.2 1B Instruct의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Llama 3.2 1B Instruct의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Llama 3.2 3B Instruct의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Llama 3.2 3B Instruct의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Llama 3.2 90B Instruct의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Llama 3.2 90B Instruct의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Llama 3.3 70B Instruct의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Llama 3.3 70B Instruct의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Llama 4 Maverick의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Llama 4 Maverick의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Llama 4 Scout의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Llama 4 Scout의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Magistral Small 2509의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Magistral Small 2509에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| MiniMax M2의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | MiniMax M2에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| MiniMax M2.1의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | MiniMax M2.1에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| MiniMax M2.5의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | MiniMax M2.5에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| 미니스트럴 3 14B의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Ministral 3 14B에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| 미니스트럴 3 8B의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Ministral 3 8B에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| 미니스트럴 3B의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | 미니스트럴 3B에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Mistral Large 2(24.07)의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Mistral Large 2(24.07)의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Mistral Large 3의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Mistral Large 3에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Mistral Small의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Mistral Small의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| NVIDIA Nemotron 3 Super 120B A12B의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | NVIDIA Nemotron 3 Super 120B A12B에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| NVIDIA Nemotron Nano 12B의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | NVIDIA Nemotron Nano 12B에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| NVIDIA Nemotron Nano 3 30B용 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | NVIDIA Nemotron Nano 3 30B에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| NVIDIA Nemotron Nano 9B의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | NVIDIA Nemotron Nano 9B에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Nova 2 Lite의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Nova 2 Lite에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Nova Lite V1의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Nova Lite V1의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Nova Micro V1의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Nova Micro V1의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Nova Pro V1의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Nova Pro V1의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| OpenAI GPT OSS 120b의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | OpenAI GPT OSS 120b의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| OpenAI GPT OSS 20b의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | OpenAI GPT OSS 20b의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| OpenAI GPT OSS Safeguard 120b의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | OpenAI GPT OSS Safeguard 120b에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| OpenAI GPT OSS Safeguard 20b의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | OpenAI GPT OSS Safeguard 20b에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Qwen3 235B의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Qwen3 235B의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Qwen3 32B의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Qwen3 32B의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Qwen3 Coder 30B의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Qwen3 Coder 30B의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Qwen3 Coder 480B의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Qwen3 Coder 480B의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Qwen3 Coder Next의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Qwen3 Coder Next에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Qwen3 Next 80B의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Qwen3 Next 80B에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Qwen3 VL 235B의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Qwen3 VL 235B에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Titan Multimodal Embeddings G1의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Titan Multimodal Embeddings G1의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Titan Text Embeddings V2의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Titan Text Embeddings V2의 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Voxtral Mini 3B 2507의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Voxtral Mini 3B 2507에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Voxtral Small 24B 2507의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Voxtral Small 24B 2507에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Writer Palmyra Vision 7B의 배치 추론 입력 파일 크기(GB) | 지원되는 각 리전: 1 | 아니요 | Writer Palmyra Vision 7B에 대한 배치 추론을 위해 제출된 단일 파일의 최대 크기(GB)입니다. | 
| Qwen3의 배치 추론 작업 크기(GB) 다음 80B | 지원되는 각 리전: 5 | 아니요 | Qwen3 Next 80B의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Amazon Nova 2 멀티모달 임베딩 V1의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 100 | 아니요 | Amazon Nova 2 멀티모달 임베딩 V1의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Amazon Nova Premier의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Amazon Nova Premier의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Claude 3 Haiku의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Claude 3 Haiku의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Claude 3 Opus의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Claude 3 Opus의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Claude 3 Sonnet의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Claude 3 Sonnet의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Claude 3.5 Haiku의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Claude 3.5 Haiku의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Claude 3.5 Sonnet의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Claude 3.5 Sonnet의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Claude 3.5 Sonnet v2의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Claude 3.5 Sonnet v2의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Claude 3.7 Sonnet의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-02D6293C)  | Claude 3.7 Sonnet의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Claude Haiku 4.5의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Claude Haiku 4.5의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Claude Opus 4.5의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Claude Opus 4.5의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Claude Opus 4.6의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Claude Opus 4.6의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Claude Sonnet 4의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E31283B0)  | Claude Sonnet 4의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Claude Sonnet 4.5의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Claude Sonnet 4.5의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Claude Sonnet 4.6의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Claude Sonnet 4.6의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| DeepSeek V3.2의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | DeepSeek V3.2의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| DeepSeek v3의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | DeepSeek v3의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Devstral 2 123B의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Devstral 2 123B의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| GLM 4.7의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | GLM 4.7의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| GLM 4.7 플래시의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | GLM 4.7 Flash의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| GLM 5의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | GLM 5의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Gemma 3 12B의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Gemma 3 12B의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Gemma 3 27B의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Gemma 3 27B의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Gemma 3 4B의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Gemma 3 4B의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Kimi K2 Thinking의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Kimi K2 Thinking의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Kimi K2.5의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Kimi K2.5의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Llama 3.1 405B Instruct의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Llama 3.1 405B Instruct의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Llama 3.1 70B Instruct의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Llama 3.1 70B Instruct의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Llama 3.1 8B Instruct의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Llama 3.1 8B Instruct의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Llama 3.2 11B Instruct의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Llama 3.2 11B Instruct의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Llama 3.2 1B Instruct의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Llama 3.2 1B Instruct의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Llama 3.2 3B Instruct의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Llama 3.2 3B Instruct의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Llama 3.2 90B Instruct의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Llama 3.2 90B Instruct의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Llama 3.3 70B Instruct의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Llama 3.3 70B Instruct의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Llama 4 Maverick의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Llama 4 Maverick의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Llama 4 Scout의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Llama 4 Scout의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Magistral Small 2509의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Magistral Small 2509의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| MiniMax M2의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | MiniMax M2의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| MiniMax M2.1의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | MiniMax M2.1의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| MiniMax M2.5의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | MiniMax M2.5의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| 미니스트럴 3 14B의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Ministral 3 14B의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| 미니스트럴 3 8B의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Ministral 3 8B의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| 미니스트럴 3B의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | 미니스트럴 3B의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Mistral Large 2(24.07)의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Mistral Large 2(24.07)의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Mistral Large 3의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Mistral Large 3의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Mistral Small의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Mistral Small의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| NVIDIA Nemotron 3 Super 120B A12B의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | NVIDIA Nemotron 3 Super 120B A12B의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| NVIDIA Nemotron Nano 12B의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | NVIDIA Nemotron Nano 12B의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| NVIDIA Nemotron Nano 3 30B의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | NVIDIA Nemotron Nano 3 30B의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| NVIDIA Nemotron Nano 9B의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | NVIDIA Nemotron Nano 9B의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Nova Lite V1의 배치 추론 작업 크기(GB) | me-central-1: 5<br />각각의 지원되는 다른 리전: 100 | 아니요 | Nova Lite V1의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Nova Micro V1의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Nova Micro V1의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Nova Pro V1의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 100 | 아니요 | Nova Pro V1의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| OpenAI GPT OSS 120b의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | OpenAI GPT OSS 120b의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| OpenAI GPT OSS 20b의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | OpenAI GPT OSS 20b의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| OpenAI GPT OSS Safeguard 120b의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | OpenAI GPT OSS Safeguard 120b의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| OpenAI GPT OSS Safeguard 20b의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | OpenAI GPT OSS Safeguard 20b의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Qwen3 235B의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Qwen3 235B의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Qwen3 32B의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Qwen3 32B의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Qwen3 Coder 30B의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Qwen3 Coder 30B의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Qwen3 Coder 480B의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Qwen3 Coder 480B의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Qwen3 Coder Next의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Qwen3 Coder Next의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Qwen3 VL 235B의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Qwen3 VL 235B의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Titan Multimodal Embeddings G1의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Titan Multimodal Embeddings G1의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Titan Text Embeddings V2의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Titan Text Embeddings V2의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Voxtral Mini 3B 2507의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Voxtral Mini 3B 2507의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Voxtral Small 24B 2507의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Voxtral Small 24B 2507의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| Writer Palmyra Vision 7B의 배치 추론 작업 크기(GB) | 지원되는 각 리전: 5 | 아니요 | Writer Palmyra Vision 7B의 배치 추론 작업에 포함된 모든 입력 파일의 최대 누적 크기(GB)입니다. | 
| 에이전트의 문자 지침 | 지원되는 각 리전: 20,000 | 아니요 | 에이전트에 대한 지침의 최대 문자 수입니다. | 
| 동시 모델 가져오기 작업 | 지원되는 각 리전: 1 | 아니요 | 동시에 진행 중인 모델 가져오기 작업의 최대 수입니다. | 
| 초당 CreateAgent 요청 | 지원되는 각 리전: 6개 | 아니요 | 초당 최대 CreateAgent API 요청 수입니다. | 
| 초당 CreateAgentActionGroup 요청 | 지원되는 각 리전: 12 | 아니요 | 초당 최대 CreateAgentActionGroup API 요청 수입니다. | 
| 초당 CreateAgentAlias 요청 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 CreateAgentAlias API 요청 수입니다. | 
| Anthropic Claude 3.5 Haiku의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 2,000 | 아니요 | 1분 동안 InvokeModel 및 InvokeModelWithResponseStream을 직접 호출할 수 있는 최대 횟수입니다. 할당량은 Anthropic Claude 3.5 Haiku에 대한 InvokeModel 및 InvokeModelWithResponseStream 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude 3.5 Sonnet V2의 분당 교차 리전 모델 추론 요청 | us-west-2: 500<br />각각의 지원되는 다른 리전: 100 | 아니요 | Anthropic Claude 3.5 Sonnet V2에서 1분 동안 모델 추론을 직접 호출할 수 있는 최대 횟수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| Anthropic Claude 3.5 Haiku의 분당 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 4,000,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4BF37C17)  | 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Anthropic Claude 3.5 Haiku의 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude 3.5 Sonnet V2의 분당 교차 리전 모델 추론 토큰 | us-west-2: 4,000,000<br />지원되는 다른 각 리전: 800,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FF8B4E28)  | Anthropic Claude 3.5 Sonnet V2에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| Amazon Nova 2 Lite에 대한 분당 리전 간 모델 추론 요청 | 지원되는 각 리전: 2,000 | 아니요 | Amazon Nova 2 Lite에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 리전 간 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Amazon Nova 2 Omni에 대한 분당 리전 간 모델 추론 요청 | 지원되는 각 리전: 2,000 | 아니요 | Amazon Nova 2 Omni에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 리전 간 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Amazon Nova 2 Pro 미리 보기에 대한 분당 리전 간 모델 추론 요청 | 지원되는 각 리전: 100 | 아니요 | Amazon Nova 2 Pro 미리 보기에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 리전 간 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Amazon Nova Lite의 분당 교차 리전 모델 추론 요청 | us-east-1: 4,000<br />us-east-2: 4,000<br />us-west-1: 4,000<br />us-west-2: 4,000<br />지원되는 다른 각 리전: 400 | 아니요 | Amazon Nova Lite에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Amazon Nova Micro의 분당 교차 리전 모델 추론 요청 | us-east-1: 4,000<br />us-east-2: 4,000<br />us-west-2: 4,000<br />지원되는 다른 각 리전: 400 | 아니요 | Amazon Nova Micro에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Amazon Nova Premier V1의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 500개 | 아니요 | Amazon Nova Premier V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Amazon Nova Pro의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 500개 | 아니요 | Amazon Nova Pro에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Anthropic Claude 3 Haiku의 분당 교차 리전 모델 추론 요청 | us-east-1: 2,000<br />us-west-2: 2,000<br />ap-northeast-1: 400<br />ap-southeast-1: 400<br />각각의 지원되는 다른 리전: 800 | 아니요 | 1분 동안 모델 추론을 직접 호출할 수 있는 최대 횟수입니다. 할당량은 Anthropic Claude 3 Haiku에 대한 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| Anthropic Claude 3 Opus의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 100 | 아니요 | Anthropic Claude 3 Opus에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Anthropic Claude 3 Sonnet의 분당 교차 리전 모델 추론 요청 | us-east-1: 1,000<br />us-west-2: 1,000<br />각각의 지원되는 다른 리전: 200 | 아니요 | 1분 동안 모델 추론을 직접 호출할 수 있는 최대 횟수입니다. 할당량은 Anthropic Claude 3 Sonnet에 대한 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| Anthropic Claude 3.5 Sonnet의 분당 교차 리전 모델 추론 요청 | us-west-2: 500<br />ap-northeast-1: 40<br />ap-southeast-1: 40<br />eu-central-1: 40<br />eu-west-1: 40<br />eu-west-3: 40<br />각각의 지원되는 다른 리전: 100 | 아니요 | Anthropic Claude 3.5 Sonnet에서 1분 동안 모델 추론을 직접 호출할 수 있는 최대 횟수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| Anthropic Claude 3.7 Sonnet V1의 분당 교차 리전 모델 추론 요청 | us-east-1: 250<br />us-east-2: 250<br />us-west-2: 250<br />eu-central-1: 100<br />eu-north-1: 100<br />eu-west-1: 100<br />eu-west-3: 100<br />각각의 지원되는 다른 리전: 50회 | 아니요 | Anthropic Claude 3.7 Sonnet V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Anthropic Claude Haiku 4.5의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 10,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-CCA5DF70)  | Anthropic Claude Haiku 4.5에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Anthropic Claude Opus 4 V1의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 200 | 아니요 | Anthropic Claude Opus 4 V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Anthropic Claude Opus 4.1의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 50 | 아니요 | Anthropic Claude Opus 4.1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Anthropic Claude Opus 4.5에 대한 분당 리전 간 모델 추론 요청 | 지원되는 각 리전: 10,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-27989F42)  | Anthropic Claude Opus 4.5에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 리전 간 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Anthropic Claude Opus 4.6 V1에 대한 분당 리전 간 모델 추론 요청 | 지원되는 각 리전: 10,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-11DFF789)  | Anthropic Claude Opus 4.6 V1에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 리전 간 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Anthropic Claude Sonnet 4 V1의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 200 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-559DCC33)  | Anthropic Claude Sonnet 4 V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Anthropic Claude Sonnet 4 V1 1M Context Length의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 5개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-534E5E05)  | Anthropic Claude Sonnet 4 V1 1M Context Length에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Anthropic Claude Sonnet 4.5 V1의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 10,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4A6BFAB1)  | Anthropic Claude Sonnet 4.5 V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Anthropic Claude Sonnet 4.5 V1 1M Context Length의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 1,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-A052927A)  | Anthropic Claude Sonnet 4.5 V1 1M Context Length에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Anthropic Claude Sonnet 4.6에 대한 분당 리전 간 모델 추론 요청 | 지원되는 각 리전: 10,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-00FF3314)  | Anthropic Claude Sonnet 4.6에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 리전 간 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Cohere Embed V4의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 2,000 | 아니요 | Cohere Embed V4에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| DeepSeek R1 V1의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 200 | 아니요 | DeepSeek R1 V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Meta Llama 3.1 405B Instruct의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 400 | 아니요 | Meta Llama 3.1 405B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Meta Llama 3.1 70B Instruct의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 800 | 아니요 | Meta Llama 3.1 70B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Meta Llama 3.1 8B Instruct의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 1,600 | 아니요 | Meta Llama 3.1 8B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Meta Llama 3.2 1B Instruct의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 1,600 | 아니요 | Meta Llama 3.2 1B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Meta Llama 3.2 3B Instruct의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 1,600 | 아니요 | Meta Llama 3.2 3B Instruct에서 1분 동안 모델 추론을 직접 호출할 수 있는 최대 횟수입니다. 할당량은 InvokeModel, InvokeModelWithResponseStream, Converse 및 ConverseStream에 대한 요청의 합산 합계를 고려합니다. | 
| Meta Llama 3.3 70B Instruct의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 800 | 아니요 | Meta Llama 3.3 70B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Meta Llama 4 Maverick V1의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 800 | 아니요 | Meta Llama 4 Maverick V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Meta Llama 4 Scout V1의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 800 | 아니요 | Meta Llama 4 Scout V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Mistral Pixtral Large 25.02 V1의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 10 | 아니요 | Mistral Pixtral Large 25.02 V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Stable Image Conservative Upscale의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 4 | 아니요 | Stable Image Conservative Upscale에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Stable Image Control Sketch의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 20 | 아니요 | Stable Image Control Sketch에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Stable Image Control Structure의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 20 | 아니요 | Stable Image Control Structure에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Stable Image Creative Upscale의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 4 | 아니요 | Stable Image Creative Upscale에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Stable Image Erase Object의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 20 | 아니요 | Stable Image Erase Object에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Stable Image Fast Upscale의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 20 | 아니요 | Stable Image Fast Upscale에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Stable Image Inpaint의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 20 | 아니요 | Stable Image Inpaint에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Stable Image Outpaint의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 4 | 아니요 | Stable Image Outpaint에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Stable Image Remove Background의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 20 | 아니요 | Stable Image Remove Background에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Stable Image Search and Recolor의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 20 | 아니요 | Stable Image Search and Recolor에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Stable Image Search and Replace의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 20 | 아니요 | Stable Image Search and Replace에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Stable Image Style Guide의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 20 | 아니요 | Stable Image Style Guide에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Stable Image Style Transfer의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 20 | 아니요 | Stable Image Style Transfer에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Twelve Labs Marengo의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 200 | 아니요 | Twelve Labs Marengo에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Twelve Labs Pegasus의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 120 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-6E046197)  | Twelve Labs Pegasus에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| TwelveLabs Marengo Embed 3.0에 대한 분당 리전 간 모델 추론 요청 | 지원되는 각 리전: 1,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E5197E26)  | TwelveLabs Marengo Embed 3.0에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 리전 간 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Writer AI Palmyra X4 V1의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 10 | 아니요 | Writer AI Palmyra X4 V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Writer AI Palmyra X5 V1의 분당 교차 리전 모델 추론 요청 | 지원되는 각 리전: 10 | 아니요 | Writer AI Palmyra X5 V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Amazon Nova 2 Lite에 대한 분당 리전 간 모델 추론 토큰 | 지원되는 각 리전: 8,000,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C6F5908D)  | Amazon Nova 2 Lite에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 리전 간 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Amazon Nova 2 Omni에 대한 분당 리전 간 모델 추론 토큰 | 지원되는 각 리전: 8,000,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-2438ED67)  | Amazon Nova 2 Omni에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 리전 간 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Amazon Nova 2 Pro 미리 보기에 대한 분당 리전 간 모델 추론 토큰 | 지원되는 각 리전: 1,000,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F0AF140A)  | Amazon Nova 2 Pro 미리 보기에서 1분 동안 모델 추론을 위해 제출할 수 있는 리전 간 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Amazon Nova Lite의 분당 교차 리전 모델 추론 토큰 | us-east-1: 8,000,000<br />us-east-2: 8,000,000<br />us-west-1: 8,000,000<br />us-west-2: 8,000,000<br />지원되는 다른 각 리전: 400,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7C42E72A)  | Amazon Nova Lite에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Amazon Nova Micro의 분당 교차 리전 모델 추론 토큰 | us-east-1: 8,000,000<br />us-east-2: 8,000,000<br />us-west-2: 8,000,000<br />지원되는 다른 각 리전: 400,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-DC7FF66C)  | Amazon Nova Micro에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Amazon Nova Premier V1의 분당 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 2,000,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-AA7FE948)  | Amazon Nova Premier V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Amazon Nova Pro의 분당 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 2,000,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C0326783)  | Amazon Nova Pro에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude 3 Haiku의 분당 교차 리전 모델 추론 토큰 | us-east-1: 4,000,000<br />us-west-2: 4,000,000<br />ap-northeast-1: 400,000<br />ap-southeast-1: 400,000<br />지원되는 다른 각 리전: 600,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-DCADBC78)  | 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Anthropic Claude 3 Haiku의 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude 3 Opus의 분당 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 800,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-6C86825E)  | Anthropic Claude 3 Opus에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude 3 Sonnet의 분당 교차 리전 모델 추론 토큰 | us-east-1: 2,000,000<br />us-west-2: 2,000,000<br />지원되는 다른 각 리전: 400,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5DF13F64)  | 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Anthropic Claude 3 Sonnet의 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude 3.5 Sonnet의 분당 교차 리전 모델 추론 토큰 | us-west-2: 4,000,000<br />ap-northeast-1: 400,000<br />ap-southeast-1: 400,000<br />eu-central-1: 400,000<br />eu-west-1: 400,000<br />eu-west-3: 400,000<br />지원되는 다른 각 리전: 800,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-479B647F)  | Anthropic Claude 3.5 Sonnet에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| Anthropic Claude 3.7 Sonnet V1의 분당 교차 리전 모델 추론 토큰 | us-east-1: 1,000,000<br />us-east-2: 1,000,000<br />us-west-2: 1,000,000<br />eu-central-1: 100,000<br />eu-north-1: 100,000<br />eu-west-1: 100,000<br />eu-west-3: 100,000<br />지원되는 다른 각 리전: 50,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-6E888CC2)  | Anthropic Claude 3.7 Sonnet V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Haiku 4.5의 분당 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 5,000,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-58BE175A)  | Anthropic Claude Haiku 4.5에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Opus 4 V1의 분당 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 200,000개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-29C2B0A3)  | Anthropic Claude Opus 4 V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Opus 4.1의 분당 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 500,000개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-BD85BFCD)  | Anthropic Claude Opus 4.1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Opus 4.5에 대한 분당 리전 간 모델 추론 토큰 | 지원되는 각 리전: 2,000,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7007E9C9)  | Anthropic Claude Opus 4.5에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 리전 간 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Opus 4.6 V1에 대한 분당 리전 간 모델 추론 토큰 | 지원되는 각 리전: 3,000,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-0AD9BBE8)  | Anthropic Claude Opus 4.6 V1에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 리전 간 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Opus 4.7에 대한 분당 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 30,000,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5DB28B7B)  | Anthropic Claude Opus 4.7에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 리전 간 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Sonnet 4 V1의 분당 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 200,000개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-59759B4A)  | Anthropic Claude Sonnet 4 V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Sonnet 4 V1 1M Context Length의 분당 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 1,000,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1FA095B8)  | Anthropic Claude Sonnet 4 V1 1M Context Length에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Sonnet 4.5 V1의 분당 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 5,000,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F4DDD3EB)  | Anthropic Claude Sonnet 4.5 V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Sonnet 4.5 V1 1M Context Length의 분당 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 1,000,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8EA73537)  | Anthropic Claude Sonnet 4.5 V1 1M Context Length에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Sonnet 4.6에 대한 분당 리전 간 모델 추론 토큰 | 지원되는 각 리전: 6,000,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-15B8E632)  | Anthropic Claude Sonnet 4.6에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 리전 간 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Cohere Embed V4의 분당 교차 리전 모델 추론 토큰 | 지원되는 각 지역: 300,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4C3F0FE6)  | Cohere Embed V4에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| DeepSeek R1 V1의 분당 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 200,000개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-06B03968)  | DeepSeek R1 V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Meta Llama 3.1 405B Instruct의 분당 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 800,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9913DEEF)  | Meta Llama 3.1 405B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Meta Llama 3.1 70B Instruct의 분당 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 600,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-92E68994)  | Meta Llama 3.1 70B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Meta Llama 3.1 8B Instruct의 분당 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 600,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9782749C)  | Meta Llama 3.1 8B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Meta Llama 3.2 1B Instruct의 분당 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 600,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-BD9FDA6F)  | Meta Llama 3.2 1B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Meta Llama 3.2 3B Instruct의 분당 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 600,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-0B2687F4)  | Meta Llama 3.2 3B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 토큰 수입니다. 할당량은 InvokeModel, InvokeModelWithResponseStream, Converse 및 ConverseStream에 대한 토큰의 합산 합계를 고려합니다. | 
| Meta Llama 3.3 70B Instruct의 분당 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 600,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-0E7AA8B7)  | Meta Llama 3.3 70B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Meta Llama 4 Maverick V1의 분당 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 600,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-DE3FBBF4)  | Meta Llama 4 Maverick V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Meta Llama 4 Scout V1의 분당 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 600,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-532E6630)  | Meta Llama 4 Scout V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Mistral Pixtral Large 25.02 V1의 분당 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 80,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4B9F76B0)  | Mistral Pixtral Large 25.02 V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Writer AI Palmyra X4 V1의 분당 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 150,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FF1F238B)  | Writer AI Palmyra X4 V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Writer AI Palmyra X5 V1의 분당 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 150,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-90DFE70F)  | Writer AI Palmyra X5 V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| 계정당 생성 중 상태인 사용자 지정 모델 | 지원되는 각 지역: 2 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C02E1E99)  | 생성 중 상태인 사용자 지정 모델의 최대 수입니다. | 
| 초당 DeleteAgent 요청 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 DeleteAgent API 요청 수입니다. | 
| 초당 DeleteAgentActionGroup 요청 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 DeleteAgentActionGroup API 요청 수입니다. | 
| 초당 DeleteAgentAlias 요청 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 DeleteAgentAlias API 요청 수입니다. | 
| 초당 DeleteAgentVersion 요청 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 DeleteAgentVersion API 요청 수입니다. | 
| 초당 DisassociateAgentKnowledgeBase 요청 | 지원되는 각 리전: 4 | 아니요 | 초당 최대 DisassociateAgentKnowledgeBase API 요청 수입니다. | 
| 에이전트당 활성화된 작업 그룹 | 지원되는 각 리전: 15 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-14A16430)  | 에이전트에 활성화할 수 있는 최대 작업 그룹 수입니다. | 
| 추론 프로파일당 엔드포인트 | 지원되는 각 리전: 5 | 아니요 | 추론 프로파일의 최대 엔드포인트 수입니다. 엔드포인트는 모델과 모델에 대한 간접 호출 요청이 전송되는 리전에 의해 정의됩니다. | 
| 초당 GetAgent 요청 | 지원되는 각 리전: 15 | 아니요 | 초당 최대 GetAgent API 요청 수입니다. | 
| 초당 GetAgentActionGroup 요청 | 지원되는 각 리전: 20 | 아니요 | 초당 최대 GetAgentActionGroup API 요청 수입니다. | 
| 초당 GetAgentAlias 요청 | 지원되는 각 리전: 10 | 아니요 | 초당 최대 GetAgentAlias API 요청 수입니다. | 
| 초당 GetAgentKnowledgeBase 요청 | 지원되는 각 리전: 15 | 아니요 | 초당 최대 GetAgentKnowledgeBase API 요청 수입니다. | 
| 초당 GetAgentVersion 요청 | 지원되는 각 리전: 10 | 아니요 | 초당 최대 GetAgentVersion API 요청 수입니다. | 
| Amazon Nova 2 Lite에 대한 분당 글로벌 리전 간 모델 추론 요청 | 지원되는 각 리전: 2,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D5F39C2F)  | Amazon Nova 2 Lite에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 글로벌 리전 간 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Amazon Nova 2 Omni에 대한 분당 글로벌 리전 간 모델 추론 요청 | 지원되는 각 리전: 2,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-DCD79770)  | Amazon Nova 2 Omni에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 글로벌 리전 간 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Amazon Nova 2 Pro 미리 보기에 대한 분당 글로벌 리전 간 모델 추론 요청 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-A3425ABD)  | Amazon Nova 2 Pro 미리 보기에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 글로벌 리전 간 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Anthropic Claude Haiku 4.5의 분당 글로벌 교차 리전 모델 추론 요청 | me-central-1: 1,000<br />각각의 지원되는 다른 리전: 10,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E5084BBA)  | Anthropic Claude Haiku 4.5에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 글로벌 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Anthropic Claude Opus 4.5에 대한 분당 글로벌 리전 간 모델 추론 요청 | me-central-1: 500<br />각각의 지원되는 다른 리전: 10,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-58424D95)  | Anthropic Claude Opus 4.5에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 글로벌 리전 간 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Anthropic Claude Opus 4.6 V1에 대한 분당 글로벌 리전 간 모델 추론 요청 | me-central-1: 500<br />각각의 지원되는 다른 리전: 10,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-3DD46812)  | Anthropic Claude Opus 4.6 V1에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 글로벌 리전 간 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Anthropic Claude Opus 4.6 V1 1M 컨텍스트 길이에 대한 분당 글로벌 리전 간 모델 추론 요청 | 지원되는 각 리전: 5개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-CDA5906C)  | Anthropic Claude Opus 4.6 V1 1M 컨텍스트 길이에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 글로벌 리전 간 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Anthropic Claude Sonnet 4 V1의 분당 글로벌 교차 리전 모델 추론 요청 | 지원되는 각 리전: 200 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C63AA5DA)  | Anthropic Claude Sonnet 4 V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 글로벌 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Anthropic Claude Sonnet 4.5 V1의 분당 글로벌 교차 리전 모델 추론 요청 | me-central-1: 1,000<br />각각의 지원되는 다른 리전: 10,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-DB84CE56)  | Anthropic Claude Sonnet 4.5 V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 글로벌 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Anthropic Claude Sonnet 4.5 V1 1M Context Length의 분당 글로벌 교차 리전 모델 추론 요청 | me-central-1: 5<br />각각의 지원되는 다른 리전: 1,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C0D53EFB)  | Anthropic Claude Sonnet 4.5 V1 1M Context Length에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 글로벌 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Anthropic Claude Sonnet 4.6에 대한 분당 글로벌 리전 간 모델 추론 요청 | 지원되는 각 리전: 10,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F6E116D7)  | Anthropic Claude Sonnet 4.6에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 글로벌 리전 간 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Anthropic Claude Sonnet 4.6 1M 컨텍스트 길이에 대한 분당 글로벌 리전 간 모델 추론 요청 | 지원되는 각 리전: 500 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B117CDDA)  | Anthropic Claude Sonnet 4.6 1M 컨텍스트 길이에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 글로벌 리전 간 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Cohere Embed V4의 분당 글로벌 교차 리전 모델 추론 요청 | 지원되는 각 리전: 2,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7089DC7D)  | Cohere Embed V4에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 글로벌 교차 리전 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Amazon Nova 2 Lite에 대한 일일 글로벌 리전 간 모델 추론 토큰 | 지원되는 각 리전: 11,520,000,000 | 아니요 | Amazon Nova 2 Lite에 대해 하루에 모델 추론을 위해 제출할 수 있는 글로벌 리전 간 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Amazon Nova 2 Omni에 대한 일일 글로벌 리전 간 모델 추론 토큰 | 지원되는 각 리전: 11,520,000,000 | 아니요 | Amazon Nova 2 Omni에 대해 하루에 모델 추론을 위해 제출할 수 있는 글로벌 리전 간 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Amazon Nova 2 Pro 미리 보기에 대한 일일 글로벌 리전 간 모델 추론 토큰 | 지원되는 각 리전: 1,440,000,000 | 아니요 | Amazon Nova 2 Pro 미리 보기에서 하루에 모델 추론을 위해 제출할 수 있는 글로벌 리전 간 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Haiku 4.5의 일일 글로벌 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 7,200,000,000 | 아니요 | Anthropic Claude Haiku 4.5에서 하루 동안 모델 추론을 위해 제출할 수 있는 최대 글로벌 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Opus 4.5에 대한 일일 글로벌 리전 간 모델 추론 토큰 | 지원되는 각 리전: 2,880,000,000 | 아니요 | Anthropic Claude Opus 4.5에 대해 하루에 모델 추론을 위해 제출할 수 있는 글로벌 리전 간 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Opus 4.6 V1에 대한 일일 글로벌 리전 간 모델 추론 토큰 | me-central-1: 2,880,000,000<br />지원되는 다른 각 리전: 4,320,000,000 | 아니요 | Anthropic Claude Opus 4.6 V1에 대해 하루에 모델 추론을 위해 제출할 수 있는 글로벌 리전 간 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Opus 4.6 V1 1M 컨텍스트 길이에 대한 일일 글로벌 리전 간 모델 추론 토큰 | 지원되는 각 리전: 1,440,000,000 | 아니요 | Anthropic Claude Opus 4.6 V1 1M 컨텍스트 길이에 대해 하루에 모델 추론을 위해 제출할 수 있는 글로벌 리전 간 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Opus 4.7에 대한 일일 글로벌 리전 간 모델 추론 토큰 | 지원되는 각 리전: 43,200,000,000 | 아니요 | Anthropic Claude Opus 4.7에 대해 하루에 모델 추론을 위해 제출할 수 있는 글로벌 리전 간 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Sonnet 4 V1의 일일 글로벌 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 288,000,000 | 아니요 | Anthropic Claude Sonnet 4 V1에서 하루 동안 모델 추론을 위해 제출할 수 있는 최대 글로벌 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Sonnet 4.5 V1의 일일 글로벌 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 7,200,000,000 | 아니요 | Anthropic Claude Sonnet 4.5 V1에서 하루 동안 모델 추론을 위해 제출할 수 있는 최대 글로벌 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Sonnet 4.5 V1 1M Context Length의 일일 글로벌 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 1,440,000,000 | 아니요 | Anthropic Claude Sonnet 4.5 V1 1M Context Length에서 하루 동안 모델 추론을 위해 제출할 수 있는 최대 글로벌 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Sonnet 4.6에 대한 일일 글로벌 리전 간 모델 추론 토큰 | me-central-1: 7,200,000,000<br />지원되는 다른 각 리전: 8,640,000,000 | 아니요 | Anthropic Claude Sonnet 4.6에 대해 하루에 모델 추론을 위해 제출할 수 있는 글로벌 리전 간 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Sonnet 4.6 1M 컨텍스트 길이에 대한 일일 글로벌 리전 간 모델 추론 토큰 | 지원되는 각 리전: 1,440,000,000 | 아니요 | Anthropic Claude Sonnet 4.6 1M 컨텍스트 길이에 대해 하루에 모델 추론을 위해 제출할 수 있는 글로벌 리전 간 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Cohere Embed V4의 일일 글로벌 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 432,000,000 | 아니요 | Cohere Embed V4에서 하루 동안 모델 추론을 위해 제출할 수 있는 최대 글로벌 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Amazon Nova 2 Lite에 대한 분당 글로벌 리전 간 모델 추론 토큰 | 지원되는 각 리전: 8,000,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-71C69B70)  | Amazon Nova 2 Lite에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 글로벌 리전 간 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Amazon Nova 2 Omni에 대한 분당 글로벌 리전 간 모델 추론 토큰 | 지원되는 각 리전: 8,000,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-21800074)  | Amazon Nova 2 Omni에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 글로벌 리전 간 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Amazon Nova 2 Pro 미리 보기에 대한 분당 글로벌 리전 간 모델 추론 토큰 | 지원되는 각 리전: 1,000,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-6B796A8E)  | Amazon Nova 2 Pro 미리 보기에서 1분 동안 모델 추론을 위해 제출할 수 있는 글로벌 리전 간 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Haiku 4.5의 분당 글로벌 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 5,000,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9A11C666)  | Anthropic Claude Haiku 4.5에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 글로벌 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Opus 4.5에 대한 분당 글로벌 리전 간 모델 추론 토큰 | 지원되는 각 리전: 2,000,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-3ABF6ACC)  | Anthropic Claude Opus 4.5에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 글로벌 리전 간 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Opus 4.6 V1에 대한 분당 글로벌 리전 간 모델 추론 토큰 | me-central-1: 2,000,000<br />지원되는 다른 각 리전: 3,000,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-3DCCFAA4)  | Anthropic Claude Opus 4.6 V1에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 글로벌 리전 간 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Opus 4.6 V1 1M 컨텍스트 길이에 대한 분당 글로벌 리전 간 모델 추론 토큰 | 지원되는 각 리전: 1,000,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4C59C1F4)  | Anthropic Claude Opus 4.6 V1 1M 컨텍스트 길이에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 글로벌 리전 간 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Opus 4.7에 대한 분당 글로벌 리전 간 모델 추론 토큰 | 지원되는 각 리전: 30,000,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-34152C1D)  | Anthropic Claude Opus 4.7에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 글로벌 리전 간 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Sonnet 4 V1의 분당 글로벌 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 200,000개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-97E41E39)  | Anthropic Claude Sonnet 4 V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 글로벌 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Sonnet 4.5 V1의 분당 글로벌 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 5,000,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-27C57EE8)  | Anthropic Claude Sonnet 4.5 V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 글로벌 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Sonnet 4.5 V1 1M Context Length의 분당 글로벌 교차 리전 모델 추론 토큰 | 지원되는 각 리전: 1,000,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4B26E44A)  | Anthropic Claude Sonnet 4.5 V1 1M Context Length에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 글로벌 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Sonnet 4.6에 대한 분당 글로벌 리전 간 모델 추론 토큰 | me-central-1: 5,000,000<br />지원되는 다른 각 리전: 6,000,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7BEE40FB)  | Anthropic Claude Sonnet 4.6에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 글로벌 리전 간 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Sonnet 4.6 1M 컨텍스트 길이에 대한 분당 글로벌 리전 간 모델 추론 토큰 | 지원되는 각 리전: 1,000,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-6955C77B)  | Anthropic Claude Sonnet 4.6 1M 컨텍스트 길이에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 글로벌 리전 간 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Cohere Embed V4의 분당 글로벌 교차 리전 모델 추론 토큰 | 지원되는 각 지역: 300,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-02DFBB76)  | Cohere Embed V4에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 글로벌 교차 리전 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| 계정당 가져온 모델 | 지원되는 각 리전: 3 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-45B04988)  | 한 계정의 최대 가져온 모델 수입니다. | 
| 계정당 추론 프로파일 | 지원되는 각 리전: 1,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-40EC9882)  | 한 계정의 최대 추론 프로파일 수입니다. | 
| 초당 ListAgentActionGroups 요청 | 지원되는 각 리전: 10 | 아니요 | 초당 최대 ListAgentActionGroups API 요청 수입니다. | 
| 초당 ListAgentAliases 요청 | 지원되는 각 리전: 10 | 아니요 | 초당 최대 ListAgentAliases API 요청 수입니다. | 
| 초당 ListAgentKnowledgeBases 요청 | 지원되는 각 리전: 10 | 아니요 | 초당 최대 ListAgentKnowledgeBases API 요청 수입니다. | 
| 초당 ListAgentVersions 요청 | 지원되는 각 리전: 10 | 아니요 | 초당 최대 ListAgentVersions API 요청 수입니다. | 
| 초당 ListAgents 요청 | 지원되는 각 리전: 10 | 아니요 | 초당 최대 ListAgents API 요청 수입니다. | 
| Amazon Nova 2 멀티모달 임베딩 V1에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Amazon Nova 2 멀티모달 임베딩 V1에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Amazon Nova Premier의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Amazon Nova Premier에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Claude 3 Haiku의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Claude 3 Haiku에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Claude 3 Opus의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Claude 3 Opus에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Claude 3 Sonnet의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Claude 3 Sonnet에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Claude 3.5 Haiku의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Claude 3.5 Haiku에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Claude 3.5 Sonnet의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Claude 3.5 Sonnet에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Claude 3.5 Sonnet v2의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Claude 3.5 Sonnet v2에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Claude 3.7 Sonnet의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-BFA0FE84)  | Claude 3.7 Sonnet에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Claude Haiku 4.5에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Claude Haiku 4.5에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Claude Opus 4.5에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Claude Opus 4.5에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Claude Opus 4.6에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Claude Opus 4.6에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Claude Sonnet 4의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F72F26EE)  | Claude Sonnet 4에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Claude Sonnet 4.5에 대한 배치 추론 작업당 최소 레코드 수입니다. | 지원되는 각 리전: 100 | 아니요 | Claude Sonnet 4.5에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Claude Sonnet 4.6에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Claude Sonnet 4.6에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| DeepSeek V3.2에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | DeepSeek V3.2에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| DeepSeek v3의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | DeepSeek v3에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Devstral 2 123B에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Devstral 2 123B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| GLM 4.7에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | GLM 4.7에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| GLM 4.7 Flash에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | GLM 4.7 Flash에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| GLM 5에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | GLM 5에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Gemma 3 12B에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Gemma 3 12B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Gemma 3 27B에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Gemma 3 27B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Gemma 3 4B에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Gemma 3 4B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Kimi K2 Thinking에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Kimi K2 Thinking에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Kimi K2.5에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Kimi K2.5에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Llama 3.1 405B Instruct의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Llama 3.1 405B Instruct에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Llama 3.1 70B Instruct의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Llama 3.1 70B Instruct에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Llama 3.1 8B Instruct의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Llama 3.1 8B Instruct에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Llama 3.2 11B Instruct의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Llama 3.2 11B Instruct에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Llama 3.2 1B Instruct의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Llama 3.2 1B Instruct에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Llama 3.2 3B Instruct의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Llama 3.2 3B Instruct에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Llama 3.2 90B Instruct의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Llama 3.2 90B Instruct에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Llama 3.3 70B Instruct의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Llama 3.3 70B Instruct에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Llama 4 Maverick의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Llama 4 Maverick에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Llama 4 Scout의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Llama 4 Scout에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Magistral Small 2509에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Magistral Small 2509에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| MiniMax M2에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | MiniMax M2에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| MiniMax M2.1에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | MiniMax M2.1에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| MiniMax M2.5에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | MiniMax M2.5에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Ministral 3 14B에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Ministral 3 14B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Ministral 3 8B에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Ministral 3 8B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Ministral 3B에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Ministral 3B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Mistral Large 2(24.07)의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Mistral Large 2(24.07)에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Mistral Large 3에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Mistral Large 3에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Mistral Small의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Mistral Small에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| NVIDIA Nemotron 3 Super 120B A12B에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | NVIDIA Nemotron 3 Super 120B A12B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| NVIDIA Nemotron Nano 12B에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | NVIDIA Nemotron Nano 12B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| NVIDIA Nemotron Nano 3 30B에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | NVIDIA Nemotron Nano 3 30B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| NVIDIA Nemotron Nano 9B에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | NVIDIA Nemotron Nano 9B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Nova 2 Lite에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Nova 2 Lite에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Nova Lite V1의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Nova Lite V1에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Nova Micro V1의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Nova Micro V1에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Nova Pro V1의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Nova Pro V1에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| OpenAI GPT OSS 120b의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | OpenAI GPT OSS 120b에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| OpenAI GPT OSS 20b의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | OpenAI GPT OSS 20b에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| OpenAI GPT OSS Safeguard 120b에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | OpenAI GPT OSS Safeguard 120b에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| OpenAI GPT OSS Safeguard 20b에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | OpenAI GPT OSS Safeguard 20b에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Qwen3 235B의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Qwen3 235B에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Qwen3 32B의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Qwen3 32B에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Qwen3 Coder 30B의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Qwen3 Coder 30B에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Qwen3 Coder 480B의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Qwen3 Coder 480B에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Qwen3 Coder Next에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Qwen3 Coder Next에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Qwen3 Next 80B에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Qwen3 Next 80B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Qwen3 VL 235B에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Qwen3 VL 235B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Titan Multimodal Embeddings G1의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Titan Multimodal Embeddings G1에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Titan Text Embeddings V2의 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Titan Text Embeddings V2에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Voxtral Mini 3B 2507에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Voxtral Mini 3B 2507에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Voxtral Small 24B 2507에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Voxtral Small 24B 2507에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Writer Palmyra Vision 7B에 대한 배치 추론 작업당 최소 레코드 수 | 지원되는 각 리전: 100 | 아니요 | Writer Palmyra Vision 7B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최소 레코드 수입니다. | 
| Amazon Nova Pro V1에 대한 모델 호출 일일 최대 지연 시간 최적화 토큰 | 지원되는 각 리전: 57,600,000 | 아니요 | Amazon Nova Pro V1에 대해 하루에 지연 시간 최적화 모델 추론을 위해 제출할 수 있는 최대 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| AI21 Labs Jamba 1.5 Large의 일일 모델 호출 최대 토큰 수(리전 간 호출의 경우 두 배) | 지원되는 각 리전: 432,000,000 | 아니요 | AI21 Labs Jamba 1.5 Large의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| AI21 Labs Jamba 1.5 Mini의 일일 모델 호출 최대 토큰 수(리전 간 호출의 경우 두 배) | 지원되는 각 리전: 432,000,000 | 아니요 | AI21 Labs Jamba 1.5 Mini의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Amazon Nova 2 Lite의 일일 모델 호출 최대 토큰 수(리전 간 호출의 경우 두 배) | 지원되는 각 리전: 5,760,000,000 | 아니요 | Amazon Nova 2 Lite의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Amazon Nova 2 Omni의 일일 모델 호출 최대 토큰 수(리전 간 호출의 경우 두 배) | 지원되는 각 리전: 5,760,000,000 | 아니요 | Amazon Nova 2 Omni의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Amazon Nova 2 Pro 미리 보기의 일일 모델 호출 최대 토큰 수(리전 간 호출의 경우 두 배) | 지원되는 각 리전: 720,000,000 | 아니요 | Amazon Nova 2 Pro 미리 보기의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Amazon Nova Lite의 일일 모델 호출 최대 토큰 수(리전 간 호출의 경우 두 배) | 지원되는 각 리전: 5,760,000,000 | 아니요 | Amazon Nova Lite의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Amazon Nova Micro의 일일 모델 호출 최대 토큰 수(리전 간 호출의 경우 두 배) | 지원되는 각 리전: 5,760,000,000 | 아니요 | Amazon Nova Micro의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Amazon Nova Premier V1에 대한 일일 모델 간접 호출 최대 토큰(교차 리전 직접 호출의 경우 두 배) | 지원되는 각 리전: 1,440,000,000 | 아니요 | Amazon Nova Premier V1의 모델 추론을 위한 일일 최대 토큰 수입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Amazon Nova Pro의 일일 모델 호출 최대 토큰 수(리전 간 호출의 경우 두 배) | 지원되는 각 리전: 1,440,000,000 | 아니요 | Amazon Nova Pro의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Anthropic Claude 3 Haiku의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | us-east-1: 2,880,000,000<br />us-west-2: 2,880,000,000<br />ap-northeast-1: 288,000,000<br />ap-southeast-1: 288,000,000<br />지원되는 다른 각 리전: 432,000,000 | 아니요 | Anthropic Claude 3 Haiku의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Anthropic Claude 3.5 Haiku의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 2,880,000,000 | 아니요 | Anthropic Claude 3.5 Haiku의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Anthropic Claude 3.5 Sonnet V1의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 2,880,000,000 | 아니요 | Anthropic Claude 3.5 Sonnet V1의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Anthropic Claude 3.5 Sonnet V2의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | us-east-1: 2,880,000,000<br />us-west-2: 2,880,000,000<br />지원되는 다른 각 리전: 576,000,000 | 아니요 | Anthropic Claude 3.5 Sonnet V2의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Anthropic Claude 3.7 Sonnet V1에 대한 일일 모델 간접 호출 최대 토큰(교차 리전 직접 호출의 경우 두 배) | 지원되는 각 리전: 720,000,000 | 아니요 | Anthropic Claude 3.7 Sonnet V1의 모델 추론을 위한 일일 최대 토큰 수입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Anthropic Claude Haiku 4.5에 대한 일일 모델 간접 호출 최대 토큰(교차 리전 직접 호출의 경우 두 배) | 지원되는 각 리전: 3,600,000,000 | 아니요 | Anthropic Claude Haiku 4.5의 모델 추론을 위한 일일 최대 토큰 수입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Anthropic Claude Opus 4 V1에 대한 일일 모델 간접 호출 최대 토큰(교차 리전 직접 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000 | 아니요 | Anthropic Claude Opus 4 V1의 모델 추론을 위한 일일 최대 토큰 수입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Anthropic Claude Opus 4.1에 대한 일일 모델 간접 호출 최대 토큰(교차 리전 직접 호출의 경우 두 배) | 지원되는 각 리전: 360,000,000 | 아니요 | Anthropic Claude Opus 4.1의 모델 추론을 위한 일일 최대 토큰 수입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Anthropic Claude Opus 4.5의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 1,440,000,000 | 아니요 | Anthropic Claude Opus 4.5의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Anthropic Claude Opus 4.6 V1의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 2,160,000,000 | 아니요 | Anthropic Claude Opus 4.6 V1의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Anthropic Claude Opus 4.7의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 21,600,000,000 | 아니요 | Anthropic Claude Opus 4.7의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Anthropic Claude Sonnet 4 V1에 대한 일일 모델 간접 호출 최대 토큰(교차 리전 직접 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000 | 아니요 | Anthropic Claude Sonnet 4 V1의 모델 추론을 위한 일일 최대 토큰 수입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Anthropic Claude Sonnet 4 V1 1M Context Length에 대한 일일 모델 간접 호출 최대 토큰(교차 리전 직접 호출의 경우 두 배) | 지원되는 각 리전: 720,000,000 | 아니요 | Anthropic Claude Sonnet 4 V1 1M Context Length의 모델 추론을 위한 일일 최대 토큰 수입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Anthropic Claude Sonnet 4.5 V1에 대한 일일 모델 간접 호출 최대 토큰(교차 리전 직접 호출의 경우 두 배) | 지원되는 각 리전: 3,600,000,000 | 아니요 | Anthropic Claude Sonnet 4.5 V1의 모델 추론을 위한 일일 최대 토큰 수입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Anthropic Claude Sonnet 4.5 V1 1M Context Length에 대한 일일 모델 간접 호출 최대 토큰(교차 리전 직접 호출의 경우 두 배) | 지원되는 각 리전: 720,000,000 | 아니요 | Anthropic Claude Sonnet 4.5 V1 1M Context Length의 모델 추론을 위한 일일 최대 토큰 수입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Anthropic Claude Sonnet 4.6의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 4,320,000,000 | 아니요 | Anthropic Claude Sonnet 4.6의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Cohere Embed V4에 대한 일일 모델 간접 호출 최대 토큰(교차 리전 직접 호출의 경우 두 배) | 지원되는 각 리전: 216,000,000 | 아니요 | Cohere Embed V4의 모델 추론을 위한 일일 최대 토큰 수입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| DeepSeek R1 V1에 대한 일일 모델 간접 호출 최대 토큰(교차 리전 직접 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000 | 아니요 | DeepSeek R1 V1의 모델 추론을 위한 일일 최대 토큰 수입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| DeepSeek V3 V1에 대한 일일 모델 간접 호출 최대 토큰(교차 리전 직접 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | DeepSeek V3 V1의 모델 추론을 위한 일일 최대 토큰 수입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| DeepSeek V3.2의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | DeepSeek V3.2의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| GPT OSS Safeguard 120B의 일일 모델 호출 최대 토큰 수(리전 간 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | GPT OSS Safeguard 120B의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| GPT OSS Safeguard 20B의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | GPT OSS Safeguard 20B의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Gemma 3 12B의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | Gemma 3 12B에 대한 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Gemma 3 27B의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | Gemma 3 27B에 대한 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Gemma 3 4B의 일일 모델 호출 최대 토큰 수(리전 간 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | Gemma 3 4B에 대한 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Kimi K2 Thinking의 일일 모델 호출 최대 토큰 수(리전 간 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | Kimi K2 Thinking의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Magistral Small 1.2의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | Magistral Small 1.2의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Meta Llama 3.2 11B Instruct의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 432,000,000 | 아니요 | Meta Llama 3.2 11B Instruct의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Meta Llama 3.2 1B Instruct의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 432,000,000 | 아니요 | Meta Llama 3.2 1B Instruct의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Meta Llama 3.2 3B Instruct의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 432,000,000 | 아니요 | Meta Llama 3.2 3B Instruct의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Meta Llama 3.2 90B Instruct의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 432,000,000 | 아니요 | Meta Llama 3.2 90B Instruct의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Meta Llama 4 Maverick V1의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 432,000,000 | 아니요 | Meta Llama 4 Maverick V1의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Meta Llama 4 Scout V1의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 432,000,000 | 아니요 | Meta Llama 4 Scout V1의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| MiniMax M2.5의 일일 모델 호출 최대 토큰 수(리전 간 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | MiniMax M2.5의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| 미니맥스 M2의 일일 모델 호출 최대 토큰 수(리전 간 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | 미니맥스 M2의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| 미니맥스 M2.1의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | Minimax M2.1의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| 미니스트럴 14B 3.0의 일일 모델 호출 최대 토큰 수(리전 간 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | 미니스트럴 14B 3.0의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| 미니스트럴 3B 3.0의 일일 모델 호출 최대 토큰 수(리전 간 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | Ministral 3B 3.0의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| 미니스트럴 8B 3.0의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | 미니스트럴 8B 3.0의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Mistral AI Mistral 7B Instruct의 일일 모델 호출 최대 토큰 수(리전 간 호출의 경우 두 배) | 지원되는 각 리전: 432,000,000 | 아니요 | Mistral AI Mistral 7B Instruct의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Mistral AI Mistral Large의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 432,000,000 | 아니요 | Mistral AI Mistral Large의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Mistral AI Mistral Small의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 432,000,000 | 아니요 | Mistral AI Mistral Small의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Mistral AI Mixtral 8X7B Instruct의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 432,000,000 | 아니요 | Mistral AI Mixtral 8X7B Instruct의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Mistral Devstral 2 123b의 일일 모델 호출 최대 토큰 수(리전 간 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | Mistral Devstral 2 123b의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Mistral Large 3의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | Mistral Large 3의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Mistral Pixtral Large 25.02 V1의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 57,600,000 | 아니요 | Mistral Pixtral Large 25.02 V1의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Moonshot AI Kimi K2.5의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | Moonshot AI Kimi K2.5의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| NVIDIA Nemotron 3 Super 120B A12B의 일일 모델 호출 최대 토큰 수(리전 간 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | NVIDIA Nemotron 3 Super 120B A12B의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| NVIDIA Nemotron Nano 2의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | NVIDIA Nemotron Nano 2의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| NVIDIA Nemotron Nano 2 VL의 일일 모델 호출 최대 토큰 수(리전 간 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | NVIDIA Nemotron Nano 2 VL의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Nemotron Nano 3 30B의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | Nemotron Nano 3 30B의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| OpenAI GPT OSS 120B에 대한 일일 모델 간접 호출 최대 토큰(교차 리전 직접 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | OpenAI GPT OSS 120B의 모델 추론을 위한 일일 최대 토큰 수입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| OpenAI GPT OSS 20B에 대한 일일 모델 간접 호출 최대 토큰(교차 리전 직접 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | OpenAI GPT OSS 20B의 모델 추론을 위한 일일 최대 토큰 수입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Qwen3 235B a22b 2507 V1에 대한 일일 모델 간접 호출 최대 토큰(교차 리전 직접 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | Qwen3 235B a22b 2507 V1의 모델 추론을 위한 일일 최대 토큰 수입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Qwen3 32B V1에 대한 일일 모델 간접 호출 최대 토큰(교차 리전 직접 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | Qwen3 32B V1의 모델 추론을 위한 일일 최대 토큰 수입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Qwen3 Coder 30B a3b V1에 대한 일일 모델 간접 호출 최대 토큰(교차 리전 직접 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | Qwen3 Coder 30B a3b V1의 모델 추론을 위한 일일 최대 토큰 수입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Qwen3 Coder 480B a35b V1에 대한 일일 모델 간접 호출 최대 토큰(교차 리전 직접 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | Qwen3 Coder 480B a35b V1의 모델 추론을 위한 일일 최대 토큰 수입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Qwen3 Coder Next의 일일 모델 호출 최대 토큰 수(리전 간 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | Qwen3 Coder Next의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Qwen3 Next 80B A3B의 일일 모델 호출 최대 토큰 수(리전 간 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | Qwen3 Next 80B A3B의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Qwen3 VL 235B A22B의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | Qwen3 VL 235B A22B. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Voxtral Mini 1.0의 일일 모델 호출 최대 토큰 수(리전 간 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | Voxtral Mini 1.0의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Voxtral Small 1.0의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | Voxtral Small 1.0의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| 라이터 AI Palmyra X4 V1의 일일 모델 호출 최대 토큰 수(리전 간 호출의 경우 두 배) | 지원되는 각 리전: 108,000,000 | 아니요 | 라이터 AI Palmyra X4 V1의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| 라이터 AI Palmyra X5 V1의 일일 모델 호출 최대 토큰 수(리전 간 호출의 경우 두 배) | 지원되는 각 리전: 108,000,000 | 아니요 | 라이터 AI Palmyra X5 V1의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| 라이터 팔미라 비전 7B의 일일 모델 호출 최대 토큰 수(리전 간 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | 라이터 팔미라 비전 7B의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Z.ai GLM 5에 대한 모델 호출 최대 일일 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | Z.ai GLM 5에 대한 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Z.ai GLM-4.7에 대한 모델 호출 최대 일일 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | Z.ai GLM-4.7에 대한 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| Z.ai GLM-4.7 Flash의 일일 모델 호출 최대 토큰 수(교차 리전 호출의 경우 두 배) | 지원되는 각 리전: 144,000,000,000 | 아니요 | Z.ai GLM-4.7 Flash의 모델 추론을 위한 일일 최대 토큰입니다. Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합계를 합산합니다. 교차 리전 직접 호출의 경우 두 배가 되며, 승인된 TPM 증가의 경우에는 적용되지 않습니다. | 
| 기본 모델의 약정 없는 프로비저닝된 처리량 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FE44174A)  | 기본 모델의 약정 없는 프로비저닝된 처리량으로 배포할 수 있는 최대 모델 단위 수 | 
| 사용자 지정 모델의 약정 없는 프로비저닝된 처리량 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-BE77399C)  | 사용자 지정 모델의 약정 없는 프로비저닝된 처리량으로 배포할 수 있는 최대 모델 단위 수 | 
| AI21 Labs Jurassic-2 Mid의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9342B636)  | AI21 Labs Jurassic-2 Mid의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| AI21 Labs Jurassic-2 Ultra의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-3F0ECEDC)  | AI21 Labs Jurassic-2 Ultra의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Amazon Nova 2 Lite V1.0 256K에 대해 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-07D3BCF0)  | Amazon Nova 2 Lite V1.0 256K에 대해 프로비저닝된 모델에 할당할 수 있는 최대 모델 유닛 수입니다. | 
| Amazon Nova Canvas의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FD4A6FF9)  | Amazon Nova Canvas의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Amazon Titan Embeddings G1 - Text의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F879F645)  | Amazon Titan Embeddings G1 - Text의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Amazon Titan Image Generator G1의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F424A1E3)  | Amazon Titan Image Generator G1의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Amazon Titan Image Generator G2의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-92F8A601)  | Amazon Titan Image Generator G2의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Amazon Titan Lite V1 4K의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-A4EBFDE7)  | Amazon Titan Text Lite V1 4K의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Amazon Titan Multimodal Embeddings G1의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-32F732DE)  | Amazon Titan Multimodal Embeddings G1의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Amazon Titan Text Embeddings V2의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1074C53D)  | Amazon Titan Text Embeddings V2의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Amazon Titan Text G1 - Express 8K의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8129BF10)  | Amazon Titan Text G1 - Express 8K의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Amazon Titan Text Premier V1 32K의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5056051A)  | Amazon Titan Text Premier V1 32K의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Anthropic Claude 3 Haiku 200K의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-EF415EF6)  | Anthropic Claude 3 Haiku 200K의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Anthropic Claude 3 Haiku 48K의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-3BE61D60)  | Anthropic Claude 3 Haiku 48K의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Anthropic Claude 3 Sonnet 200K의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1F7657F1)  | Anthropic Claude 3 Sonnet 200K의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Anthropic Claude 3 Sonnet 28K의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B3C19043)  | Anthropic Claude 3 Sonnet 28K의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Anthropic Claude 3.5 Haiku 16K의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D3E17A13)  | Anthropic Claude 3.5 Haiku 16K의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Anthropic Claude 3.5 Haiku 200K의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-921A310E)  | Anthropic Claude 3.5 Haiku 200K의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Anthropic Claude 3.5 Haiku 64K의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-43CD2FD9)  | Anthropic Claude 3.5 Haiku 64K의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Anthropic Claude 3.5 Sonnet 18K의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-259C746F)  | Anthropic Claude 3.5 Sonnet 18K의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Anthropic Claude 3.5 Sonnet 200K의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-2590C31B)  | Anthropic Claude 3.5 Sonnet 200K의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Anthropic Claude 3.5 Sonnet 51K의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-208A3F5C)  | Anthropic Claude 3.5 Sonnet 51K의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Anthropic Claude 3.5 Sonnet V2 18K의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-02710C34)  | Anthropic Claude 3.5 Sonnet V2 18K의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Anthropic Claude 3.5 Sonnet V2 200K의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-24060791)  | Anthropic Claude 3.5 Sonnet V2 200K의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Anthropic Claude 3.5 Sonnet V2 51K의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B2718619)  | Anthropic Claude 3.5 Sonnet V2 51K의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Anthropic Claude 3.7 V1.0 Sonnet 18K의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D09F1612)  | Anthropic Claude 3.7 V1.0 Sonnet 18K의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Anthropic Claude 3.7 V1.0 Sonnet 200K의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F4131C39)  | Anthropic Claude 3.7 V1.0 Sonnet 200K의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Anthropic Claude 3.7 V1.0 Sonnet 51K의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-0B0CDE73)  | Anthropic Claude 3.7 V1.0 Sonnet 51K의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Anthropic Claude Instant V1 100K의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4A6D2F15)  | Anthropic Claude Instant V1 100K의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Anthropic Claude V2 100K의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C4522D0D)  | Anthropic Claude V2 100K의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Anthropic Claude V2 18K의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-73573F44)  | Anthropic Claude V2 18K의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Anthropic Claude V2.1 18K의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7478F443)  | Anthropic Claude V2.1 18K의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Anthropic Claude V2.1 200K의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-A63633C5)  | Anthropic Claude V2.1 200K의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Cohere Command의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5E29F315)  | Cohere Command의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Cohere Command Light의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-01F37E14)  | Cohere Command Light의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Cohere Command R의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F2469446)  | Cohere Command R 128k의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Cohere Command R Plus의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C549AE85)  | Cohere Command R Plus 128k의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Cohere Embed English의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-97A8CC77)  | Cohere Embed English의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Cohere Embed Multilingual의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1870BD3C)  | Cohere Embed Multilingual의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Meta Llama 2 13B의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-268D592E)  | Meta Llama 2 13B의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Meta Llama 2 70B의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-2EBEF050)  | Meta Llama 2 70B의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Meta Llama 2 Chat 13B의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-AC6F8476)  | Meta Llama 2 Chat 13B의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Meta Llama 2 Chat 70B의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E953E4AB)  | Meta Llama 2 Chat 70B의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Meta Llama 3 70B Instruct의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B3049E9B)  | Meta Llama 3 70B Instruct의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Meta Llama 3 8B Instruct의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-16711FC4)  | Meta Llama 3 8B Instruct의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Meta Llama 3.1 70B Instruct의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-DD7903AD)  | Meta Llama 3.1 70B Instruct의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Meta Llama 3.1 8B Instruct의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-3632DE15)  | Meta Llama 3.1 8B Instruct의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Meta Llama 3.2 11B Instruct의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1679CB40)  | Meta Llama 3.2 11B Instruct의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Meta Llama 3.2 1B Instruct의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B547321D)  | Meta Llama 3.2 1B Instruct의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Meta Llama 3.2 3B Instruct의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-12E68701)  | Meta Llama 3.2 3B Instruct의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Meta Llama 3.2 90B Instruct의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-DEE3A9C7)  | Meta Llama 3.2 90B Instruct의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Mistral Large 2407의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-697D688A)  | Mistral Large 2407의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Mistral Small의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7A8639EE)  | Mistral Small의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Stability.ai Stable Diffusion XL 0.8의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-240F3183)  | Stability.ai Stable Diffusion XL 0.8의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Stability.ai Stable Diffusion XL 1.0의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9149A536)  | Stability.ai Stable Diffusion XL 1.0의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Amazon Nova Micro에 대한 128k 컨텍스트 길이 변형의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-AC096F71)  | Amazon Nova Micro에 대한 128k 컨텍스트 길이 변형의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Amazon Nova Lite에 대한 24k 컨텍스트 길이 변형의 프로비저닝된 모델당 모델 단위  | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4532261E)  | Amazon Nova Lite에 대한 24k 컨텍스트 길이 변형의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Amazon Nova Micro에 대한 24k 컨텍스트 길이 변형의 프로비저닝된 모델당 모델 단위  | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E0B2EE2A)  | Amazon Nova Micro에 대한 24k 컨텍스트 길이 변형의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Amazon Nova Pro에 대한 24k 컨텍스트 길이 변형의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9C8C5911)  | Amazon Nova Pro에 대한 24k 컨텍스트 길이 변형의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Amazon Nova Lite에 대한 300k 컨텍스트 길이 변형의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-127FC9D0)  | Amazon Nova Lite에 대한 300k 컨텍스트 길이 변형의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Amazon Nova Pro에 대한 300k 컨텍스트 길이 변형의 프로비저닝된 모델당 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E48B7984)  | Amazon Nova Pro에 대한 300k 컨텍스트 길이 변형의 프로비저닝된 모델에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Meta Llama 4 Scout 17B Instruct 10M에 대해 생성된 약정 있는 프로비저닝된 처리량 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-0D70E8DA)  | Meta Llama 4 Scout 17B Instruct 10M에 대해 생성된 약정 있는 프로비저닝된 처리량에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Meta Llama 4 Scout 17B Instruct 128K에 대해 생성된 약정 있는 프로비저닝된 처리량 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D682535A)  | Meta Llama 4 Scout 17B Instruct 128K에 대해 생성된 약정 있는 프로비저닝된 처리량에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Meta Maverick 4 Scout 17B Instruct 128K에 대해 생성된 약정 있는 프로비저닝된 처리량 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7C435546)  | Meta Llama 4 Maverick 17B Instruct 128K에 대해 생성된 약정 있는 프로비저닝된 처리량에 할당할 수 있는 최대 모델 단위 수입니다. | 
| Meta Maverick 4 Scout 17B Instruct 1M에 대해 생성된 약정 있는 프로비저닝된 처리량 모델 단위 | 지원되는 각 리전: 0 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8574D065)  | Meta Llama 4 Maverick 17B Instruct 1M에 대해 생성된 약정 있는 프로비저닝된 처리량에 할당할 수 있는 최대 모델 단위 수입니다. | 
| 기본 모델 Amazon Nova 2 Lite V1.0 256K용으로 생성된 프로비저닝된 처리량에 대한 커밋 없음 모델 단위 | 지원되는 각 리전: 0 | 아니요 | 약정 없이 기본 모델 Amazon Nova 2 Lite V1.0 256K에 대해 생성된 프로비저닝된 처리량에 할당할 수 있는 최대 모델 유닛 수 | 
| 사용자 지정 모델 Amazon Nova 2 Lite V1.0 256K용으로 생성된 프로비저닝된 처리량에 대한 커밋 없음 모델 단위 | 지원되는 각 리전: 0 | 아니요 | 약정 없이 사용자 지정 모델 Amazon Nova 2 Lite V1.0 256K에 대해 생성된 프로비저닝된 처리량에 할당할 수 있는 최대 모델 단위 수입니다. | 
| 계정당 사용자 지정 프롬프트 라우터 수 | 지원되는 각 리전: 500개 | 아니요 | 리전별 계정당 생성할 수 있는 사용자 지정 프롬프트 라우터의 최대 수입니다. | 
| Amazon Nova Pro V1에 대한 분당 온디맨드 지연 시간 최적화 모델 추론 요청 | 지원되는 각 리전: 10 | 아니요 | Amazon Nova Pro V1에 대해 1분 내에 모델 추론을 위해 제출할 수 있는 온디맨드 지연 시간 최적화 요청의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| Meta Llama 3.1 405B Instruct의 분당 온디맨드 지연 시간 최적화 모델 추론 요청 | 지원되는 각 리전: 100 | 아니요 | Meta Llama 3.1 405B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 지연 시간 최적화 요청 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| Meta Llama 3.1 70B Instruct의 분당 온디맨드 지연 시간 최적화 모델 추론 요청 | 지원되는 각 리전: 100 | 아니요 | Meta Llama 3.1 70B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 지연 시간 최적화 요청 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| Amazon Nova Pro V1에 대한 분당 온디맨드 지연 시간 최적화 모델 추론 토큰 | 지원되는 각 리전: 40,000 | 아니요 | Amazon Nova Pro V1에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 지연 시간 최적화 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Meta Llama 3.1 405B Instruct의 분당 온디맨드 지연 시간 최적화 모델 추론 토큰 | 지원되는 각 리전: 40,000 | 아니요 | Meta Llama 3.1 405B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 지연 시간 최적화 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Meta Llama 3.1 70B Instruct의 분당 온디맨드 지연 시간 최적화 모델 추론 토큰 | 지원되는 각 리전: 40,000 | 아니요 | Meta Llama 3.1 70B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 지연 시간 최적화 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Amazon Nova 2 Multimodal Embeddings V1의 온디맨드 InvokeModel 비동기 동시 요청 | 지원되는 각 리전: 30개 | 아니요 | Amazon Nova 2 Multimodal Embeddings V1에 대해 제출할 수 있는 비동기 동시 모델 추론 요청의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| TwelveLabs Marengo Embed 3.0에 대한 온디맨드 InvokeModel 비동기 동시 요청 | 지원되는 각 리전: 10개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-BC3096B9)  | TwelveLabs Marengo Embed 3.0에 대해 제출할 수 있는 최대 비동기 동시 모델 추론 요청 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| Amazon Nova 2 Sonic에 대한 온디맨드 InvokeModel 동시 요청 | 지원되는 각 리전: 20 | 아니요 | Amazon Nova 2 Sonic에 대해 제출할 수 있는 동시 모델 추론 요청의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| Amazon Nova Reel1.0의 온디맨드 InvokeModel 동시 요청 | 지원되는 각 리전: 10 | 아니요 | Amazon Nova Reel 1.0에 대해 제출할 수 있는 동시 모델 추론 요청의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| Amazon Nova Reel1.1의 온디맨드 InvokeModel 동시 요청 | 지원되는 각 리전: 3 | 아니요 | Amazon Nova Reel 1.1에 대해 제출할 수 있는 동시 모델 추론 요청의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| Amazon Nova Sonic의 온디맨드 InvokeModel 동시 요청 | 지원되는 각 리전: 20 | 아니요 | Amazon Nova Sonic의 모델 추론을 위해 제출할 수 있는 최대 동시 요청 수입니다. | 
| Twelve Labs Marengo의 온디맨드 InvokeModel 동시 요청 | 지원되는 각 리전: 30개 | 아니요 | Twelve Labs Marengo의 모델 추론을 위해 제출할 수 있는 최대 동시 InvokeModel 요청 수입니다. | 
| Twelve Labs Pegasus의 온디맨드 InvokeModel 동시 요청 | 지원되는 각 지역: 30개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-CABD464E)  | Twelve Labs Pegasus의 모델 추론을 위해 제출할 수 있는 최대 동시 InvokeModel 요청 수입니다. | 
| Anthropic Claude 3.5 Haiku의 분당 온디맨드 지연 시간 최적화 모델 추론 요청 | 지원되는 각 리전: 100 | 아니요 | 1분 동안 모델 추론을 직접 호출할 수 있는 최대 횟수입니다. 할당량은 Anthropic Claude 3.5 Haiku에 대한 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다(지연 시간 최적화가 구성된 경우). | 
| Anthropic Claude 3.5 Haiku의 분당 온디맨드 지연 시간 최적화 모델 추론 토큰 | 각각 지원되는 리전: 500,000 | 아니요 | 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Anthropic Claude 3.5 Haiku의 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다(지연 시간 최적화가 구성된 경우). | 
| Luma Ray V2의 온디맨드 모델 추론 동시 요청 | 지원되는 각 리전: 1 | 아니요 | Luma Ray V2의 모델 추론을 위해 제출할 수 있는 최대 동시 요청 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| AI21 Labs Jamba 1.5 Large의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 100 | 아니요 | AI21 Labs Jamba 1.5 Large에서 1분 동안 모델 추론을 직접 호출할 수 있는 최대 횟수입니다. 할당량은 Converse 및 InvokeModel에 대한 요청의 합산 합계를 고려합니다. | 
| AI21 Labs Jamba 1.5 Mini의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 100 | 아니요 | AI21 Labs Jamba 1.5 Mini에서 1분 동안 모델 추론을 직접 호출할 수 있는 최대 횟수입니다. 할당량은 Converse 및 InvokeModel에 대한 요청의 합산 합계를 고려합니다. | 
| Amazon Nova 2 Multimodal Embeddings V1의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 2,000 | 아니요 | Amazon Nova 2 Multimodal Embeddings V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Amazon Nova Canvas의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 100 | 아니요 | Amazon Nova Canvas에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 요청 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| Amazon Nova Lite의 분당 온디맨드 모델 추론 요청 | us-east-1: 2,000<br />eu-west-2: 2,000<br />각각의 지원되는 다른 리전: 200 | 아니요 | Amazon Nova Lite에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Amazon Nova Micro의 분당 온디맨드 모델 추론 요청 | us-east-1: 2,000<br />eu-west-2: 2,000<br />각각의 지원되는 다른 리전: 200 | 아니요 | Amazon Nova Micro에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Amazon Nova Pro의 분당 온디맨드 모델 추론 요청 | 각 지원되는 리전: 250명 | 아니요 | Amazon Nova Pro에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Amazon Rerank 1.0의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 200 | 아니요 | Amazon Rerank 1.0에서 1분 동안 InvokeModel을 직접 호출할 수 있는 최대 횟수입니다. | 
| Amazon Titan Image Generator G1의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 60개 | 아니요 | Amazon Titan Image Generator G1에서 1분 동안 InvokeModel을 직접 호출할 수 있는 최대 횟수입니다. | 
| Amazon Titan Image Generator G1 V2의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 60개 | 아니요 | Amazon Titan Image Generator G1 V2에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Amazon Titan Multimodal Embeddings G1의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 2,000 | 아니요 | Amazon Titan Multimodal Embeddings G1에서 1분 동안 InvokeModel을 직접 호출할 수 있는 최대 횟수입니다. | 
| Amazon Titan Text Embeddings의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 2,000 | 아니요 | Amazon Titan Text Embeddings에서 1분 동안 InvokeModel을 직접 호출할 수 있는 최대 횟수입니다. | 
| Amazon Titan Text Embeddings V2의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 6,000 | 아니요 | Amazon Titan Text Embeddings V2에서 1분 동안 InvokeModel을 직접 호출할 수 있는 최대 횟수입니다. | 
| Amazon Titan Text Express의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 400 | 아니요 | 1분 동안 모델 추론을 직접 호출할 수 있는 최대 횟수입니다. 할당량은 Amazon Titan Text Express에 대한 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| Amazon Titan Text Premier의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 100 | 아니요 | 1분 동안 모델 추론을 직접 호출할 수 있는 최대 횟수입니다. 할당량은 Amazon Titan Text Premier에 대한 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| Anthropic Claude 3 Haiku의 분당 온디맨드 모델 추론 요청 | us-east-1: 1,000<br />us-west-2: 1,000<br />ap-northeast-1: 200<br />ap-southeast-1: 200<br />지원되는 다른 각 리전: 400 | 아니요 | 1분 동안 모델 추론을 직접 호출할 수 있는 최대 횟수입니다. 할당량은 Anthropic Claude 3 Haiku에 대한 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| Anthropic Claude 3 Opus의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 50 | 아니요 | Anthropic Claude 3 Opus에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Anthropic Claude 3 Sonnet의 분당 온디맨드 모델 추론 요청 | us-east-1: 500<br />us-west-2: 500<br />각각의 지원되는 다른 리전: 100 | 아니요 | 1분 동안 모델 추론을 직접 호출할 수 있는 최대 횟수입니다. 할당량은 Anthropic Claude 3 Sonnet에 대한 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| Anthropic Claude 3.5 Haiku의 분당 온디맨드 모델 추론 요청 | us-west-1: 400<br />각각의 지원되는 다른 리전: 1,000 | 아니요 | Anthropic Claude 3.5 Haiku에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Anthropic Claude 3.5 Sonnet의 분당 온디맨드 모델 추론 요청 | us-west-2: 250<br />ap-northeast-1: 20<br />ap-southeast-1: 20<br />eu-central-1: 20<br />eu-west-1: 20<br />eu-west-3: 20<br />각각의 지원되는 다른 리전: 50회 | 아니요 | Anthropic Claude 3.5 Sonnet에서 1분 동안 모델 추론을 직접 호출할 수 있는 최대 횟수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| Anthropic Claude 3.5 Sonnet V2의 분당 온디맨드 모델 추론 요청 | us-west-2: 250<br />각각의 지원되는 다른 리전: 50회 | 아니요 | Anthropic Claude 3.5 Sonnet V2에서 1분 동안 모델 추론을 직접 호출할 수 있는 최대 횟수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| Anthropic Claude 3.7 Sonnet V1의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 125 | 아니요 | Anthropic Claude 3.7 Sonnet V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Anthropic Claude Opus 4.6 V1에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 5,000개 | 아니요 | Anthropic Claude Opus 4.6 V1에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Anthropic Claude Sonnet 4.6에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 5,000개 | 아니요 | Anthropic Claude Sonnet 4.6에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Cohere Command R의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 400 | 아니요 | 1분 동안 모델 추론을 직접 호출할 수 있는 최대 횟수입니다. 할당량은 Cohere Command R 128k에 대한 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| Cohere Command R Plus의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 400 | 아니요 | 1분 동안 모델 추론을 직접 호출할 수 있는 최대 횟수입니다. 할당량은 Cohere Command R Plus 128k에 대한 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| Cohere Embed English의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 2,000 | 아니요 | Cohere Embed English에서 1분 동안 InvokeModel을 직접 호출할 수 있는 최대 횟수입니다. | 
| Cohere Embed Multilingual의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 2,000 | 아니요 | Cohere Embed Multilingual에서 1분 동안 InvokeModel을 직접 호출할 수 있는 최대 횟수입니다. | 
| Cohere Embed V4의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 1,000 | 아니요 | Cohere Embed V4에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Cohere Rerank 3.5의 분당 온디맨드 모델 추론 요청 | 각 지원되는 리전: 250명 | 아니요 | Cohere Rerank 3.5에서 1분 동안 InvokeModel을 직접 호출할 수 있는 최대 횟수입니다. | 
| DeepSeek V3 V1의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | DeepSeek V3 V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| DeepSeek V3.2에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | DeepSeek V3.2에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| GPT OSS Safeguard 120B에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | GPT OSS Safeguard 120B에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| GPT OSS Safeguard 20B에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | GPT OSS Safeguard 20B에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Gemma 3 12B에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | Gemma 3 12B에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Gemma 3 27B에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | Gemma 3 27B에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Gemma 3 4B에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | Gemma 3 4B에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Kimi K2 Thinking에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다K2. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Magistral Small 1.2에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | Magistral Small 1.2에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Meta Llama 3 70B Instruct의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 400 | 아니요 | Meta Llama 3 70B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Meta Llama 3 8B Instruct의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 800 | 아니요 | Meta Llama 3 8B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Meta Llama 3.1 405B Instruct의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 200 | 아니요 | Meta Llama 3.1 405B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Meta Llama 3.1 70B Instruct의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 400 | 아니요 | Meta Llama 3.1 70B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Meta Llama 3.1 8B Instruct의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 800 | 아니요 | Meta Llama 3.1 8B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Meta Llama 3.2 11B Instruct의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 400 | 아니요 | Meta Llama 3.2 11B Instruct에서 1분 동안 모델 추론을 직접 호출할 수 있는 최대 횟수입니다. 할당량은 InvokeModel, InvokeModelWithResponseStream, Converse 및 ConverseStream에 대한 요청의 합산 합계를 고려합니다. | 
| Meta Llama 3.2 1B Instruct의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 800 | 아니요 | Meta Llama 3.2 1B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Meta Llama 3.2 3B Instruct의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 800 | 아니요 | Meta Llama 3.2 3B Instruct에서 1분 동안 모델 추론을 직접 호출할 수 있는 최대 횟수입니다. 할당량은 InvokeModel, InvokeModelWithResponseStream, Converse 및 ConverseStream에 대한 요청의 합산 합계를 고려합니다. | 
| Meta Llama 3.2 90B Instruct의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 400 | 아니요 | Meta Llama 3.2 90B Instruct에서 1분 동안 모델 추론을 직접 호출할 수 있는 최대 횟수입니다. 할당량은 InvokeModel, InvokeModelWithResponseStream, Converse 및 ConverseStream에 대한 요청의 합산 합계를 고려합니다. | 
| Meta Llama 3.3 70B Instruct의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 400 | 아니요 | Meta Llama 3.3 70B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| MiniMax M2.5에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | MiniMax M2.5에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| 미니맥스 M2에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | 미니맥스 M2에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| 미니맥스 M2.1에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | 미니맥스 M2.1에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| 미니스트럴 14B 3.0에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | 미니스트럴 14B 3.0에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| 미니스트럴 3B 3.0에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | 미니스트럴 3B 3.0에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| 미니스트럴 8B 3.0에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | 미니스트럴 8B 3.0에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Mistral 7B Instruct의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 800 | 아니요 | Mistral mistral-7b-instruct-v0에서 1분 동안 InvokeModel을 직접 호출할 수 있는 최대 횟수입니다. | 
| Mistral AI Mistral Small의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 400 | 아니요 | Mistral AI Mistral Small에서 1분 동안 InvokeModel 및 InvokeModelWithResponseStream을 직접 호출할 수 있는 최대 횟수입니다. | 
| Mistral Devstral 2 123b에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | Mistral Devstral 2 123b에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Mistral Large의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 400 | 아니요 | Mistral mistral-large-2402-v1에서 1분 동안 InvokeModel 및 InvokeModelWithResponseStream을 직접 호출할 수 있는 최대 횟수입니다. | 
| Mistral Large 2407의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 400 | 아니요 | Mistral Large 2407에서 1분 동안 모델 추론을 직접 호출할 수 있는 최대 횟수입니다. 할당량은 InvokeModel, InvokeModelWithResponseStream, Converse 및 ConverseStream에 대한 요청의 합산 합계를 고려합니다. | 
| Mistral Large 3에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | Mistral Large 3에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Mistral Mixtral 8x7b Instruct의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 400 | 아니요 | Mistral mixtral-8x7b-v0에서 1분 동안 InvokeModel을 직접 호출할 수 있는 최대 횟수입니다. | 
| Moonshot AI Kimi K2.5에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | Moonshot AI Kimi K2.5에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| NVIDIA Nemotron 3 Super 120B A12B에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | NVIDIA Nemotron 3 Super 120B A12B에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| NVIDIA Nemotron Nano 2에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | NVIDIA Nemotron Nano 2에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| NVIDIA Nemotron Nano 2 VL에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | NVIDIA Nemotron Nano 2 VL에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Nemotron Nano 3 30B에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | Nemotron Nano 3 30B에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| OpenAI GPT OSS 120B의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | OpenAI GPT OSS 120B에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| OpenAI GPT OSS 20B의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | OpenAI GPT OSS 20B에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Qwen3 235B a22b 2507 V1의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | Qwen3 235B a22b 2507 V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Qwen3 32B V1의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | Qwen3 32B V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Qwen3 Coder 30B a3b V1의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | Qwen3 Coder 30B a3b V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Qwen3 Coder 480B a35b V1의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | Qwen3 Coder 480B a35b V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Qwen3 Coder Next에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | Qwen3 Coder Next에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Qwen3 Next 80B A3B에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | Qwen3 Next 80B A3B에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Qwen3 VL 235B A22B에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | Qwen3 VL 235B A22B에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Stability.ai Stable Diffusion 3 Large의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 15 | 아니요 | Stability.ai Stable Diffusion 3 Large에서 1분 동안 InvokeModel을 직접 호출할 수 있는 최대 횟수입니다. | 
| Stability.ai Stable Diffusion 3 Medium의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 60개 | 아니요 | Stability.ai Stable Diffusion 3 Medium에서 1분 동안 InvokeModel을 직접 호출할 수 있는 최대 횟수입니다. | 
| Stability.ai Stable Diffusion 3.5 Large의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 15 | 아니요 | Stability.ai Stable Diffusion 3.5 Large에서 1분 동안 InvokeModel을 직접 호출할 수 있는 최대 횟수입니다. | 
| Stability.ai Stable Image Core의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 90 | 아니요 | Stability.ai Stable Image Core에서 1분 동안 InvokeModel을 직접 호출할 수 있는 최대 횟수입니다. | 
| Stability.ai Stable Image Ultra의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10 | 아니요 | Stability.ai Stable Image Ultra에서 1분 동안 InvokeModel을 직접 호출할 수 있는 최대 횟수입니다. | 
| Stable Image Conservative Upscale의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 2 | 아니요 | Stable Image Conservative Upscale에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Stable Image Control Sketch의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10 | 아니요 | Stable Image Control Sketch에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Stable Image Control Structure의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10 | 아니요 | Stable Image Control Structure에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Stable Image Creative Upscale의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 2 | 아니요 | Stable Image Creative Upscale에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Stable Image Erase Object의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10 | 아니요 | Stable Image Erase Object에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Stable Image Fast Upscale의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10 | 아니요 | Stable Image Fast Upscale에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Stable Image Inpaint의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10 | 아니요 | Stable Image Inpaint에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Stable Image Outpaint의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 2 | 아니요 | Stable Image Outpaint에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Stable Image Remove Background의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10 | 아니요 | Stable Image Remove Background에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Stable Image Search and Recolor의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10 | 아니요 | Stable Image Search and Recolor에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Stable Image Search and Replace의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10 | 아니요 | Stable Image Search and Replace에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Stable Image Style Guide의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10 | 아니요 | Stable Image Style Guide에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Stable Image Style Transfer의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10 | 아니요 | Stable Image Style Transfer에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Twelve Labs Marengo의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 100 | 아니요 | Twelve Labs Marengo에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Twelve Labs Pegasus의 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 60개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5E8692C5)  | Twelve Labs Pegasus에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 요청 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| TwelveLabs Marengo Embed 3.0에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 500 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8CBCC2C0)  | TwelveLabs Marengo Embed 3.0에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Voxtral Mini 1.0에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | Voxtral Mini 1.0에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Voxtral Small 1.0에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | Voxtral Small 1.0에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| 라이터 팔미라 비전 7B에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | 라이터 팔미라 비전 7B에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Z.ai GLM 5에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | Z.ai GLM 5에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Z.ai GLM-4.7에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | Z.ai GLM-4.7에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| Z.ai GLM-4.7 Flash에 대한 분당 온디맨드 모델 추론 요청 | 지원되는 각 리전: 10,000개 | 아니요 | Z.ai GLM-4.7 Flash에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 요청의 최대 수입니다. 이 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream 작업에 대한 총 요청 수를 나타냅니다. | 
| AI21 Labs Jamba 1.5 Large의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 지역: 300,000 | 아니요 | AI21 Labs Jamba 1.5 Large에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 토큰 수입니다. 할당량은 Converse 및 InvokeModel에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| AI21 Labs Jamba 1.5 Mini의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 지역: 300,000 | 아니요 | AI21 Labs Jamba 1.5 Mini에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 토큰 수입니다. 할당량은 Converse 및 InvokeModel에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Amazon Nova Lite의 분당 온디맨드 모델 추론 토큰 | us-east-1: 4,000,000<br />eu-west-2: 4,000,000<br />지원되는 다른 각 리전: 200,000 | 아니요 | Amazon Nova Lite에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Amazon Nova Micro의 분당 온디맨드 모델 추론 토큰 | us-east-1: 4,000,000<br />eu-west-2: 4,000,000<br />지원되는 다른 각 리전: 200,000 | 아니요 | Amazon Nova Micro에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Amazon Nova Pro의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 1,000,000 | 아니요 | Amazon Nova Pro에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Amazon Titan Image Generator G1 V2의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 2,000 | 아니요 | Amazon Titan Image Generator G1 V2에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Amazon Titan Multimodal Embeddings G1의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 지역: 300,000 | 아니요 | Amazon Titan Multimodal Embeddings G1에서 1분 동안 InvokeModel을 통해 제공할 수 있는 최대 토큰 수입니다. | 
| Amazon Titan Text Embeddings의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 지역: 300,000 | 아니요 | Amazon Titan Text Embeddings에서 1분 동안 InvokeModel을 통해 제공할 수 있는 최대 토큰 수입니다. | 
| Amazon Titan Text Embeddings V2의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 지역: 300,000 | 아니요 | Amazon Titan Text Embeddings V2에서 1분 동안 InvokeModel을 통해 제공할 수 있는 최대 토큰 수입니다. | 
| Amazon Titan Text Express의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 지역: 300,000 | 아니요 | 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Amazon Titan Text Express의 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Amazon Titan Text Premier의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 지역: 300,000 | 아니요 | 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Amazon Titan Text Premier의 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude 3 Haiku의 분당 온디맨드 모델 추론 토큰 | us-east-1: 2,000,000<br />us-west-2: 2,000,000<br />ap-northeast-1: 200,000<br />ap-southeast-1: 200,000<br />지원되는 다른 각 리전: 300,000 | 아니요 | 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Anthropic Claude 3 Haiku의 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude 3 Opus의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 400,000 | 아니요 | Anthropic Claude 3 Opus에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude 3 Sonnet의 분당 온디맨드 모델 추론 토큰 | us-east-1: 1,000,000<br />us-west-2: 1,000,000<br />지원되는 다른 각 리전: 200,000 | 아니요 | 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Anthropic Claude 3 Sonnet의 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude 3.5 Haiku의 분당 온디맨드 모델 추론 토큰 | us-west-1: 300,000<br />지원되는 다른 각 리전: 2,000,000 | 아니요 | Anthropic Claude 3.5 Haiku에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude 3.5 Sonnet의 분당 온디맨드 모델 추론 토큰 | us-west-2: 2,000,000<br />ap-northeast-1: 200,000<br />ap-southeast-1: 200,000<br />eu-central-1: 200,000<br />eu-west-1: 200,000<br />eu-west-3: 200,000<br />지원되는 다른 각 리전: 400,000 | 아니요 | Anthropic Claude 3.5 Sonnet에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| Anthropic Claude 3.5 Sonnet V2의 분당 온디맨드 모델 추론 토큰 | us-west-2: 2,000,000<br />지원되는 다른 각 리전: 400,000 | 아니요 | Anthropic Claude 3.5 Sonnet V2에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream의 합산 합계를 고려합니다. | 
| Anthropic Claude 3.7 Sonnet V1의 분당 온디맨드 모델 추론 토큰 | 각각 지원되는 리전: 500,000 | 아니요 | Anthropic Claude 3.7 Sonnet V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Opus 4.6 V1에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 1,500,000 | 아니요 | Anthropic Claude Opus 4.6 V1에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Anthropic Claude Sonnet 4.6에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 3,000,000 | 아니요 | Anthropic Claude Sonnet 4.6에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Cohere Command R의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 지역: 300,000 | 아니요 | 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Cohere Command R 128k의 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Cohere Command R Plus의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 지역: 300,000 | 아니요 | 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Cohere Command R Plus 128k의 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Cohere Embed English의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 지역: 300,000 | 아니요 | Cohere Embed English에서 1분 동안 InvokeModel을 통해 제공할 수 있는 최대 토큰 수입니다. | 
| Cohere Embed Multilingual의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 지역: 300,000 | 아니요 | Cohere Embed Multilingual에서 1분 동안 InvokeModel을 통해 제공할 수 있는 최대 토큰 수입니다. | 
| Cohere Embed V4의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 150,000 | 아니요 | Cohere Embed V4에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| DeepSeek V3 V1의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | DeepSeek V3 V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| DeepSeek V3.2에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | DeepSeek V3.2에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| GPT OSS Safeguard 120B에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | GPT OSS Safeguard 120B에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| GPT OSS Safeguard 20B에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | GPT OSS Safeguard 20B에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Gemma 3 12B에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | Gemma 3 12B에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Gemma 3 27B에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | Gemma 3 27B에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Gemma 3 4B에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | Gemma 3 4B에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Kimi K2 Thinking에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | Kimi K2 Thinking에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Magistral Small 1.2에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | Magistral Small 1.2에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Meta Llama 3 70B Instruct의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 지역: 300,000 | 아니요 | Meta Llama 3 70B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Meta Llama 3 8B Instruct의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 지역: 300,000 | 아니요 | Meta Llama 3 8B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Meta Llama 3.1 405B Instruct의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 400,000 | 아니요 | Meta Llama 3.1 405B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Meta Llama 3.1 70B Instruct의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 지역: 300,000 | 아니요 | Meta Llama 3.1 70B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Meta Llama 3.1 8B Instruct의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 지역: 300,000 | 아니요 | Meta Llama 3.1 8B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Meta Llama 3.2 11B Instruct의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 지역: 300,000 | 아니요 | Meta Llama 3.2 11B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 토큰 수입니다. 할당량은 InvokeModel, InvokeModelWithResponseStream, Converse 및 ConverseStream에 대한 토큰의 합산 합계를 고려합니다. | 
| Meta Llama 3.2 1B Instruct의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 지역: 300,000 | 아니요 | Meta Llama 3.2 1B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Meta Llama 3.2 3B Instruct의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 지역: 300,000 | 아니요 | Meta Llama 3.2 3B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 토큰 수입니다. 할당량은 InvokeModel, InvokeModelWithResponseStream, Converse 및 ConverseStream에 대한 토큰의 합산 합계를 고려합니다. | 
| Meta Llama 3.2 90B Instruct의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 지역: 300,000 | 아니요 | Meta Llama 3.2 90B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 토큰 수입니다. 할당량은 InvokeModel, InvokeModelWithResponseStream, Converse 및 ConverseStream에 대한 토큰의 합산 합계를 고려합니다. | 
| Meta Llama 3.3 70B Instruct의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 지역: 300,000 | 아니요 | Meta Llama 3.3 70B Instruct에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| MiniMax M2.5에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | MiniMax M2.5에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| 미니맥스 M2에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | 미니맥스 M2의 경우 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| 미니맥스 M2.1의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | 미니맥스 M2.1의 경우 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| 미니스트럴 14B 3.0에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | 미니스트럴 14B 3.0의 경우 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| 미니스트럴 3B 3.0의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | 미니스트럴 3B 3.0의 경우 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| 미니스트럴 8B 3.0에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | 미니스트럴 8B 3.0의 경우 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Mistral AI Mistral 7B Instruct의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 지역: 300,000 | 아니요 | 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Mistral AI Mistral 7B Instruct의 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Mistral AI Mistral Large의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 지역: 300,000 | 아니요 | 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Mistral AI Mistral Large의 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Mistral AI Mistral Small의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 지역: 300,000 | 아니요 | 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Mistral AI Mistral Small의 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Mistral AI Mixtral 8X7BB Instruct의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 지역: 300,000 | 아니요 | 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Mistral AI Mixtral 8X7B Instruct의 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Mistral Devstral 2 123b에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | Mistral Devstral 2 123b에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Mistral Large 2407의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 지역: 300,000 | 아니요 | Mistral Large 2407에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 토큰 수입니다. 할당량은 InvokeModel, InvokeModelWithResponseStream, Converse 및 ConverseStream에 대한 토큰의 합산 합계를 고려합니다. | 
| Mistral Large 3에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | Mistral Large 3에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Moonshot AI Kimi K2.5에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | Moonshot AI Kimi K2.5에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| NVIDIA Nemotron 3 Super 120B A12B에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | NVIDIA Nemotron 3 Super 120B A12B에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| NVIDIA Nemotron Nano 2의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | NVIDIA Nemotron Nano 2에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| NVIDIA Nemotron Nano 2 VL에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | NVIDIA Nemotron Nano 2 VL에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Nemotron Nano 3 30B에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | Nemotron Nano 3 30B에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| OpenAI GPT OSS 120B의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | OpenAI GPT OSS 120B에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| OpenAI GPT OSS 20B의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | OpenAI GPT OSS 20B에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Qwen3 235B a22b 2507 V1의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | Qwen3 235B a22b 2507 V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Qwen3 32B V1의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | Qwen3 32B V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Qwen3 Coder 30B a3b V1의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | Qwen3 Coder 30B a3b V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Qwen3 Coder 480B a35b V1의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | Qwen3 Coder 480B a35b V1에서 1분 동안 모델 추론을 위해 제출할 수 있는 최대 온디맨드 토큰 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Qwen3 Coder Next에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | Qwen3 Coder Next에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Qwen3 Next 80B A3B에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | Qwen3 Next 80B A3B에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Qwen3 VL 235B A22B에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | Qwen3 VL 235B A22B에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Voxtral Mini 1.0에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | Voxtral Mini 1.0에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Voxtral Small 1.0에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | Voxtral Small 1.0에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| 라이터 팔미라 비전 7B의 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | 라이터 팔미라 비전 7B에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Z.ai GLM 5에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | Z.ai GLM 5에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Z.ai GLM-4.7에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | Z.ai GLM-4.7에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| Z.ai GLM-4.7 Flash에 대한 분당 온디맨드 모델 추론 토큰 | 지원되는 각 리전: 100,000,000 | 아니요 | Z.ai GLM-4.7 Flash에 대해 1분 동안 모델 추론을 위해 제출할 수 있는 온디맨드 토큰의 최대 수입니다. 할당량은 Converse, ConverseStream, InvokeModel 및 InvokeModelWithResponseStream에 대한 모든 요청에서 입력 및 출력 토큰의 합산 합계를 고려합니다. | 
| 함수당 파라미터 | 지원되는 각 리전: 5개 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4B4330A0)  | 작업 그룹 함수에 포함할 수 있는 최대 파라미터 수입니다. | 
| 초당 PrepareAgent 요청 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 PrepareAgent API 요청 수입니다. | 
| Amazon Nova 2 멀티모달 임베딩 V1에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7DCA4380)  | Amazon Nova 2 멀티모달 임베딩 V1에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Amazon Nova Premier의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-131D4EED)  | Amazon Nova Premier에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Claude 3 Haiku의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1F644C2A)  | Claude 3 Haiku에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Claude 3 Opus의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E8FA49DB)  | Claude 3 Opus에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Claude 3 Sonnet의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-16E25672)  | Claude 3 Sonnet에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Claude 3.5 Haiku의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-274AA31F)  | Claude 3.5 Haiku에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Claude 3.5 Sonnet의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1E2B9998)  | Claude 3.5 Sonnet에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Claude 3.5 Sonnet v2의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-6EBFEB27)  | Claude 3.5 Sonnet v2에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Claude 3.7 Sonnet의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FABEE48F)  | Claude 3.7 Sonnet에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Claude Haiku 4.5에 대한 배치 추론 작업당 레코드 | me-central-1: 50,000<br />각각의 지원되는 다른 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-28612175)  | Claude Haiku 4.5에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Claude Opus 4.5에 대한 배치 추론 작업당 레코드 | me-central-1: 50,000<br />각각의 지원되는 다른 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-2767B9A9)  | Claude Opus 4.5에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Claude Opus 4.6에 대한 배치 추론 작업당 레코드 | me-central-1: 50,000<br />각각의 지원되는 다른 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9AA02BEF)  | Claude Opus 4.6에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Claude Sonnet 4의 배치 추론 작업당 레코드 | me-central-1: 50,000<br />각각의 지원되는 다른 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8A6B31EE)  | Claude Sonnet 4에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Claude Sonnet 4.5에 대한 배치 추론 작업당 레코드 | me-central-1: 50,000<br />각각의 지원되는 다른 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FFFEDD8D)  | Claude Sonnet 4.5에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Claude Sonnet 4.6에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-01A2DC4B)  | Claude Sonnet 4.6에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| DeepSeek V3.2에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-73951D97)  | DeepSeek V3.2에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| DeepSeek v3의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-35900968)  | DeepSeek v3에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Devstral 2 123B에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-11C1CE94)  | Devstral 2 123B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| GLM 4.7에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-ECA45411)  | GLM 4.7에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| GLM 4.7 Flash에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-BB255931)  | GLM 4.7 Flash에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| GLM 5에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-64CF3679)  | GLM 5에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Gemma 3 12B에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5A51050A)  | Gemma 3 12B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Gemma 3 27B에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-ECD87E6C)  | Gemma 3 27B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Gemma 3 4B에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E1D21B18)  | Gemma 3 4B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Kimi K2 Thinking에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-CEEE0EE8)  | Kimi K2 Thinking에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Kimi K2.5에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-63010E1B)  | Kimi K2.5에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Llama 3.1 405B Instruct의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-AA411D03)  | Llama 3.1 405B Instruct에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Llama 3.1 70B Instruct의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8D07E980)  | Llama 3.1 70B Instruct에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Llama 3.1 8B Instruct의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FA06C205)  | Llama 3.1 8B Instruct에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Llama 3.2 11B Instruct의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-95CACD43)  | Llama 3.2 11B Instruct에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Llama 3.2 1B Instruct의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FF73AE42)  | Llama 3.2 1B Instruct에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Llama 3.2 3B Instruct의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-982DE2DB)  | Llama 3.2 3B Instruct에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Llama 3.2 90B Instruct의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4821684D)  | Llama 3.2 90B Instruct에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Llama 3.3 70B Instruct의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E293C7C7)  | Llama 3.3 70B Instruct에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Llama 4 Maverick의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-6FAB43BE)  | Llama 4 Maverick에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Llama 4 Scout의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D41E62E4)  | Llama 4 Scout에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Magistral Small 2509에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-78C12D54)  | Magistral Small 2509에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| MiniMax M2에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-CDF99FD2)  | MiniMax M2에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| MiniMax M2.1에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4D2272DC)  | MiniMax M2.1에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| MiniMax M2.5에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C4659D61)  | MiniMax M2.5에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| 미니스트럴 3 14B에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-DBFC8DC8)  | Ministral 3 14B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Ministral 3 8B에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1F923A43)  | Ministral 3 8B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| 미니스트럴 3B에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1AD2F2A2)  | Ministral 3B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Mistral Large 2(24.07)의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-CA80888F)  | Mistral Large 2(24.07)에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Mistral Large 3에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-90807536)  | Mistral Large 3에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Mistral Small의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-072E11FC)  | Mistral Small에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| NVIDIA Nemotron 3 Super 120B A12B에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-196A63C0)  | NVIDIA Nemotron 3 Super 120B A12B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| NVIDIA Nemotron Nano 12B에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-214BEB81)  | NVIDIA Nemotron Nano 12B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| NVIDIA Nemotron Nano 3 30B에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-87934C8F)  | NVIDIA Nemotron Nano 3 30B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| NVIDIA Nemotron Nano 9B에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5325EC5D)  | NVIDIA Nemotron Nano 9B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Nova 2 Lite에 대한 배치 추론 작업당 레코드 | me-central-1: 50,000<br />각각의 지원되는 다른 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-ECCE76C6)  | Nova 2 Lite에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Nova Lite V1의 배치 추론 작업당 레코드 | me-central-1: 50,000<br />각각의 지원되는 다른 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-916C9264)  | Nova Lite V1에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Nova Micro V1의 배치 추론 작업당 레코드 | me-central-1: 50,000<br />각각의 지원되는 다른 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-57DC56A1)  | Nova Micro V1에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Nova Pro V1의 배치 추론 작업당 레코드 | me-central-1: 50,000<br />각각의 지원되는 다른 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-89197AE6)  | Nova Pro V1에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| OpenAI GPT OSS 120b의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-3C5D1B25)  | OpenAI GPT OSS 120b에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| OpenAI GPT OSS 20b의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F361DF0F)  | OpenAI GPT OSS 20b에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| OpenAI GPT OSS Safeguard 120b에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1D2360E7)  | OpenAI GPT OSS Safeguard 120b에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| OpenAI GPT OSS Safeguard 20b에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-142AED8F)  | OpenAI GPT OSS Safeguard 20b에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Qwen3 235B의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C19807B8)  | Qwen3 235B에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Qwen3 32B의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-DF5FF3C8)  | Qwen3 32B에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Qwen3 Coder 30B의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-38EFD889)  | Qwen3 Coder 30B에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Qwen3 Coder 480B의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-BF9B3702)  | Qwen3 Coder 480B에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Qwen3 Coder Next에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-273728E2)  | Qwen3 Coder Next에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Qwen3 Next 80B에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-320BE465)  | Qwen3 Next 80B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Qwen3 VL 235B에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1F7ACACC)  | Qwen3 VL 235B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Titan Multimodal Embeddings G1의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-3BD2251E)  | Titan Multimodal Embeddings G1에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Titan Text Embeddings V2의 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-AAC5F6D6)  | Titan Text Embeddings V2에 대한 배치 추론 작업에서 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Voxtral Mini 3B 2507에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-CD4E1CD6)  | Voxtral Mini 3B 2507에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Voxtral Small 24B 2507에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FE086D36)  | Voxtral Small 24B 2507에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| 라이터 팔미라 비전 7B에 대한 배치 추론 작업당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-121F4E1E)  | Writer Palmyra Vision 7B에 대한 배치 추론 작업의 모든 입력 파일에 대한 최대 레코드 수입니다. | 
| Amazon Nova 2 멀티모달 임베딩 V1에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7EAC9E78)  | Amazon Nova 2 Multimodal Embeddings V1에 대한 배치 추론 작업의 입력 파일에 있는 최대 레코드 수입니다. | 
| Amazon Nova Premier의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-169A395B)  | Amazon Nova Premier에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Claude 3 Haiku의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-EBB72C32)  | Claude 3 Haiku에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Claude 3 Opus의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-642905B5)  | Claude 3 Opus에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Claude 3 Sonnet의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E93C745B)  | Claude 3 Sonnet에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Claude 3.5 Haiku의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C39B6D57)  | Claude 3.5 Haiku에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Claude 3.5 Sonnet의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5AB0EE48)  | Claude 3.5 Sonnet에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Claude 3.5 Sonnet v2의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-897F8151)  | Claude 3.5 Sonnet v2에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Claude 3.7 Sonnet의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-A985813D)  | Claude 3.7 Sonnet에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Claude Haiku 4.5에 대한 배치 추론 작업당 입력 파일당 레코드 | me-central-1: 50,000<br />각각의 지원되는 다른 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9EDE6039)  | Claude Haiku 4.5에 대한 배치 추론 작업의 입력 파일에 있는 최대 레코드 수입니다. | 
| Claude Opus 4.5에 대한 배치 추론 작업당 입력 파일당 레코드 | me-central-1: 50,000<br />각각의 지원되는 다른 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F7440010)  | Claude Opus 4.5의 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Claude Opus 4.6에 대한 배치 추론 작업당 입력 파일당 레코드 | me-central-1: 50,000<br />각각의 지원되는 다른 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D8E451A7)  | Claude Opus 4.6의 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Claude Sonnet 4의 배치 추론 작업별 입력 파일당 레코드 | me-central-1: 50,000<br />각각의 지원되는 다른 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-02DB18B4)  | Claude Sonnet 4에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Claude Sonnet 4.5에 대한 배치 추론 작업당 입력 파일당 레코드 | me-central-1: 50,000<br />각각의 지원되는 다른 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4DFF050E)  | Claude Sonnet 4.5의 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Claude Sonnet 4.6에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-391CEF89)  | Claude Sonnet 4.6의 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| DeepSeek V3.2에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9E38DD81)  | DeepSeek V3.2의 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| DeepSeek v3의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-48DD3868)  | DeepSeek v3에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Devstral 2 123B에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-92349F9F)  | Devstral 2 123B의 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| GLM 4.7에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7BE9625C)  | GLM 4.7에 대한 배치 추론 작업의 입력 파일에 있는 최대 레코드 수입니다. | 
| GLM 4.7 Flash에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8CE8B022)  | GLM 4.7 Flash에 대한 배치 추론 작업의 입력 파일에 있는 최대 레코드 수입니다. | 
| GLM 5에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8A232422)  | GLM 5에 대한 배치 추론 작업의 입력 파일에 있는 최대 레코드 수입니다. | 
| Gemma 3 12B에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-114ABFC3)  | Gemma 3 12B의 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Gemma 3 27B에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FD7B3EB8)  | Gemma 3 27B에 대한 배치 추론 작업의 입력 파일에 있는 최대 레코드 수입니다. | 
| Gemma 3 4B에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-65D1D550)  | Gemma 3 4B에 대한 배치 추론 작업의 입력 파일에 있는 최대 레코드 수입니다. | 
| Kimi K2 Thinking에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-852FB779)  | Kimi K2 Thinking에 대한 배치 추론 작업의 입력 파일에 있는 최대 레코드 수입니다. | 
| Kimi K2.5에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-15B51EC1)  | Kimi K2.5에 대한 배치 추론 작업의 입력 파일에 있는 최대 레코드 수입니다. | 
| Llama 3.1 405B Instruct의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8651ED26)  | Llama 3.1 405B Instruct에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Llama 3.1 70B Instruct의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E038D932)  | Llama 3.1 70B Instruct에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Llama 3.1 8B Instruct의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-AFE8E0CD)  | Llama 3.1 8B Instruct에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Llama 3.2 11B Instruct의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D30E6B4B)  | Llama 3.2 11B Instruct에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Llama 3.2 1B Instruct의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-478319B0)  | Llama 3.2 1B Instruct에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Llama 3.2 3B Instruct의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F2E6F90D)  | Llama 3.2 3B Instruct에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Llama 3.2 90B Instruct의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-51B0DEE7)  | Llama 3.2 90B Instruct에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Llama 3.3 70B Instruct의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F77743B5)  | Llama 3.3 70B Instruct에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Llama 4 Maverick의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B4B995D8)  | Llama 4 Maverick에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Llama 4 Scout의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-92E7FE32)  | Llama 4 Scout에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Magistral Small 2509에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-37A44E24)  | Magistral Small 2509의 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| MiniMax M2에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F2107865)  | MiniMax M2에 대한 배치 추론 작업의 입력 파일에 있는 최대 레코드 수입니다. | 
| MiniMax M2.1에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FB43CE55)  | MiniMax M2.1의 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| MiniMax M2.5에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-BC9ED53F)  | MiniMax M2.5의 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Ministral 3 14B에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E3C8B9C9)  | Ministral 3 14B에 대한 배치 추론 작업의 입력 파일에 있는 최대 레코드 수입니다. | 
| 미니스트럴 3 8B에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1401504A)  | Ministral 3 8B에 대한 배치 추론 작업의 입력 파일에 있는 최대 레코드 수입니다. | 
| 미니스트럴 3B에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9335BC45)  | Ministral 3B에 대한 배치 추론 작업의 입력 파일에 있는 최대 레코드 수입니다. | 
| Mistral Large 2(24.07)의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-BAE2EB93)  | Mistral Large 2(24.07)에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Mistral Large 3에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B1E4F57A)  | Mistral Large 3의 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Mistral Small의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E6489B37)  | Mistral Small에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| NVIDIA Nemotron 3 Super 120B A12B에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-69AC41C2)  | NVIDIA Nemotron 3 Super 120B A12B의 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| NVIDIA Nemotron Nano 12B에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FDE45816)  | NVIDIA Nemotron Nano 12B의 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| NVIDIA Nemotron Nano 3 30B에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-AE040A57)  | NVIDIA Nemotron Nano 3 30B의 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| NVIDIA Nemotron Nano 9B에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F225D073)  | NVIDIA Nemotron Nano 9B의 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Nova 2 Lite에 대한 배치 추론 작업당 입력 파일당 레코드 | me-central-1: 50,000<br />각각의 지원되는 다른 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4A832410)  | Nova 2 Lite의 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Nova Lite V1의 배치 추론 작업별 입력 파일당 레코드 | me-central-1: 50,000<br />각각의 지원되는 다른 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B8626674)  | Nova Lite V1에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Nova Micro V1의 배치 추론 작업별 입력 파일당 레코드 | me-central-1: 50,000<br />각각의 지원되는 다른 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D56DF585)  | Nova Micro V1에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Nova Pro V1의 배치 추론 작업별 입력 파일당 레코드 | me-central-1: 50,000<br />각각의 지원되는 다른 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9B651738)  | Nova Pro V1에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| OpenAI GPT OSS 120b의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9EF11C18)  | OpenAI GPT OSS 120b에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| OpenAI GPT OSS 20b의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-EF804815)  | OpenAI GPT OSS 20b에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| OpenAI GPT OSS Safeguard 120b에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-EDE20AF1)  | OpenAI GPT OSS Safeguard 120b에 대한 배치 추론 작업의 입력 파일에 있는 최대 레코드 수입니다. | 
| OpenAI GPT OSS Safeguard 20b에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-135AE4B7)  | OpenAI GPT OSS Safeguard 20b의 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Qwen3 235B의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FD509977)  | Qwen3 235B에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Qwen3 32B의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-28258E5D)  | Qwen3 32B에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Qwen3 Coder 30B의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-46EFABBA)  | Qwen3 Coder 30B에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Qwen3 Coder 480B의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-AE136EE5)  | Qwen3 Coder 480B에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Qwen3 Coder Next에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-0D1F6A84)  | Qwen3 Coder Next에 대한 배치 추론 작업의 입력 파일에 있는 최대 레코드 수입니다. | 
| Qwen3 Next 80B에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-962E1C58)  | Qwen3 Next 80B에 대한 배치 추론 작업의 입력 파일에 있는 최대 레코드 수입니다. | 
| Qwen3 VL 235B에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-DFE5A893)  | Qwen3 VL 235B에 대한 배치 추론 작업의 입력 파일에 있는 최대 레코드 수입니다. | 
| Titan Multimodal Embeddings G1의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-81E26054)  | Titan Multimodal Embeddings G1에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Titan Text Embeddings V2의 배치 추론 작업별 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D1151D45)  | Titan Text Embeddings V2에 대한 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Voxtral Mini 3B 2507에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7C1813A6)  | Voxtral Mini 3B 2507의 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Voxtral Small 24B 2507에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-DE84A1A0)  | Voxtral Small 24B 2507의 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Writer Palmyra Vision 7B에 대한 배치 추론 작업당 입력 파일당 레코드 | 지원되는 각 리전: 100,000 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8A361B65)  | Writer Palmyra Vision 7B의 배치 추론 작업에서 입력 파일의 최대 레코드 수입니다. | 
| Amazon Nova 2 멀티모달 임베딩 V1용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-AF2A00BD)  | Amazon Nova 2 멀티모달 임베딩 V1의 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| Amazon Nova Premier용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-654787A4)  | Amazon Nova Premier용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Claude 3 Haiku용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1570CF9E)  | Claude 3 Haiku용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Claude 3 Opus용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-9A0F509C)  | Claude 3 Opus용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Claude 3 Sonnet용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-67BD0D49)  | Claude 3 Sonnet용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Claude 3.5 Haiku용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-220B8A25)  | Claude 3.5 Haiku용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Claude 3.5 Sonnet용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4E7EE0B5)  | Claude 3.5 Sonnet용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Claude 3.5 Sonnet v2용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C2FA9AEC)  | Claude 3.5 Sonnet v2용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Claude 3.7 Sonnet용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E455959C)  | Claude 3.7 Sonnet용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Claude Haiku 4.5용 기본 모델을 사용하여 진행 중인 배치 추론 작업과 제출된 배치 추론 작업의 합계 | me-central-1: 20<br />각각의 지원되는 다른 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-63020993)  | Claude Haiku 4.5용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| Claude Opus 4.5용 기본 모델을 사용하여 진행 중인 배치 추론 작업과 제출된 배치 추론 작업의 합계 | me-central-1: 20<br />각각의 지원되는 다른 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E83AC604)  | Claude Opus 4.5용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| Claude Opus 4.6용 기본 모델을 사용하여 진행 중인 배치 추론 작업과 제출된 배치 추론 작업의 합계 | me-central-1: 20<br />각각의 지원되는 다른 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B0F56DCF)  | Claude Opus 4.6용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| Claude Sonnet 4용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | me-central-1: 20<br />각각의 지원되는 다른 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-79EFF176)  | Claude Sonnet 4용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Claude Sonnet 4.5용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 합계입니다. | me-central-1: 20<br />각각의 지원되는 다른 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-A0300844)  | Claude Sonnet 4.5용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| Claude Sonnet 4.6용 기본 모델을 사용하여 진행 중인 배치 추론 작업과 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-3030E098)  | Claude Sonnet 4.6용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| DeepSeek V3.2용 기본 모델을 사용하여 진행 중인 배치 추론 작업과 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D1C9F3B9)  | DeepSeek V3.2용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| DeepSeek v3용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1C19AAE8)  | DeepSeek v3용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Devstral 2 123B용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-95CB8E2F)  | Devstral 2 123B용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| GLM 4.7용 기본 모델을 사용하여 진행 중인 배치 추론 작업과 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-EA873E18)  | GLM 4.7용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| GLM 4.7 Flash용 기본 모델을 사용하여 진행 중인 배치 추론 작업과 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E453CCF3)  | GLM 4.7 Flash용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| GLM 5용 기본 모델을 사용하여 진행 중인 배치 추론 작업과 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5BA88337)  | GLM 5용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| Gemma 3 12B용 기본 모델을 사용하여 진행 중인 배치 추론 작업과 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-71A1F0FA)  | Gemma 3 12B용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| Gemma 3 27B용 기본 모델을 사용하여 진행 중인 배치 추론 작업과 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C6AAFCD0)  | Gemma 3 27B용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| Gemma 3 4B용 기본 모델을 사용하여 진행 중인 배치 추론 작업과 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-DC465F65)  | Gemma 3 4B용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| Kimi K2 Thinking용 기본 모델을 사용하여 진행 중인 배치 추론 작업과 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-78B4AF01)  | Kimi K2 Thinking의 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| 키미 K2.5용 기본 모델을 사용하여 진행 중인 배치 추론 작업과 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-EC77BD96)  | Kimi K2.5용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| Llama 3.1 405B Instruct용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-A0AAB785)  | Llama 3.1 405B Instruct용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Llama 3.1 70B Instruct용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-62E2A345)  | Llama 3.1 70B Instruct용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Llama 3.1 8B Instruct용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-391478D2)  | Llama 3.1 8B Instruct용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Llama 3.2 11B Instruct용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-3CCB3548)  | Llama 3.2 11B Instruct용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Llama 3.2 1B Instruct용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-8CC57EDA)  | Llama 3.2 1B Instruct용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Llama 3.2 3B Instruct용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-059C1AAB)  | Llama 3.2 3B Instruct용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Llama 3.2 90B Instruct용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-89923E2C)  | Llama 3.2 90B Instruct용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Llama 3.3 70B Instruct용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FE24F76E)  | Llama 3.3 70B Instruct용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Llama 4 Maverick용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-4E7DDF49)  | Llama 4 Maverick용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Llama 4 Scout용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B1E11F5B)  | Llama 4 Scout용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Magistral Small 2509용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-53B814D7)  | Magistral Small 2509용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| MiniMax M2용 기본 모델을 사용하여 진행 중인 배치 추론 작업과 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-A94DA744)  | MiniMax M2용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| MiniMax M2.1용 기본 모델을 사용하여 진행 중인 배치 추론 작업과 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C05EB25B)  | MiniMax M2.1용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| MiniMax M2.5용 기본 모델을 사용하여 진행 중인 배치 추론 작업과 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-B49AA29C)  | MiniMax M2.5용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| 미니스트럴 3 14B용 기본 모델을 사용하여 진행 중인 배치 추론 작업과 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-29BDACF9)  | Ministral 3 14B용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| Ministral 3 8B용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-89117837)  | Ministral 3 8B용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| Ministral 3B용 기본 모델을 사용하여 진행 중인 배치 추론 작업과 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D13C968B)  | Ministral 3B용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| Mistral Large 2(24.07)용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-5D367E5C)  | Mistral Large 2(24.07)용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Mistral Large 3용 기본 모델을 사용하여 진행 중인 배치 추론 작업과 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-090C78B9)  | Mistral Large 3용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| Mistral Small용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-A986092E)  | Mistral Small용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| NVIDIA Nemotron 3 Super 120B A12B용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-6D88F00E)  | NVIDIA Nemotron 3 Super 120B A12B용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| NVIDIA Nemotron Nano 12B용 기본 모델을 사용하여 진행 중인 배치 추론 작업과 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-EEE88DB2)  | NVIDIA Nemotron Nano 12B용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| NVIDIA Nemotron Nano 3 30B용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-0ED8E85F)  | NVIDIA Nemotron Nano 3 30B용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| NVIDIA Nemotron Nano 9B용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-864449ED)  | NVIDIA Nemotron Nano 9B용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| Nova 2 Lite용 기본 모델을 사용하여 진행 중인 배치 추론 작업과 제출된 배치 추론 작업의 합계 | me-central-1: 20<br />각각의 지원되는 다른 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-10F69CA1)  | Nova 2 Lite용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| Nova Lite V1용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | me-central-1: 20<br />각각의 지원되는 다른 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-E2ED42E6)  | Nova Lite V1용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Nova Micro V1용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | me-central-1: 20<br />각각의 지원되는 다른 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-564C017C)  | Nova Micro V1용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Nova Pro V1용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | me-central-1: 20<br />각각의 지원되는 다른 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-FE130012)  | Nova Pro V1용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| OpenAI GPT OSS 120b용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-07844084)  | OpenAI GPT OSS 120b용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| OpenAI GPT OSS 20b용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-50CC95A8)  | OpenAI GPT OSS 20b용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| OpenAI GPT OSS Safeguard 120b용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-D9E467C0)  | OpenAI GPT OSS Safeguard 120b용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| OpenAI GPT OSS Safeguard 20b용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-811E997F)  | OpenAI GPT OSS Safeguard 20b용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| Qwen3 235B용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-91E3DBE2)  | Qwen3 235B용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Qwen3 32B용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7B9A79C8)  | Qwen3 32B용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Qwen3 Coder 30B용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-F30EAB98)  | Qwen3 Coder 30B용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Qwen3 Coder 480B용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-A02F87EC)  | Qwen3 Coder 480B용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Qwen3 Coder Next용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-091EBF74)  | Qwen3 Coder Next의 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| Qwen3 Next 80B용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-EA6F6B5F)  | Qwen3 Next 80B용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| Qwen3 VL 235B용 기본 모델을 사용하여 진행 중인 배치 추론 작업과 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-990A2394)  | Qwen3 VL 235B용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| Titan Multimodal Embeddings G1용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-7F2C6F33)  | Titan Multimodal Embeddings G1용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Titan Text Embeddings V2용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-1AC1CABC)  | Titan Text Embeddings V2용 기본 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Voxtral Mini 3B 2507용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-BA72E406)  | Voxtral Mini 3B 2507용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| Voxtral Small 24B 2507용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-C540484E)  | Voxtral Small 24B 2507용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| Writer Palmyra Vision 7B용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 합계 | 지원되는 각 리전: 100 |  [예](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas/L-88DE0CAC)  | Writer Palmyra Vision 7B용 기본 모델을 사용하여 진행 중 및 제출된 배치 추론 작업의 최대 수입니다. | 
| Titan Multimodal Embeddings G1용 사용자 지정 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 3 | 아니요 | Titan Multimodal Embeddings G1용 사용자 지정 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Titan Text Embeddings V2용 사용자 지정 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수의 합계 | 지원되는 각 리전: 3 | 아니요 | Titan Text Embeddings V2용 사용자 지정 모델을 사용하여 진행 중인 배치 추론 작업 수와 제출된 배치 추론 작업 수 합계의 최대 수입니다. | 
| Bedrock Data Automation Runtime: ListTagsForResource에 대한 요율 조절 제한 | 지원되는 각 리전: 초당 25개 | 아니요 | 현재 리전에서 계정별로 초당 수행할 수 있는 Bedrock Data Automation Runtime: ListTagsForResource 요청의 최대 수입니다. | 
| Bedrock Data Automation Runtime: TagResource에 대한 요율 조절 제한 | 지원되는 각 리전: 초당 25개 | 아니요 | 현재 리전에서 계정별로 초당 수행할 수 있는 Bedrock Data Automation Runtime: TagResource 요청의 최대 수입니다. | 
| Bedrock Data Automation Runtime: UntagResource에 대한 요율 조절 제한 | 지원되는 각 리전: 초당 25개 | 아니요 | 현재 리전에서 계정별로 초당 수행할 수 있는 Bedrock Data Automation Runtime: UntagResource 요청의 최대 수입니다. | 
| Bedrock Data Automation: ListTagsForResource에 대한 요율 조절 제한 | 지원되는 각 리전: 초당 25개 | 아니요 | 현재 리전에서 계정별로 초당 수행할 수 있는 Bedrock Data Automation: ListTagsForResource 요청의 최대 수입니다. | 
| Bedrock Data Automation: TagResource에 대한 요율 조절 제한 | 지원되는 각 리전: 초당 25개 | 아니요 | 현재 리전에서 계정별로 초당 수행할 수 있는 Bedrock Data Automation: TagResource 요청의 최대 수입니다. | 
| Bedrock Data Automation: UntagResource에 대한 요율 조절 제한 | 지원되는 각 리전: 초당 25개 | 아니요 | 현재 리전에서 계정별로 초당 수행할 수 있는 Bedrock Data Automation: UntagResource 요청의 최대 수입니다. | 
| CreateBlueprint에 대한 요율 조절 제한 | 지원되는 각 리전: 초당 5개 | 아니요 | 현재 리전에서 계정별로 초당 수행할 수 있는 CreateBlueprint 요청의 최대 수입니다. | 
| CreateBlueprintVersion에 대한 요율 조절 제한 | 지원되는 각 리전: 초당 5개 | 아니요 | 현재 리전에서 계정별로 초당 수행할 수 있는 CreateBlueprintVersion 요청의 최대 수입니다. | 
| CreateDataAutomationProject에 대한 요율 조절 제한 | 지원되는 각 리전: 초당 5개 | 아니요 | 현재 리전에서 계정별로 초당 수행할 수 있는 CreateDataAutomationProject 요청의 최대 수입니다. | 
| DeleteBlueprint에 대한 요율 조절 제한 | 지원되는 각 리전: 초당 5개 | 아니요 | 현재 리전에서 계정별로 초당 수행할 수 있는 DeleteBlueprint 요청의 최대 수입니다. | 
| DeleteDataAutomationProject에 대한 요율 조절 제한 | 지원되는 각 리전: 초당 5개 | 아니요 | 현재 리전에서 계정별로 초당 수행할 수 있는 DeleteDataAutomationProject 요청의 최대 수입니다. | 
| GetBlueprint에 대한 요율 조절 제한 | 지원되는 각 리전: 초당 5개 | 아니요 | 현재 리전에서 계정별로 초당 수행할 수 있는 GetBlueprint 요청의 최대 수입니다. | 
| GetDataAutomationProject에 대한 요율 조절 제한 | 지원되는 각 리전: 초당 5개 | 아니요 | 현재 리전에서 계정별로 초당 수행할 수 있는 GetDataAutomationProject 요청의 최대 수입니다. | 
| GetDataAutomationStatus에 대한 요율 조절 제한 | 지원되는 지역별: 초당 10개 | 아니요 | 현재 리전에서 계정별로 초당 수행할 수 있는 GetDataAutomationStatus 요청의 최대 수입니다. | 
| InvokeDataAutomationAsync에 대한 요율 조절 제한 | 지원되는 지역별: 초당 10개 | 아니요 | 현재 리전에서 계정별로 초당 수행할 수 있는 InvokeDataAutomationAsync 요청의 최대 수입니다. | 
| ListBlueprints에 대한 요율 조절 제한 | 지원되는 각 리전: 초당 5개 | 아니요 | 현재 리전에서 계정별로 초당 수행할 수 있는 ListBlueprints 요청의 최대 수입니다. | 
| ListDataAutomationProjects에 대한 요율 조절 제한 | 지원되는 각 리전: 초당 5개 | 아니요 | 현재 리전에서 계정별로 초당 수행할 수 있는 ListDataAutomationProjects 요청의 최대 수입니다. | 
| UpdateBlueprint에 대한 요율 조절 제한 | 지원되는 각 리전: 초당 5개 | 아니요 | 현재 리전에서 계정별로 초당 수행할 수 있는 UpdateBlueprint 요청의 최대 수입니다. | 
| UpdateDataAutomationProject에 대한 요율 조절 제한 | 지원되는 각 리전: 초당 5개 | 아니요 | 현재 리전에서 계정별로 초당 수행할 수 있는 UpdateDataAutomationProject 요청의 최대 수입니다. | 
| 초당 UpdateAgent 요청 | 지원되는 각 리전: 4 | 아니요 | 초당 최대 UpdateAgent API 요청 수입니다. | 
| 초당 UpdateAgentActionGroup 요청 | 지원되는 각 리전: 6개 | 아니요 | 초당 최대 UpdateAgentActionGroup API 요청 수입니다. | 
| 초당 UpdateAgentAlias 요청 | 지원되는 각 리전: 2 | 아니요 | 초당 최대 UpdateAgentAlias API 요청 수입니다. | 
| 초당 UpdateAgentKnowledgeBase 요청 | 지원되는 각 리전: 4 | 아니요 | 초당 최대 UpdateAgentKnowledgeBase API 요청 수입니다. | 

**참고**  
다음 단계에 따라 계정에 할당량 증가를 요청할 수 있습니다.  
할당량이 **예**로 표시된 경우 Service Quotas 사용 설명서의 [할당량 증가 요청](https://docs.aws.amazon.com/servicequotas/latest/userguide/request-quota-increase.html) 단계에 따라 할당량을 조정할 수 있습니다.
할당량이 **아니요**로 표시된 경우 할당량을 늘리는 것을 고려하고 있다면 [제안 증가 양식](https://console.aws.amazon.com/support/home#/case/create?issueType=service-limit-increase)을 통해 요청을 제출할 수 있습니다.
모든 모델에 대해 다음 할당량에 대한 증가를 함께 요청할 수 없습니다.  
{{${model}}}에 대한 분당 교차 리전 InvokeModel 토큰
{{${model}}}에 대한 분당 교차 리전 InvokeModel 요청
{{${model}}}에 대한 분당 온디맨드 InvokeModel 토큰
{{${model}}}에 대한 분당 온디맨드 InvokeModel 요청
이러한 할당량의 조합에 대한 증가를 요청하려면 Service Quotas 사용 설명서의 [할당량 증가 요청](https://docs.aws.amazon.com/servicequotas/latest/userguide/request-quota-increase.html)의 단계에 따라 **{{${model}}} 할당량에 대한 분당 크로스 리전 InvokeModel 토큰** 증가를 요청하세요. 이렇게 하면 지원 팀이 연락하여 다른 3가지 할당량을 늘릴 수 있는 옵션도 제공합니다. 수요가 압도적인 관계로, 기존에 할당된 할당량을 소비하는 트래픽을 생성하는 고객에게 우선 순위가 부여됩니다. 이 조건을 충족하지 않으면 요청이 거부될 수 있습니다.