

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 교차 리전 추론을 통한 처리량 증대
<a name="cross-region-inference"></a>

교차 리전 추론을 사용하면 특정 리전(예: 미국 또는 EU)에 연결된 교차 리전 추론 프로파일을 선택하거나 글로벌 추론 프로파일을 선택할 수 있습니다. 특정 지리에 연결된 추론 프로파일을 선택하면 Amazon Bedrock은 해당 지리 AWS 리전 내에서 최적의 상용를 자동으로 선택하여 추론 요청을 처리합니다. 글로벌 추론 프로파일을 사용하면 Amazon Bedrock은 요청을 처리할 최적의 상용 AWS 리전 을 자동으로 선택하여 사용 가능한 리소스를 최적화하고 모델 처리량을 늘립니다.

두 가지 유형의 교차 리전 추론 모두 파운데이션 모델(FM)과 요청을 라우팅할 수 있는를 AWS 리전 정의하는 [추론 프로파일을](inference-profiles.md) 통해 작동합니다. 온디맨드 모드에서 모델 추론을 실행할 때 서비스 할당량에 의해 또는 사용량이 가장 많은 시간에 요청이 제한될 수 있습니다. 리전 간 추론을 사용하면 다양한 컴퓨팅을 활용하여 계획되지 않은 트래픽 버스트를 원활하게 관리할 수 있습니다 AWS 리전.

[프로비저닝된 처리량](prov-throughput.md)을 구매하여 모델의 처리량을 늘릴 수도 있습니다. 추론 프로파일은 현재 프로비저닝된 처리량을 지원하지 않습니다.

추론 프로파일을 사용하여 교차 리전 추론을 실행할 수 있는 리전 및 모델을 보려면 [추론 프로파일에 지원되는 리전 및 모델](inference-profiles-support.md) 섹션을 참조하세요.

**Topics**
+ [지리적 추론과 글로벌 리전 간 추론 중에서 선택](#cross-region-inference-comparison)
+ [일반적인 고려 사항](#cross-region-inference-general-considerations)
+ [지리적 리전 간 추론](geographic-cross-region-inference.md)
+ [글로벌 리전 간 추론](global-cross-region-inference.md)

## 지리적 추론과 글로벌 리전 간 추론 중에서 선택
<a name="cross-region-inference-comparison"></a>

Amazon Bedrock은 서로 다른 사용 사례 및 규정 준수 요구 사항에 맞게 설계된 두 가지 유형의 리전 간 추론 프로파일을 제공합니다.


| 기능 | 지리적 리전 간 추론 | 글로벌 리전 간 추론 | 권장 사항 | 
| --- | --- | --- | --- | 
| 데이터 레지던시 | 지리적 경계(미국, EU, APAC 등) 내 | 전 세계에서 지원되는 모든 AWS 상용 리전 | 규정 준수 요구 사항을 보려면 지리를 선택합니다. | 
| 처리량 | 단일 리전보다 높음 | 사용 가능한 가장 높음 | 성능을 극대화하려면 전역을 선택합니다. | 
| 비용 | 표준 요금 | 약 10% 절감 | 비용 최적화를 위해 글로벌 선택 | 
| SCP 요구 사항 | 프로필의 모든 대상 리전 허용 | 허용 "aws:RequestedRegion": "unspecified" | 조직 정책에 따라 구성 | 
| 다음과 같은 경우에 가장 적합 | 데이터 레지던시 규정이 적용되는 조직 | 비용 및 성능의 우선순위를 지정하는 조직 | 규정 준수 및 성능 요구 사항 평가 | 

데이터 레지던시 요구 사항이 있고 데이터 처리가 특정 지리적 경계 내에 있도록 해야 하는 경우 지리적 리전 간 추론을 선택합니다. 지리적 제한 없이 최대 처리량과 비용 절감을 원하는 경우 글로벌 리전 간 추론을 선택합니다.

## 일반적인 고려 사항
<a name="cross-region-inference-general-considerations"></a>

교차 리전 추론에 대한 다음 정보를 참고하세요.
+ 교차 리전 추론을 사용하는 데 드는 추가 라우팅 비용은 없습니다. 가격은 추론 프로파일을 직접적으로 호출하는 리전을 기준으로 계산됩니다. 요금에 대한 자세한 내용은 [Amazon Bedrock 요금](https://aws.amazon.com/bedrock/pricing/)을 참조하세요.
+ 교차 리전 추론은에서 수동으로 활성화되지 AWS 리전 않은 로 요청을 라우팅할 수 있습니다 AWS 계정. 교차 리전 추론이 작동하는 데는 수동 리전 활성화가 필요하지 않습니다.
+ 리전 간 작업 중에 전송되는 모든 데이터는 네트워크에 남아 AWS 있으며 퍼블릭 인터넷을 통과하지 않습니다. 데이터는 전송 중에 암호화됩니다 AWS 리전.
+ 모든 리전 간 추론 요청은 소스 리전의 CloudTrail에 로깅됩니다. 요청을 처리한 위치를 식별할 `additionalEventData.inferenceRegion` 필드를 찾습니다.
+ AWS Amazon Bedrock에서 제공하는 서비스도 CRIS를 사용할 수 있습니다. 자세한 내용은 서비스별 설명서를 참조하세요.

# 지리적 리전 간 추론
<a name="geographic-cross-region-inference"></a>

지리적 리전 간 추론은 데이터 처리를 지정된 지리적 경계(미국, EU, APAC 등) 내에서 유지하는 동시에 단일 리전 추론보다 높은 처리량을 제공합니다. 이 옵션은 데이터 레지던시 요구 사항 및 규정 준수 규정이 있는 조직에 적합합니다.

## 지리적 리전 간 추론 고려 사항
<a name="geographic-cris-considerations"></a>

지리적 리전 간 추론에 대한 다음 정보를 참고하세요.
+ 리전(예: 미국, EU 및 APAC)에 연결된 추론 프로파일에 대한 리전 간 추론 요청은 데이터가 원래 상주 AWS 리전 하는 리전의 일부인 내에 유지됩니다. 예를 들어 미국 내에서 이루어진 요청은 AWS 리전 미국 내에서 유지됩니다. 데이터는 소스 리전에만 저장되어 있지만 교차 리전 참조 동안 입력 프롬프트와 출력 결과가 소스 리전 외부로 이동될 수 있습니다. 모든 데이터는 Amazon의 보안 네트워크를 통해 암호화되어 전송됩니다.
+ 지리적으로(예: 미국, EU 및 APAC) 연결된 추론 프로파일을 사용할 때 교차 리전 처리량에 대한 기본 할당량을 보려면 *AWS 일반* 참조의 [Amazon Bedrock 서비스 할당량](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#limits_bedrock)에서 **\$1\$1Model\$1에 대한 분당 교차 리전 모델 추론 요청** 및 **\$1\$1Model\$1 값에 대한 분당 교차 리전 모델 추론 토큰**을 참조하세요.

## 지리적 리전 간 추론을 위한 IAM 정책 요구 사항
<a name="geographic-cris-iam-setup"></a>

IAM 사용자 또는 역할이 지리적 리전 간 추론 프로파일을 호출하도록 허용하려면 다음 리소스에 대한 액세스를 허용해야 합니다.

1. 리전별 교차 리전 추론 프로파일(이러한 프로파일에는 `us`, `eu`,와 같은 지리적 접두사가 있음`apac`)

1. 소스 리전의 파운데이션 모델

1. 지리적 프로필에 나열된 모든 대상 리전의 파운데이션 모델

다음 예제 정책은 소스 리전이 이고 대상 리전이 , `us-east-1` 및 인 미국의 지리적 리전 간 추론 프로파일과 함께 Claude Sonnet 4.5 파운데이션 모델을 사용하는 데 필요한 권한을 부여합니다. `us-east-1` `us-east-2` `us-west-2` 

```
{
    "Version": "2012-10-17"		 	 	 ,
    "Statement": [
        {
            "Sid": "GrantGeoCrisInferenceProfileAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:us-east-1:<ACCOUNT_ID>:inference-profile/us.anthropic.claude-sonnet-4-5-20250929-v1:0"
            ]
        },
        {
            "Sid": "GrantGeoCrisModelAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:us-east-1::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0",
                "arn:aws:bedrock:us-east-2::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0",
                "arn:aws:bedrock:us-west-2::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0"
            ],
            "Condition": {
                "StringEquals": {
                    "bedrock:InferenceProfileArn": "arn:aws:bedrock:us-east-1:<ACCOUNT_ID>:inference-profile/us.anthropic.claude-sonnet-4-5-20250929-v1:0"
                }
            }
        }
    ]
}
```

첫 번째 문은 요청 리전에서 시작된 요청에 대해 지리적 리전 간 추론 프로파일에 대한 `bedrock:InvokeModel` API 액세스 권한을 부여합니다. 두 번째 문은 추론 프로파일에 나열된 요청 리전과 모든 대상 리전 모두에서 파운데이션 모델에 대한 `bedrock:InvokeModel` API 액세스 권한을 부여합니다.

## 지리적 리전 간 추론에 대한 서비스 제어 정책 요구 사항
<a name="geographic-cris-scp-setup"></a>

많은 조직이 보안 및 규정 준수를 위해 AWS Organizations의 서비스 제어 정책을 통해 리전별 액세스 제어를 구현합니다. 조직의 보안 정책이 SCPs 사용하여 미사용 리전을 차단하는 경우 리전별 SCP 조건이 소스 리전의 지리적 리전 간 추론 프로파일에 나열된 모든 대상 리전에 대한 액세스를 허용하는지 확인해야 합니다.

지리적 리전 간 추론의 경우 소스 리전(API 직접 호출)과 대상 리전(요청 라우팅 가능) 간의 관계를 이해해야 합니다. 추론 프로파일 설명서를 확인하여 소스 리전의 모든 대상 리전을 식별한 다음 SCPs 모든 대상 리전에 대한 액세스를 허용하는지 확인합니다.

예를 들어 미국 Anthropic Claude Sonnet 4.5 지리적 프로파일을 사용하여 us-east-1(소스 리전)에서를 호출하는 경우 요청을 us-east-1, us-east-2 및 us-west-2(대상 리전)로 라우팅할 수 있습니다. SCP가 us-east-1로만 액세스를 제한하는 경우 us-east-2 또는 us-west-2로 라우팅하려고 할 때 교차 리전 추론이 실패합니다. 따라서 어떤 리전에서 호출하는지에 관계없이 SCP에서 3개의 대상 리전을 모두 허용해야 합니다.

리전 제외를 위해 SCPs 구성할 때 추론 프로파일에서 대상 리전을 차단하면 소스 리전에 계속 액세스할 수 있더라도 리전 간 추론이 제대로 작동하지 않습니다. 글로벌 리전 간 추론에 대한 SCP 요구 사항은 섹션을 참조하세요[글로벌 리전 간 추론에 대한 서비스 제어 정책 요구 사항](global-cross-region-inference.md#global-cris-scp-setup).

보안을 개선하려면 `bedrock:InferenceProfileArn` 조건을 사용하여 특정 추론 프로파일에 대한 액세스를 제한하는 것이 좋습니다. 이렇게 하면 사용할 수 있는 추론 프로파일을 제한하면서 필요한 리전에 대한 액세스 권한을 부여할 수 있습니다.

## 지리적 리전 간 추론 사용
<a name="geographic-cris-usage"></a>

지리적 리전 간 추론을 사용하려면 다음과 같은 방법으로 모델 추론을 [실행할 때 추론 프로파일을](inference-profiles.md) 포함합니다.
+ **온디맨드 모델 추론** - [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html), [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html), [Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html) 또는 [ConverseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html) 요청을 전송할 때 추론 프로파일의 ID를 `modelId`로 지정합니다. 추론 프로파일은 소스 리전에서 시작된 추론 요청을 라우팅할 수 있는 하나 이상의 리전을 정의합니다. 교차 리전 추론을 사용하면 추론 프로파일에 정의된 리전 간에 모델 간접 호출 요청을 동적으로 라우팅하여 처리량과 성능을 높일 수 있습니다. 사용자 트래픽, 수요 및 리소스 사용률의 라우팅 요인입니다. 자세한 내용은 [모델 추론을 사용하여 프롬프트 제출 및 응답 생성](inference.md) 섹션을 참조하세요.
+ **배치 추론** - [CreateModelInvocationJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_CreateModelInvocationJob.html) 요청을 보낼 때 추론 프로파일의 ID를 `modelId`로 지정하여 배치 추론과 비동기적으로 요청을 제출합니다. 추론 프로파일을 사용하면 여러 AWS 리전 에서 컴퓨팅을 활용하고 배치 작업의 처리 시간을 단축할 수 있습니다. 작업이 완료되면 소스 리전의 Amazon S3 버킷에서 출력 파일을 검색할 수 있습니다.
+ **에이전트 **- [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateAgent.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateAgent.html) 요청의 `foundationModel` 필드에 추론 프로파일의 ID를 지정합니다. 자세한 내용은 [에이전트를 수동으로 생성 및 구성](agents-create.md) 단원을 참조하십시오.
+ **지식 기반 응답 생성** - 지식 기반을 쿼리한 후 응답을 생성할 때 교차 리전 추론을 사용할 수 있습니다. 자세한 내용은 [쿼리 및 응답을 사용하여 지식 기반 테스트](knowledge-base-test.md) 단원을 참조하십시오.
+ **모델 평가** - 모델 평가 작업을 제출할 때 평가할 모델로 추론 프로파일을 제출할 수 있습니다. 자세한 내용은 [Amazon Bedrock 리소스의 성능 평가](evaluation.md) 단원을 참조하십시오.
+ **프롬프트 관리** - 프롬프트 관리에서 만든 프롬프트에 대한 응답을 생성할 때 교차 리전 추론을 사용할 수 있습니다. 자세한 내용은 [Amazon Bedrock에서 프롬프트 관리를 사용하여 재사용 가능한 프롬프트 구성 및 저장](prompt-management.md) 섹션을 참조하세요.
+ **프롬프트 흐름** - 프롬프트 흐름의 프롬프트 노드에서 인라인을 정의하는 프롬프트에 대한 응답을 생성할 때 교차 리전 추론을 사용할 수 있습니다. 자세한 내용은 [Amazon Bedrock Flows를 사용하여 엔드 투 엔드 생성형 AI 워크플로 구축](flows.md) 단원을 참조하십시오.

추론 프로파일을 사용하여 리전 간에 모델 호출 요청을 보내는 방법을 알아보려면 [모델 간접 호출에 추론 프로파일 사용](inference-profiles-use.md) 섹션을 참조하세요.

교차 리전 추론에 대한 자세한 내용은 [Amazon Bedrock에서 교차 리전 추론 시작](https://aws.amazon.com/blogs/machine-learning/getting-started-with-cross-region-inference-in-amazon-bedrock/)을 참조하세요.

IAM 설정 및 서비스 할당량 관리를 포함한 글로벌 리전 간 추론에 대한 자세한 내용은 섹션을 참조하세요[글로벌 리전 간 추론](global-cross-region-inference.md).

# 글로벌 리전 간 추론
<a name="global-cross-region-inference"></a>

글로벌 리전 간 추론은 지리적 경계를 넘어 리전 간 추론을 확장하여 추론 요청을 지원되는 AWS 리전 전 세계 상용으로 라우팅하여 사용 가능한 리소스를 최적화하고 모델 처리량을 높일 수 있습니다.

## 글로벌 리전 간 추론의 이점
<a name="global-cris-benefits"></a>

Anthropic의 Claude Sonnet 4.5에 대한 글로벌 리전 간 추론은 기존의 지리적 리전 간 추론 프로파일에 비해 여러 가지 이점을 제공합니다.
+ **피크 수요 중 처리량 향상** - 글로벌 리전 간 추론은 사용 가능한 용량으로 요청을 AWS 리전 에 자동으로 라우팅하여 피크 수요 기간 동안 복원력을 개선합니다. 이 동적 라우팅은 개발자의 추가 구성이나 개입 없이 원활하게 수행됩니다. 간에 복잡한 클라이언트 측 로드 밸런싱이 필요할 수 있는 기존 접근 방식과 달리 AWS 리전글로벌 리전 간 추론은 트래픽 급증을 자동으로 처리합니다. 이는 가동 중지 시간이나 성능 저하로 인해 재정적 또는 평판에 상당한 영향을 미칠 수 있는 비즈니스 크리티컬 애플리케이션에 특히 중요합니다.
+ **비용 효율성** - Anthropic의 Claude Sonnet 4.5에 대한 글로벌 리전 간 추론은 지리적 리전 간 추론에 비해 입력 및 출력 토큰 요금을 모두 약 10% 절감합니다. 요금은 요청이 이루어진에 따라 계산됩니다(소 AWS 리전 스 AWS 리전). 즉, 조직은 더 낮은 비용으로 복원력을 개선할 수 있습니다. 이 요금 모델은 생성형 AI 배포를 최적화하려는 조직에 글로벌 리전 간 추론을 비용 효율적인 솔루션으로 만듭니다. 리소스 사용률을 개선하고 추가 비용 없이 처리량을 높임으로써 조직은 Amazon Bedrock에 대한 투자 가치를 극대화할 수 있습니다.
+ **간소화된 모니터링** - 글로벌 리전 간 추론을 사용하는 경우 CloudWatch 및 CloudTrail은 소스에 로그 항목을 계속 기록하여 관찰성과 관리를 AWS 리전간소화합니다. 요청이 AWS 리전 전 세계 여러 곳에서 처리되더라도 익숙한 AWS 모니터링 도구를 통해 애플리케이션의 성능 및 사용 패턴을 중앙 집중식으로 볼 수 있습니다.
+ **온디맨드 할당량 유연성 -** 글로벌 리전 간 추론을 사용하면 개별 리전 용량에 따라 워크로드가 더 이상 제한되지 않습니다. 특정에서 사용 가능한 용량으로 제한되는 대신 AWS 전역 인프라에서 요청을 동적으로 라우팅할 수 AWS 리전있습니다. 이렇게 하면 훨씬 더 큰 리소스 풀에 액세스할 수 있으므로 대용량 워크로드와 갑작스러운 트래픽 급증을 덜 복잡하게 처리할 수 있습니다.

## 글로벌 리전 간 추론 고려 사항
<a name="global-cris-considerations"></a>

글로벌 리전 간 추론에 대한 다음 정보를 참고하세요.
+ 글로벌 교차 리전 추론 프로파일은 특정 리전에 연결된 추론 프로필보다 높은 처리량을 제공합니다. 특정 지리에 연결된 추론 프로파일은 단일 리전 추론보다 높은 처리량을 제공합니다.
+ 글로벌 추론 프로파일을 사용할 때 교차 리전 처리량에 대한 기본 할당량을 보려면 *AWS 일반* 참조의 [Amazon Bedrock 서비스 할당량](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#limits_bedrock)에서 **\$1\$1Model\$1에 대한 분당 글로벌 교차 리전 모델 추론 요청** 및 **\$1\$1Model\$1 값에 대한 분당 글로벌 교차 리전 모델 추론 토큰**을 참조하세요.

  [Service Quotas 콘솔](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas)에서 또는 **소스 리전**의 AWS CLI 명령을 사용하여 글로벌 리전 간 추론 프로파일에 대한 할당량을 요청, 확인 및 관리할 수 있습니다.

## 글로벌 리전 간 추론을 위한 IAM 정책 요구 사항
<a name="global-cris-iam-setup"></a>

사용자에 대해 글로벌 리전 간 추론을 활성화하려면 역할에 세 부분으로 구성된 IAM 정책을 적용해야 합니다. 다음은 세분화된 제어를 제공하는 IAM 정책의 예입니다. 예제 정책의 `<REQUESTING REGION>`를 운영 중인 로 바꿀 수 AWS 리전 있습니다.

```
{
    "Version": "2012-10-17"		 	 	 ,
    "Statement": [
        {
            "Sid": "GrantGlobalCrisInferenceProfileRegionAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:<REQUESTING REGION>:<ACCOUNT>:inference-profile/global.<MODEL NAME>"
            ],
            "Condition": {
                "StringEquals": {
                    "aws:RequestedRegion": "<REQUESTING REGION>"
                }
            }
        },
        {
            "Sid": "GrantGlobalCrisInferenceProfileInRegionModelAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:<REQUESTING REGION>::foundation-model/<MODEL NAME>"
            ],
            "Condition": {
                "StringEquals": {
                    "aws:RequestedRegion": "<REQUESTING REGION>",
                    "bedrock:InferenceProfileArn": "arn:aws:bedrock:<REQUESTING REGION>:<ACCOUNT>:inference-profile/global.<MODEL NAME>"
                }
            }
        },
        {
            "Sid": "GrantGlobalCrisInferenceProfileGlobalModelAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:::foundation-model/<MODEL NAME>"
            ],
            "Condition": {
                "StringEquals": {
                    "aws:RequestedRegion": "unspecified",
                    "bedrock:InferenceProfileArn": "arn:aws:bedrock:<REQUESTING REGION>:<ACCOUNT>:inference-profile/global.<MODEL NAME>"
                }
            }
        }
    ]
}
```

정책의 첫 번째 부분은 요청의 리전 추론 프로파일에 대한 액세스 권한을 부여합니다 AWS 리전. 두 번째 부분에서는 리전 FM 리소스에 대한 액세스를 제공합니다. 세 번째 부분은 리전 간 라우팅 기능을 활성화하는 글로벌 FM 리소스에 대한 액세스 권한을 부여합니다.

이러한 정책을 구현할 때 세 가지 리소스 Amazon 리소스 이름(ARNs)이 모두 IAM 문에 포함되어 있는지 확인합니다.
+ 리전 추론 프로필 ARN은 패턴을 따릅니다`arn:aws:bedrock:REGION:ACCOUNT:inference-profile/global.MODEL-NAME`. 이는 소스의 글로벌 추론 프로파일에 대한 액세스 권한을 부여하는 데 사용됩니다 AWS 리전.
+ 리전 FM은를 사용합니다`arn:aws:bedrock:REGION::foundation-model/MODEL-NAME`. 이는 소스의 FM에 대한 액세스 권한을 부여하는 데 사용됩니다 AWS 리전.
+ 글로벌 FM에는가 필요합니다`arn:aws:bedrock:::foundation-model/MODEL-NAME`. 이는 서로 다른 글로벌에서 FM에 대한 액세스 권한을 부여하는 데 사용됩니다 AWS 리전.

글로벌 FM ARN에는 AWS 리전 또는 계정이 지정되어 있지 않으며, 이는 의도적이고 리전 간 기능에 필요합니다.

### 글로벌 리전 간 추론 비활성화
<a name="global-cris-iam-disable"></a>

두 가지 기본 접근 방식 중에서 선택하여 특정 IAM 역할에 대해 글로벌 CRIS에 거부 정책을 구현할 수 있으며, 각각 사용 사례와 영향이 다릅니다.
+ **IAM 정책 제거** - 첫 번째 방법은 사용자 권한에서 세 가지 필수 IAM 정책 중 하나 이상을 제거하는 것입니다. 글로벌 CRIS는 세 정책이 모두 작동해야 하므로 정책을 제거하면 액세스가 거부됩니다.
+ **거부 정책 구현** - 두 번째 접근 방식은 글로벌 CRIS 추론 프로파일을 특별히 대상으로 하는 명시적 거부 정책을 구현하는 것입니다. 이 방법은 보안 의도를 명확하게 문서화하고 누군가 실수로 나중에 필요한 허용 정책을 추가하더라도 명시적 거부가 우선하도록 합니다. 거부 정책은 패턴과 일치하는 `StringEquals` 조건을 사용해야 합니다`"aws:RequestedRegion": "unspecified"`. 이 패턴은 `global` 특히 접두사가 있는 추론 프로파일을 대상으로 합니다.

거부 정책을 구현할 때는 글로벌 CRIS가 `aws:RequestedRegion` 필드의 동작 방식을 변경한다는 점을 이해하는 것이 중요합니다. 서비스가이 필드를 실제 대상이 `global` 아닌 로 설정하기 때문에와 같은 특정 AWS 리전 이름의 `StringEquals` 조건을 사용하는 기존 AWS 리전기반 거부 정책은 글로벌 CRIS에서 예상대로 작동하지 `"aws:RequestedRegion": "us-west-2"` 않습니다 AWS 리전. 그러나 앞서 언급했듯이 `"aws:RequestedRegion": "unspecified"`는 거부 효과를 초래합니다.

## 글로벌 리전 간 추론에 대한 서비스 제어 정책 요구 사항
<a name="global-cris-scp-setup"></a>

글로벌 리전 간 추론의 경우 조직의 보안 정책이 SCPs 사용하여 미사용 리전을 차단하는 경우를 사용하여 액세스를 허용하도록 리전별 SCP 조건을 업데이트해야 합니다`"aws:RequestedRegion": "unspecified"`. 이 조건은 Amazon Bedrock Global 리전 간 추론에만 적용되며 지원되는 모든 AWS 상용 리전으로 요청을 라우팅할 수 있도록 합니다.

다음 예제 SCP는 글로벌 라우팅을 위한 리전`"unspecified"`으로를 사용하는 Amazon Bedrock Global 리전 간 추론 호출을 허용하면서 승인된 리전 외부의 모든 AWS API 호출을 차단합니다.

```
{
    "Version": "2012-10-17"		 	 	 ,
    "Statement": [
        {
            "Sid": "DenyAllOutsideApprovedRegions",
            "Effect": "Deny",
            "Action": "*",
            "Resource": "*",
            "Condition": {
                "StringNotEquals": {
                    "aws:RequestedRegion": [
                        "us-east-1",
                        "us-east-2",
                        "us-west-2",
                        "unspecified"
                    ]
                }
            }
        }
    ]
}
```

### 글로벌 리전 간 추론 비활성화
<a name="global-cris-disable"></a>

요청이 지원되는 다른 AWS 상용 리전에서 처리될 수 있으므로 데이터 레지던시 또는 규정 준수 요구 사항이 있는 조직은 글로벌 리전 간 추론이 규정 준수 프레임워크에 적합한지 평가해야 합니다. 글로벌 리전 간 추론을 명시적으로 비활성화하려면 다음 SCP 정책을 구현합니다.

```
{
    "Effect": "Deny",
    "Action": "bedrock:*",
    "Resource": "*",
    "Condition": {
        "StringEquals": {
            "aws:RequestedRegion": "unspecified"
        },
        "ArnLike": {
            "bedrock:InferenceProfileArn": "arn:aws:bedrock:*:*:inference-profile/global.*"
        }
    }
}
```

이 SCP는 `"aws:RequestedRegion"`가 `"unspecified"`이고 `"ArnLike"` 조건이 ARN에 `global` 접두사가 있는 추론 프로파일을 대상으로 하기 때문에 글로벌 리전 간 추론을 명시적으로 거부합니다.

### AWS Control Tower 구현
<a name="control-tower-scp"></a>

 AWS Control Tower에서 관리하는 SCPs 수동으로 편집하면 드리프트가 발생할 수 있으므로 사용하지 않는 것이 좋습니다. 대신 Control Tower에서 제공하는 메커니즘을 사용하여 이러한 예외를 관리합니다. 핵심 원칙에는 기존 리전 거부 제어를 확장하거나 리전을 활성화한 다음 사용자 지정 조건부 차단 정책을 적용하는 것이 포함됩니다.

Control Tower를 사용하여 교차 리전 추론을 구현하는 방법에 대한 자세한 step-by-step 지침은 블로그 게시물 [ 다중 계정 환경에서 Amazon Bedrock 교차 리전 추론 활성화를](https://aws.amazon.com/blogs/machine-learning/enable-amazon-bedrock-cross-region-inference-in-multi-account-environments/) 참조하세요. 여기에는 기존 리전 거부 SCPs 확장, 사용자 지정 SCP로 거부된 리전 활성화 SCPs, Customizations for AWS Control Tower(CfCT)를 사용하여 사용자 지정 SCPs 포함됩니다.

## 글로벌 리전 간 추론에 대한 요청 한도 증가
<a name="global-cris-quotas"></a>

글로벌 CRIS 추론 프로파일을 사용하는 경우 지원되는 20개 이상의 소스에서 글로벌 CRIS를 사용할 수 있습니다 AWS 리전. 이는 전역 한도이므로 전역 리전 간 추론 프로파일에 대한 할당량 보기, 관리 또는 증가 요청은 요청된 소스의 Service Quotas 콘솔 또는 AWS 명령줄 인터페이스(AWS CLI)를 통해 이루어져야 합니다 AWS 리전.

한도 증가를 요청하려면 다음 단계를 완료하세요.

1.  AWS 계정의 Service Quotas 콘솔에 로그인합니다.

1. 탐색 창에서 **AWS 서비스**를 선택합니다.

1. 서비스 목록에서 **Amazon Bedrock**을 찾아 선택합니다.

1. Amazon Bedrock의 할당량 목록에서 검색 필터를 사용하여 특정 글로벌 CRIS 할당량을 찾습니다. 예제:
   + Anthropic Claude Sonnet 4.5 V1에 대한 분당 글로벌 리전 간 모델 추론 토큰

1. 늘리려는 할당량을 선택합니다.

1. **계정 수준에서 증가 요청**을 선택합니다.

1. 원하는 새 할당량 값을 입력합니다.

1. **요청**을 선택하여 요청을 제출합니다.

필요한 할당량 증가를 계산할 때는 입력 및 출력 토큰이 제한 시스템의 토큰 할당량 사용량으로 변환되는 속도로 정의되는 연소율을 고려해야 합니다. 다음 모델은 **출력 토큰의 연소율이 5배입니다(출력 토큰 1개는 할당량에서 토큰 5개를 사용함).**
+ Anthropic Claude Opus 4
+ Anthropic Claude Sonnet 4.5
+ Anthropic Claude Sonnet 4
+ Anthropic Claude 3.7 Sonnet

다른 모든 모델의 경우 연소율은 **1:1**입니다(출력 토큰 1개는 할당량에서 토큰 1개를 사용함). 입력 토큰의 경우 토큰 대 할당량 비율은 1:1입니다. 요청당 총 토큰 수 계산은 다음과 같습니다.

`Input token count + Cache write input tokens + (Output token count x Burndown rate)`

## 글로벌 리전 간 추론 사용
<a name="global-cris-usage"></a>

Anthropic의 Claude Sonnet 4.5에서 글로벌 리전 간 추론을 사용하려면 개발자가 다음 주요 단계를 완료해야 합니다.
+ **글로벌 추론 프로파일 ID 사용** - Amazon Bedrock에 API를 호출할 때 AWS 리전특정 모델 ID 대신 글로벌 Anthropic의 Claude Sonnet 4.5 추론 프로파일 ID(`global.anthropic.claude-sonnet-4-5-20250929-v1:0`)를 지정합니다.
+ **IAM 권한 구성** - 잠재적 대상의 추론 프로파일 및 FMs에 액세스할 수 있는 적절한 IAM 권한을 부여합니다 AWS 리전.

글로벌 리전 간 추론은 다음에 대해 지원됩니다.
+ 온디맨드 모델 추론
+ 배치 추론
+ 에이전트
+ 모델 평가
+ 프롬프트 관리
+ 프롬프트 흐름

**참고**  
글로벌 추론 프로파일은 온디맨드 모델 추론, 배치 추론, 에이전트, 모델 평가, 프롬프트 관리 및 프롬프트 흐름에 대해 지원됩니다.

## 글로벌 리전 간 추론 구현
<a name="global-cris-implementation"></a>

Anthropic의 Claude Sonnet 4.5를 사용하여 글로벌 리전 간 추론을 구현하는 것은 간단하므로 기존 애플리케이션 코드를 몇 번만 변경하면 됩니다. 다음은 Python에서 코드를 업데이트하는 방법의 예입니다.

```
import boto3
import json
bedrock = boto3.client('bedrock-runtime', region_name='us-east-1')
model_id = "global.anthropic.claude-sonnet-4-5-20250929-v1:0"  
response = bedrock.converse(
    messages=[{"role": "user", "content": [{"text": "Explain cloud computing in 2 sentences."}]}],
    modelId=model_id,
)

print("Response:", response['output']['message']['content'][0]['text'])
print("Token usage:", response['usage'])
print("Total tokens:", response['usage']['totalTokens'])
```