기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
지리적 리전 간 추론
지리적 리전 간 추론은 데이터 처리를 지정된 지리적 경계(미국, EU, APAC 등) 내에서 유지하는 동시에 단일 리전 추론보다 높은 처리량을 제공합니다. 이 옵션은 데이터 레지던시 요구 사항 및 규정 준수 규정이 있는 조직에 적합합니다.
지리적 리전 간 추론 고려 사항
지리적 리전 간 추론에 대한 다음 정보를 참고하세요.
-
리전(예: 미국, EU 및 APAC)에 연결된 추론 프로파일에 대한 리전 간 추론 요청은 데이터가 원래 상주 AWS 리전 하는 리전의 일부인 내에 유지됩니다. 예를 들어 미국 내에서 이루어진 요청은 AWS 리전 미국 내에서 유지됩니다. 데이터는 소스 리전에만 저장되어 있지만 교차 리전 참조 동안 입력 프롬프트와 출력 결과가 소스 리전 외부로 이동될 수 있습니다. 모든 데이터는 Amazon의 보안 네트워크를 통해 암호화되어 전송됩니다.
-
지리적으로(예: 미국, EU 및 APAC) 연결된 추론 프로파일을 사용할 때 교차 리전 처리량에 대한 기본 할당량을 보려면 AWS 일반 참조의 Amazon Bedrock 서비스 할당량에서 ${Model}에 대한 분당 교차 리전 모델 추론 요청 및 ${Model} 값에 대한 분당 교차 리전 모델 추론 토큰을 참조하세요.
지리적 리전 간 추론을 위한 IAM 정책 요구 사항
IAM 사용자 또는 역할이 지리적 리전 간 추론 프로파일을 호출하도록 허용하려면 다음 리소스에 대한 액세스를 허용해야 합니다.
-
리전별 교차 리전 추론 프로파일(이러한 프로파일에는
us,eu,와 같은 지리적 접두사가 있음apac) -
소스 리전의 파운데이션 모델
-
지리적 프로필에 나열된 모든 대상 리전의 파운데이션 모델
다음 예제 정책은 소스 리전이 이고 대상 리전이 , us-east-1 및 인 미국의 지리적 리전 간 추론 프로파일과 함께 Claude Sonnet 4.5 파운데이션 모델을 사용하는 데 필요한 권한을 부여합니다. us-east-1 us-east-2 us-west-2
{ "Version": "2012-10-17", "Statement": [ { "Sid": "GrantGeoCrisInferenceProfileAccess", "Effect": "Allow", "Action": "bedrock:InvokeModel", "Resource": [ "arn:aws:bedrock:us-east-1:<ACCOUNT_ID>:inference-profile/us.anthropic.claude-sonnet-4-5-20250929-v1:0" ] }, { "Sid": "GrantGeoCrisModelAccess", "Effect": "Allow", "Action": "bedrock:InvokeModel", "Resource": [ "arn:aws:bedrock:us-east-1::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0", "arn:aws:bedrock:us-east-2::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0", "arn:aws:bedrock:us-west-2::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0" ], "Condition": { "StringEquals": { "bedrock:InferenceProfileArn": "arn:aws:bedrock:us-east-1:<ACCOUNT_ID>:inference-profile/us.anthropic.claude-sonnet-4-5-20250929-v1:0" } } } ] }
첫 번째 문은 요청 리전에서 시작된 요청에 대해 지리적 리전 간 추론 프로파일에 대한 bedrock:InvokeModel API 액세스 권한을 부여합니다. 두 번째 문은 추론 프로파일에 나열된 요청 리전과 모든 대상 리전 모두에서 파운데이션 모델에 대한 bedrock:InvokeModel API 액세스 권한을 부여합니다.
지리적 리전 간 추론에 대한 서비스 제어 정책 요구 사항
많은 조직이 보안 및 규정 준수를 위해 AWS Organizations의 서비스 제어 정책을 통해 리전별 액세스 제어를 구현합니다. 조직의 보안 정책이 SCPs 사용하여 미사용 리전을 차단하는 경우 리전별 SCP 조건이 소스 리전의 지리적 리전 간 추론 프로파일에 나열된 모든 대상 리전에 대한 액세스를 허용하는지 확인해야 합니다.
지리적 리전 간 추론의 경우 소스 리전(API 직접 호출)과 대상 리전(요청 라우팅 가능) 간의 관계를 이해해야 합니다. 추론 프로파일 설명서를 확인하여 소스 리전의 모든 대상 리전을 식별한 다음 SCPs 모든 대상 리전에 대한 액세스를 허용하는지 확인합니다.
예를 들어 미국 Anthropic Claude Sonnet 4.5 지리적 프로파일을 사용하여 us-east-1(소스 리전)에서를 호출하는 경우 요청을 us-east-1, us-east-2 및 us-west-2(대상 리전)로 라우팅할 수 있습니다. SCP가 us-east-1로만 액세스를 제한하는 경우 us-east-2 또는 us-west-2로 라우팅하려고 할 때 교차 리전 추론이 실패합니다. 따라서 어떤 리전에서 호출하는지에 관계없이 SCP에서 3개의 대상 리전을 모두 허용해야 합니다.
리전 제외를 위해 SCPs 구성할 때 추론 프로파일에서 대상 리전을 차단하면 소스 리전에 계속 액세스할 수 있더라도 리전 간 추론이 제대로 작동하지 않습니다. 글로벌 리전 간 추론에 대한 SCP 요구 사항은 섹션을 참조하세요글로벌 리전 간 추론에 대한 서비스 제어 정책 요구 사항.
보안을 개선하려면 bedrock:InferenceProfileArn 조건을 사용하여 특정 추론 프로파일에 대한 액세스를 제한하는 것이 좋습니다. 이렇게 하면 사용할 수 있는 추론 프로파일을 제한하면서 필요한 리전에 대한 액세스 권한을 부여할 수 있습니다.
지리적 리전 간 추론 사용
지리적 리전 간 추론을 사용하려면 다음과 같은 방법으로 모델 추론을 실행할 때 추론 프로파일을 포함합니다.
-
온디맨드 모델 추론 - InvokeModel, InvokeModelWithResponseStream, Converse 또는 ConverseStream 요청을 전송할 때 추론 프로파일의 ID를
modelId로 지정합니다. 추론 프로파일은 소스 리전에서 시작된 추론 요청을 라우팅할 수 있는 하나 이상의 리전을 정의합니다. 교차 리전 추론을 사용하면 추론 프로파일에 정의된 리전 간에 모델 간접 호출 요청을 동적으로 라우팅하여 처리량과 성능을 높일 수 있습니다. 사용자 트래픽, 수요 및 리소스 사용률의 라우팅 요인입니다. 자세한 내용은 모델 추론을 사용하여 프롬프트 제출 및 응답 생성 섹션을 참조하세요. -
배치 추론 - CreateModelInvocationJob 요청을 보낼 때 추론 프로파일의 ID를
modelId로 지정하여 배치 추론과 비동기적으로 요청을 제출합니다. 추론 프로파일을 사용하면 여러 AWS 리전 에서 컴퓨팅을 활용하고 배치 작업의 처리 시간을 단축할 수 있습니다. 작업이 완료되면 소스 리전의 Amazon S3 버킷에서 출력 파일을 검색할 수 있습니다. -
에이전트 - CreateAgent 요청의
foundationModel필드에 추론 프로파일의 ID를 지정합니다. 자세한 내용은 에이전트를 수동으로 생성 및 구성 단원을 참조하십시오. -
지식 기반 응답 생성 - 지식 기반을 쿼리한 후 응답을 생성할 때 교차 리전 추론을 사용할 수 있습니다. 자세한 내용은 쿼리 및 응답을 사용하여 지식 기반 테스트 단원을 참조하십시오.
-
모델 평가 - 모델 평가 작업을 제출할 때 평가할 모델로 추론 프로파일을 제출할 수 있습니다. 자세한 내용은 Amazon Bedrock 리소스의 성능 평가 단원을 참조하십시오.
-
프롬프트 관리 - 프롬프트 관리에서 만든 프롬프트에 대한 응답을 생성할 때 교차 리전 추론을 사용할 수 있습니다. 자세한 내용은 Amazon Bedrock에서 프롬프트 관리를 사용하여 재사용 가능한 프롬프트 구성 및 저장 섹션을 참조하세요.
-
프롬프트 흐름 - 프롬프트 흐름의 프롬프트 노드에서 인라인을 정의하는 프롬프트에 대한 응답을 생성할 때 교차 리전 추론을 사용할 수 있습니다. 자세한 내용은 Amazon Bedrock Flows를 사용하여 엔드 투 엔드 생성형 AI 워크플로 구축 단원을 참조하십시오.
추론 프로파일을 사용하여 리전 간에 모델 호출 요청을 보내는 방법을 알아보려면 모델 간접 호출에 추론 프로파일 사용 섹션을 참조하세요.
교차 리전 추론에 대한 자세한 내용은 Amazon Bedrock에서 교차 리전 추론 시작
IAM 설정 및 서비스 할당량 관리를 포함한 글로벌 리전 간 추론에 대한 자세한 내용은 섹션을 참조하세요글로벌 리전 간 추론.