View a markdown version of this page

Inferência geográfica entre regiões - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Inferência geográfica entre regiões

A inferência geográfica entre regiões mantém o processamento de dados dentro dos limites geográficos especificados (EUA, UE, APAC etc.), ao mesmo tempo em que fornece maior taxa de transferência do que a inferência de uma única região. Essa opção é ideal para organizações com requisitos de residência de dados e normas de conformidade.

Considerações sobre inferência geográfica entre regiões

Observe as seguintes informações sobre a inferência geográfica entre regiões:

  • As solicitações de inferência entre regiões para um perfil de inferência vinculado a uma região geográfica (por exemplo, EUA, UE e APAC) são mantidas dentro do Regiões da AWS que faz parte da geografia em que os dados residem originalmente. Por exemplo, uma solicitação feita nos EUA é mantida Regiões da AWS nos EUA. Embora os dados permaneçam armazenados somente na região de origem, os prompts de entrada e os resultados de saída podem sair da sua região de origem durante a inferência entre regiões. Todos os dados serão transmitidos criptografados pela rede segura da Amazon.

  • Para ver as cotas padrão de throughput entre regiões ao usar perfis de inferência vinculados a uma área geográfica (como EUA, UE e APAC), consulte os valores em Solicitações de inferência do modelo entre regiões por minuto por ${Model} e Tokens de inferência do modelo entre regiões por minuto por ${Model} em Cotas de serviços do Amazon Bedrock no Guia de referência geral da AWS .

Requisitos de política do IAM para inferência geográfica entre regiões

Para permitir que um usuário ou função do IAM invoque um perfil de inferência geográfica entre regiões, você precisa permitir o acesso aos seguintes recursos:

  1. O perfil de inferência entre regiões específico da geografia (esses perfis têm prefixos geográficos como,,) us eu apac

  2. O modelo de fundação na região de origem

  3. O modelo básico em todas as regiões de destino listadas no perfil geográfico

O exemplo de política a seguir concede as permissões necessárias para usar o modelo básico Claude Sonnet 4.5 com um perfil de inferência geográfica entre regiões para os EUA, onde está a região de origem us-east-1 e as regiões de destino, e: us-east-1 us-east-2 us-west-2

{ "Version": "2012-10-17", "Statement": [ { "Sid": "GrantGeoCrisInferenceProfileAccess", "Effect": "Allow", "Action": "bedrock:InvokeModel", "Resource": [ "arn:aws:bedrock:us-east-1:<ACCOUNT_ID>:inference-profile/us.anthropic.claude-sonnet-4-5-20250929-v1:0" ] }, { "Sid": "GrantGeoCrisModelAccess", "Effect": "Allow", "Action": "bedrock:InvokeModel", "Resource": [ "arn:aws:bedrock:us-east-1::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0", "arn:aws:bedrock:us-east-2::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0", "arn:aws:bedrock:us-west-2::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0" ], "Condition": { "StringEquals": { "bedrock:InferenceProfileArn": "arn:aws:bedrock:us-east-1:<ACCOUNT_ID>:inference-profile/us.anthropic.claude-sonnet-4-5-20250929-v1:0" } } } ] }

A primeira declaração concede acesso à bedrock:InvokeModel API ao perfil de inferência geográfica entre regiões para solicitações originadas da região solicitante. A segunda declaração concede acesso à bedrock:InvokeModel API ao modelo básico na região solicitante e em todas as regiões de destino listadas no perfil de inferência.

Requisitos da política de controle de serviços para inferência geográfica entre regiões

Muitas organizações implementam controles de acesso regionais por meio de Service Control Policies in AWS Organizations para segurança e conformidade. Se a política de segurança da sua organização costuma SCPs bloquear regiões não utilizadas, você deve garantir que as condições de SCP específicas da sua região permitam o acesso a todas as regiões de destino listadas no perfil de inferência geográfica entre regiões da sua região de origem.

Para inferência geográfica entre regiões, você precisa entender a relação entre sua região de origem (onde você faz a chamada de API) e as regiões de destino (onde as solicitações podem ser encaminhadas). Verifique a documentação do perfil de inferência para identificar todas as regiões de destino da sua região de origem e, em seguida, assegure-se de SCPs permitir o acesso a todas essas regiões de destino.

Por exemplo, se você estiver ligando de us-east-1 (região de origem) usando o perfil geográfico US Anthropic Claude Sonnet 4.5, as solicitações podem ser encaminhadas para us-east-1, us-east-2 e us-west-2 (regiões de destino). Se um SCP restringir o acesso somente a us-east-1, a inferência entre regiões falhará ao tentar rotear para us-east-2 ou us-west-2. Portanto, você precisa permitir todas as três regiões de destino em seu SCP, independentemente da região de onde você está ligando.

Ao configurar a exclusão SCPs de regiões, lembre-se de que bloquear qualquer região de destino no perfil de inferência impedirá que a inferência entre regiões funcione adequadamente, mesmo que sua região de origem permaneça acessível. Para obter os requisitos de SCP para inferência global entre regiões, consulte. Requisitos da política de controle de serviços para inferência global entre regiões

Para melhorar a segurança, considere usar a bedrock:InferenceProfileArn condição para limitar o acesso a perfis de inferência específicos. Isso permite que você conceda acesso às regiões necessárias e, ao mesmo tempo, restrinja quais perfis de inferência podem ser usados.

Use inferência geográfica entre regiões

Para usar a inferência geográfica entre regiões, você inclui um perfil de inferência ao executar a inferência do modelo das seguintes maneiras:

  • Inferência de modelo sob demanda — especifique o ID do perfil de inferência como o modelId ao enviar uma solicitação InvokeModelInvokeModelWithResponseStream, Converse ou. ConverseStream Um perfil de inferência define uma ou mais regiões para as quais ele pode encaminhar solicitações de inferência provenientes da região de origem. O uso da inferência entre regiões aumenta o throughput e o desempenho roteando dinamicamente as solicitações de invocação de modelos entre as regiões definidas no perfil de inferência. Fatores de roteamento no tráfego, na demanda e na utilização de recursos do usuário. Para obter mais informações, consulte Envie prompts e gere respostas com a inferência de modelo.

  • Inferência em lote — envie solicitações de forma assíncrona com a inferência em lote especificando o ID do perfil de inferência como o ao enviar uma solicitação. modelId CreateModelInvocationJob O uso de um perfil de inferência permite que você utilize a computação em várias Regiões da AWS e obtenha tempos de processamento mais rápidos para seus trabalhos em lote. Quando o trabalho for concluído, será possível recuperar os arquivos de saída do bucket do Amazon S3 na região de origem.

  • Agentes: especifique a ID do perfil de inferência no campo foundationModel em uma solicitação CreateAgent. Para obter mais informações, consulte Criar e configurar o agente manualmente.

  • Geração de respostas da base de conhecimento: é possível usar a inferência entre regiões ao gerar uma resposta depois de consultar uma base de conhecimento. Para obter mais informações, consulte Testar a base de conhecimento com consultas e respostas.

  • Avaliação de modelo: é possível enviar um perfil de inferência como um modelo para avaliação ao enviar um trabalho de avaliação de modelo. Para obter mais informações, consulte Avaliar o desempenho dos recursos do Amazon Bedrock.

  • Gerenciamento de prompts: é possível usar a inferência entre regiões ao gerar uma resposta a um prompt criado no Gerenciamento de Prompts. Para obter mais informações, consulte Construir e armazenar prompts reutilizáveis com o Gerenciamento de Prompts do Amazon Bedrock.

  • Fluxos de prompts: é possível usar a inferência entre regiões ao gerar uma resposta a um prompt definido em linha em um nó de prompt em um fluxo de prompts. Para obter mais informações, consulte Crie um fluxo de trabalho end-to-end generativo de IA com o Amazon Bedrock Flows.

Para saber como usar um perfil de inferência para enviar solicitações de invocação de modelo entre regiões, consulte Use um perfil de inferência na invocação de modelos.

Para saber mais sobre a inferência entre regiões, consulte Getting started with cross-region inference in Amazon Bedrock.

Para obter informações detalhadas sobre a inferência global entre regiões, incluindo a configuração do IAM e o gerenciamento de cotas de serviço, consulte. Inferência global entre regiões