Considerações sobre inferência geográfica entre regiões Requisitos da política do IAM para inferência geográfica entre regiões Requisitos da política de controle de serviços para inferência geográfica entre regiões Use inferência geográfica entre regiões

Inferência geográfica entre regiões

A inferência geográfica entre regiões mantém o processamento de dados dentro dos limites geográficos especificados (EUA, UE, APAC etc.), ao mesmo tempo em que fornece maior taxa de transferência do que a inferência de uma única região. Essa opção é ideal para organizações com requisitos de residência de dados e normas de conformidade.

Considerações sobre inferência geográfica entre regiões

Observe as seguintes informações sobre a inferência geográfica entre regiões:

Cross-Region solicitações de inferência para um perfil de inferência vinculado a uma geografia (por exemplo, EUA, UE e APAC) são mantidas dentro do Regiões da AWS que faz parte da geografia em que os dados residem originalmente. Por exemplo, uma solicitação feita nos EUA é mantida Regiões da AWS nos EUA. Por padrão, os dados permanecem armazenados somente na região de origem, mas suas solicitações de entrada e resultados de saída podem sair da região de origem durante a inferência entre regiões. Na medida em que armazenamos dados para detecção de abusos, suas solicitações de entrada e resultados de saída serão armazenados na região de destino. Consulte Detecção de abuso no Amazon Bedrock para obter mais informações sobre quais modelos precisam de armazenamento. Todos os dados serão transmitidos criptografados pela rede segura da Amazon.
Para ver as cotas padrão de taxa de transferência entre regiões ao usar perfis de inferência vinculados a uma região geográfica (como EUA, UE e APAC), consulte as solicitações de inferência do Cross-region modelo por minuto para $ {Model} e os tokens de inferência do modelo por minuto para valores $ {Cross-region Model} nas cotas do serviço Amazon Bedrock na Referência geral. AWS

Requisitos da política do IAM para inferência geográfica entre regiões

Para permitir que um usuário ou função do IAM invoque um perfil de inferência geográfica entre regiões, você precisa permitir o acesso aos seguintes recursos:

O perfil de inferência entre regiões específico da geografia (esses perfis têm prefixos geográficos como,,) us eu apac
O modelo de fundação na região de origem
O modelo básico em todas as regiões de destino listadas no perfil geográfico

O exemplo de política a seguir concede as permissões necessárias para usar o modelo básico Claude Sonnet 4.5 com um perfil de inferência geográfica entre regiões para os EUA, onde está a região de origem us-east-1 e as regiões de destino, e: us-east-1 us-east-2 us-west-2


{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Sid": "GrantGeoCrisInferenceProfileAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:us-east-1:<ACCOUNT_ID>:inference-profile/us.anthropic.claude-sonnet-4-5-20250929-v1:0"
            ]
        },
        {
            "Sid": "GrantGeoCrisModelAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:us-east-1::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0",
                "arn:aws:bedrock:us-east-2::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0",
                "arn:aws:bedrock:us-west-2::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0"
            ],
            "Condition": {
                "StringEquals": {
                    "bedrock:InferenceProfileArn": "arn:aws:bedrock:us-east-1:<ACCOUNT_ID>:inference-profile/us.anthropic.claude-sonnet-4-5-20250929-v1:0"
                }
            }
        }
    ]
}

A primeira declaração concede acesso à bedrock:InvokeModel API ao perfil de inferência geográfica entre regiões para solicitações originadas da região solicitante. A segunda declaração concede acesso à bedrock:InvokeModel API ao modelo básico na região solicitante e em todas as regiões de destino listadas no perfil de inferência.

Requisitos da política de controle de serviços para inferência geográfica entre regiões

Muitas organizações implementam controles de acesso regionais por meio de Service Control Policies in AWS Organizations para segurança e conformidade. Se a política de segurança da sua organização usa SCPs para bloquear regiões não utilizadas, você deve garantir que suas condições de Region-specific SCP permitam acesso a todas as regiões de destino listadas no perfil de inferência geográfica entre regiões da sua região de origem.

Para inferência geográfica entre regiões, você precisa entender a relação entre sua região de origem (onde você faz a chamada de API) e as regiões de destino (onde as solicitações podem ser encaminhadas). Verifique a documentação do perfil de inferência para identificar todas as regiões de destino da sua região de origem e, em seguida, certifique-se de que seus SCPs permitam acesso a todas essas regiões de destino.

Por exemplo, se você estiver ligando de us-east-1 (região de origem) usando o perfil geográfico US Anthropic Claude Sonnet 4.5, as solicitações podem ser encaminhadas para us-east-1, us-east-2 e us-west-2 (regiões de destino). Se um SCP restringir o acesso somente a us-east-1, a inferência entre regiões falhará ao tentar rotear para us-east-2 ou us-west-2. Portanto, você precisa permitir todas as três regiões de destino em seu SCP, independentemente da região de onde você está ligando.

Ao configurar SCPs para exclusão de regiões, lembre-se de que bloquear qualquer região de destino no perfil de inferência impedirá que a inferência entre regiões funcione adequadamente, mesmo que sua região de origem permaneça acessível. Para obter os requisitos de SCP para inferência global entre regiões, consulte. Requisitos da política de controle de serviços para inferência global entre regiões

Para melhorar a segurança, considere usar a bedrock:InferenceProfileArn condição para limitar o acesso a perfis de inferência específicos. Isso permite que você conceda acesso às regiões necessárias e, ao mesmo tempo, restrinja quais perfis de inferência podem ser usados.

Use inferência geográfica entre regiões

Para usar a inferência geográfica entre regiões, você inclui um perfil de inferência ao executar a inferência do modelo das seguintes maneiras:

On-demand inferência do modelo — Especifique o ID do perfil de inferência como o modelId ao enviar uma InvokeModelsolicitação InvokeModelWithResponseStream, Converse ou. ConverseStream Um perfil de inferência define uma ou mais regiões para as quais ele pode encaminhar solicitações de inferência provenientes da região de origem. O uso da inferência entre regiões aumenta a taxa de transferência e o desempenho usando a computação nas regiões definidas no perfil de inferência. Para obter mais informações, consulte Fazendo solicitações de inferência.
Inferência em lote — envie solicitações de forma assíncrona com a inferência em lote especificando o ID do perfil de inferência como o ao enviar uma solicitação. modelId CreateModelInvocationJob O uso de um perfil de inferência permite que você use a computação em vários Regiões da AWS e obtenha tempos de processamento mais rápidos para seus trabalhos em lotes. Quando o trabalho for concluído, será possível recuperar os arquivos de saída do bucket do Amazon S3 na região de origem.
Agentes: especifique a ID do perfil de inferência no campo foundationModel em uma solicitação CreateAgent. Para obter mais informações, consulte Criar e configurar o agente manualmente.
Geração de respostas da base de conhecimento: é possível usar a inferência entre regiões ao gerar uma resposta depois de consultar uma base de conhecimento. Para obter mais informações, consulte Testar a base de conhecimento com consultas e respostas.
Avaliação de modelo: é possível enviar um perfil de inferência como um modelo para avaliação ao enviar um trabalho de avaliação de modelo. Para obter mais informações, consulte Avaliar o desempenho dos recursos do Amazon Bedrock.
Gerenciamento de prompts: é possível usar a inferência entre regiões ao gerar uma resposta a um prompt criado no Gerenciamento de Prompts. Para obter mais informações, consulte Construir e armazenar prompts reutilizáveis com o Gerenciamento de Prompts do Amazon Bedrock.
Fluxos de prompts: é possível usar a inferência entre regiões ao gerar uma resposta a um prompt definido em linha em um nó de prompt em um fluxo de prompts. Para obter mais informações, consulte Criar um fluxo de trabalho de IA generativa completo com o recurso Fluxos do Amazon Bedrock.

Para saber como usar um perfil de inferência para enviar solicitações de invocação de modelo entre regiões, consulte Use um perfil de inferência na invocação de modelos.

Para saber mais sobre a inferência entre regiões, consulte Getting started with cross-region inference in Amazon Bedrock.

Para obter informações detalhadas sobre a inferência global entre regiões, incluindo a configuração do IAM e o gerenciamento de cotas de serviço, consulte. Inferência global entre regiões

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Cross-Region inferência

Inferência global entre regiões