

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Aumento del rendimiento con la inferencia entre regiones
<a name="cross-region-inference"></a>

Con la inferencia entre regiones, puede elegir un perfil de inferencia entre regiones vinculado a una región geográfica específica (como EE. UU. o la UE) o puede elegir un perfil de inferencia global. Cuando elige un perfil de inferencia vinculado a una zona geográfica específica, Amazon Bedrock selecciona automáticamente el anuncio óptimo Región de AWS dentro de esa zona geográfica para procesar su solicitud de inferencia. Con los perfiles de inferencia globales, Amazon Bedrock selecciona automáticamente la Región de AWS comercial óptima para procesar la solicitud, lo que optimiza los recursos disponibles y aumenta el rendimiento del modelo.

Ambos tipos de inferencia entre regiones funcionan mediante [perfiles de inferencia](inference-profiles.md), que definen un modelo básico (FM) y hacia dónde se pueden Regiones de AWS dirigir las solicitudes. Al ejecutar la inferencia del modelo en el modo bajo demanda, es posible que sus solicitudes estén restringidas por Service Quotas o durante las horas de mayor uso. La inferencia entre regiones le permite gestionar sin problemas las ráfagas de tráfico no planificadas mediante el uso de la computación en diferentes áreas. Regiones de AWS

También puede aumentar el rendimiento de un modelo mediante la compra de [Rendimiento aprovisionado](prov-throughput.md). Los perfiles de inferencia actualmente no admiten el rendimiento aprovisionado.

Para ver las regiones y los modelos con los que puede utilizar los perfiles de inferencia para ejecutar inferencias entre regiones, consulte [Regiones y modelos compatibles con los perfiles de inferencia](inference-profiles-support.md).

**Topics**
+ [

## Elegir entre la inferencia geográfica y global entre regiones
](#cross-region-inference-comparison)
+ [

## Consideraciones generales
](#cross-region-inference-general-considerations)
+ [

# Inferencia geográfica entre regiones
](geographic-cross-region-inference.md)
+ [

# Inferencia global interregional
](global-cross-region-inference.md)

## Elegir entre la inferencia geográfica y global entre regiones
<a name="cross-region-inference-comparison"></a>

Amazon Bedrock ofrece dos tipos de perfiles de inferencia entre regiones, cada uno diseñado para distintos casos de uso y requisitos de conformidad:


| Característica | Inferencia geográfica entre regiones | Inferencia global entre regiones | Recomendación | 
| --- | --- | --- | --- | 
| Residencia de datos | Dentro de los límites geográficos (EE. UU., UE, APAC, etc.) | Cualquier región AWS comercial compatible en todo el mundo | Elija Geographic para conocer los requisitos de conformidad | 
| Rendimiento | Más alto que en una sola región | El más alto disponible | Elija Global para obtener el máximo rendimiento | 
| Costo | Precio estándar | Ahorros de aproximadamente un 10% | Elija Global para optimizar los costes | 
| Requisitos de SCP | Permita que todas las regiones de destino figuren en el perfil | Permitir "aws:RequestedRegion": "unspecified" | Configure en función de las políticas de su organización | 
| El más adecuado para lo siguiente: | Organizaciones con normas de residencia de datos | Organizations prioriza el costo y el rendimiento | Evalúe sus necesidades de cumplimiento y rendimiento | 

Elija la inferencia geográfica entre regiones cuando tenga requisitos de residencia de datos y necesite asegurarse de que el procesamiento de los datos se mantenga dentro de límites geográficos específicos. Elija la inferencia global entre regiones si desea obtener el máximo rendimiento y ahorrar costes sin restricciones geográficas.

## Consideraciones generales
<a name="cross-region-inference-general-considerations"></a>

Tenga en cuenta la siguiente información sobre la inferencia entre regiones:
+ El uso de la inferencia entre regiones no conlleva ningún costo de enrutamiento adicional. El precio se calcula en función de la región desde la que se llama al perfil de inferencia. Para obtener más información acerca de los precios, consulte [Precios de Amazon Bedrock](https://aws.amazon.com/bedrock/pricing/).
+ La inferencia entre regiones puede dirigir las solicitudes a las Regiones de AWS que no esté habilitada manualmente. Cuenta de AWS No es necesaria la activación manual de regiones para que funcione la inferencia entre regiones.
+ Todos los datos transmitidos durante las operaciones entre regiones permanecen en la AWS red y no atraviesan la Internet pública. Los datos se cifran en tránsito entre. Regiones de AWS
+ Todas las solicitudes de inferencia entre regiones se registran CloudTrail en la región de origen. Busque el `additionalEventData.inferenceRegion` campo para identificar dónde se procesaron las solicitudes.
+ AWS Los servicios impulsados por Amazon Bedrock también pueden usar CRIS. Para obtener más información, consulte la documentación del servicio específico.

# Inferencia geográfica entre regiones
<a name="geographic-cross-region-inference"></a>

La inferencia geográfica entre regiones mantiene el procesamiento de datos dentro de límites geográficos específicos (EE. UU., UE, APAC, etc.) y, al mismo tiempo, proporciona un mayor rendimiento que la inferencia de una sola región. Esta opción es ideal para organizaciones con requisitos de residencia de datos y normas de conformidad.

## Consideraciones sobre la inferencia geográfica entre regiones
<a name="geographic-cris-considerations"></a>

Tenga en cuenta la siguiente información sobre la inferencia geográfica entre regiones:
+ Las solicitudes de inferencia entre regiones a un perfil de inferencia vinculado a una región geográfica (por ejemplo, EE. UU., UE y APAC) se mantienen dentro de la zona geográfica en la Regiones de AWS que residen originalmente los datos. Por ejemplo, una solicitud realizada en los EE. UU. se guarda dentro de los Regiones de AWS EE. UU. Aunque los datos solo permanecen almacenados en la región de origen, las peticiones de entrada y los resultados de salida pueden llevarse fuera de la región de origen durante la inferencia entre regiones. Todos los datos se transmitirán cifrados a través de la red segura de Amazon.
+ Para ver las cuotas predeterminadas de rendimiento entre regiones cuando se utilizan perfiles de inferencia vinculados a una zona geográfica (como EE. UU., UE y APAC), consulte los valores de **solicitudes de inferencia del modelo entre regiones por minuto para \$1\$1Model\$1** y **tokens de inferencia del modelo entre regiones por minuto para \$1\$1Model\$1** en [Cuotas de servicio de Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#limits_bedrock) en la *Referencia general de AWS *.

## Requisitos de la política de IAM para la inferencia geográfica entre regiones
<a name="geographic-cris-iam-setup"></a>

Para permitir que un usuario o rol de IAM invoque un perfil de inferencia geográfica entre regiones, debe permitir el acceso a los siguientes recursos:

1. El perfil de inferencia interregional específico de una región geográfica (estos perfiles tienen prefijos geográficos como,,) `us` `eu` `apac`

1. El modelo básico en la región de origen

1. El modelo básico en todas las regiones de destino que figuran en el perfil geográfico

El siguiente ejemplo de política otorga los permisos necesarios para utilizar el modelo básico de Claude Sonnet 4.5 con un perfil de inferencia geográfica interregional para EE. UU., donde se encuentra la región de origen `us-east-1` y las regiones de destino`us-east-1`, `us-east-2` y: `us-west-2`

```
{
    "Version": "2012-10-17"		 	 	 ,
    "Statement": [
        {
            "Sid": "GrantGeoCrisInferenceProfileAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:us-east-1:<ACCOUNT_ID>:inference-profile/us.anthropic.claude-sonnet-4-5-20250929-v1:0"
            ]
        },
        {
            "Sid": "GrantGeoCrisModelAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:us-east-1::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0",
                "arn:aws:bedrock:us-east-2::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0",
                "arn:aws:bedrock:us-west-2::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0"
            ],
            "Condition": {
                "StringEquals": {
                    "bedrock:InferenceProfileArn": "arn:aws:bedrock:us-east-1:<ACCOUNT_ID>:inference-profile/us.anthropic.claude-sonnet-4-5-20250929-v1:0"
                }
            }
        }
    ]
}
```

La primera declaración concede a la `bedrock:InvokeModel` API acceso al perfil de inferencia geográfica entre regiones para las solicitudes que se originen en la región solicitante. La segunda declaración otorga acceso mediante `bedrock:InvokeModel` API al modelo básico tanto en la región solicitante como en todas las regiones de destino que figuran en el perfil de inferencia.

## Requisitos de la política de control de servicios para la inferencia geográfica entre regiones
<a name="geographic-cris-scp-setup"></a>

Muchas organizaciones implementan controles de acceso regionales a través de políticas de control de servicios en AWS Organizations para garantizar la seguridad y el cumplimiento. Si la política de seguridad de su organización suele SCPs bloquear las regiones no utilizadas, debe asegurarse de que las condiciones SCP específicas de su región permitan el acceso a todas las regiones de destino que figuran en el perfil de inferencia geográfica interregional de su región de origen.

Para realizar una inferencia geográfica entre regiones, debe comprender la relación entre la región de origen (donde realiza la llamada a la API) y las regiones de destino (a las que se pueden enrutar las solicitudes). Consulta la documentación del perfil de inferencia para identificar todas las regiones de destino de tu región de origen y, a continuación, asegúrate de SCPs permitir el acceso a todas esas regiones de destino.

Por ejemplo, si llamas desde us-east-1 (región de origen) con el perfil geográfico estadounidense Anthropic Claude Sonnet 4.5, las solicitudes se pueden dirigir a us-east-1, us-east-2 y us-west-2 (regiones de destino). Si un SCP restringe el acceso solo a us-east-1, la inferencia entre regiones fallará al intentar enrutar a us-east-2 o us-west-2. Por lo tanto, debes incluir las tres regiones de destino en tu SCP, independientemente de la región desde la que llames.

Al configurar SCPs la exclusión regional, recuerde que bloquear cualquier región de destino en el perfil de inferencia impedirá que la inferencia entre regiones funcione correctamente, incluso si la región de origen sigue siendo accesible. Para conocer los requisitos de SCP para la inferencia global entre regiones, consulte. [Requisitos de la política de control de servicios para la inferencia global entre regiones](global-cross-region-inference.md#global-cris-scp-setup)

Para mejorar la seguridad, considere la posibilidad de utilizar la `bedrock:InferenceProfileArn` condición para limitar el acceso a perfiles de inferencia específicos. Esto le permite conceder acceso a las regiones requeridas y, al mismo tiempo, restringir los perfiles de inferencia que se pueden utilizar.

## Utilice la inferencia geográfica entre regiones
<a name="geographic-cris-usage"></a>

Para utilizar la inferencia geográfica entre regiones, debe incluir un [perfil de inferencia al ejecutar la inferencia](inference-profiles.md) del modelo de las siguientes maneras:
+ **Inferencia de modelos bajo demanda**[: especifique el ID del perfil de inferencia `modelId` al enviar una solicitud [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html), [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html)una conversación o una. [ConverseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html)](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html) Un perfil de inferencia define una o más regiones a las que puede enrutar las solicitudes de inferencia que se originan en la región de origen. El uso de la inferencia entre regiones aumenta el rendimiento y mejora la velocidad y el rendimiento al enrutar dinámicamente las solicitudes de invocación del modelo entre las regiones definidas en el perfil de inferencia. Factores de enrutamiento en el tráfico de usuarios, la demanda y la utilización de los recursos. Para obtener más información, consulte [Envío de solicitudes y generación de respuestas con inferencia de modelos](inference.md)
+ **Inferencia por lotes**: envíe las solicitudes de forma asíncrona con la inferencia por lotes especificando el ID del perfil de inferencia al enviar una solicitud. `modelId` [CreateModelInvocationJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_CreateModelInvocationJob.html) El uso de un perfil de inferencia le permite utilizar los recursos de computación en varias Regiones de AWS y lograr tiempos de procesamiento más rápidos para sus trabajos por lotes. Una vez finalizado el trabajo, podrá recuperar los archivos de salida del bucket de Amazon S3 en la región de origen.
+ **Agentes**: especifique el ID del perfil de inferencia en el campo `foundationModel` de una solicitud [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateAgent.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateAgent.html). Para obtener más información, consulte [Creación y configuración de agentes manualmente](agents-create.md).
+ **Generación de respuestas de la base de conocimiento**: puede utilizar la inferencia entre regiones al generar una respuesta después de consultar una base de conocimiento. Para obtener más información, consulte [Prueba de la base de conocimientos mediante consultas y respuestas](knowledge-base-test.md).
+ **Evaluación del modelo:** puede enviar un perfil de inferencia como modelo para evaluarlo al enviar un trabajo de evaluación del modelo. Para obtener más información, consulte [Evaluación del rendimiento de los recursos de Amazon Bedrock](evaluation.md).
+ **Administración de peticiones**: puede utilizar la inferencia entre regiones al generar una respuesta para una petición que haya creado en Administración de peticiones. Para obtener más información, consulte [Creación y almacenamiento de peticiones reutilizables con la administración de peticiones en Amazon Bedrock](prompt-management.md)
+ **Flujos de peticiones**: puede utilizar la inferencia entre regiones al generar una respuesta para una petición insertada en un nodo de petición de un flujo de peticiones. Para obtener más información, consulte [Cree un flujo de trabajo de IA end-to-end generativo con Amazon Bedrock Flows](flows.md).

Para aprender a usar un perfil de inferencia para enviar solicitudes de invocación de modelos entre regiones, consulte [Uso de un perfil de inferencia en la invocación del modelo](inference-profiles-use.md).

Para obtener más información sobre la inferencia entre regiones, consulte [Getting started with cross-region inference in Amazon Bedrock](https://aws.amazon.com/blogs/machine-learning/getting-started-with-cross-region-inference-in-amazon-bedrock/).

Para obtener información detallada sobre la inferencia global entre regiones, incluida la configuración de la IAM y la gestión de las cuotas de servicio, consulte. [Inferencia global interregional](global-cross-region-inference.md)

# Inferencia global interregional
<a name="global-cross-region-inference"></a>

La inferencia global entre regiones amplía la inferencia entre regiones más allá de los límites geográficos, lo que permite enrutar las solicitudes de inferencia a empresas comerciales de todo el Regiones de AWS mundo, optimiza los recursos disponibles y permite un mayor rendimiento del modelo.

## Ventajas de la inferencia global entre regiones
<a name="global-cris-benefits"></a>

La inferencia global entre regiones del Claude Sonnet 4.5 de Anthropic ofrece múltiples ventajas con respecto a los perfiles de inferencia transregional geográfica tradicionales:
+ **Rendimiento mejorado durante los picos de demanda: la** inferencia global entre regiones proporciona una mayor resiliencia durante los períodos de máxima demanda al enrutar automáticamente las solicitudes según la capacidad disponible. Regiones de AWS Este enrutamiento dinámico se realiza sin problemas, sin configuración ni intervención adicionales por parte de los desarrolladores. A diferencia de los enfoques tradicionales, que pueden requerir un equilibrio de carga complejo por parte del cliente Regiones de AWS, la inferencia global entre regiones gestiona los picos de tráfico de forma automática. Esto es especialmente importante para las aplicaciones críticas para la empresa, donde el tiempo de inactividad o la degradación del rendimiento pueden tener un impacto financiero o reputacional significativo.
+ **Rentabilidad: la** inferencia global interregional para el Claude Sonnet 4.5 de Anthropic ofrece un ahorro de aproximadamente un 10% en los precios de los tokens de entrada y salida en comparación con la inferencia geográfica entre regiones. El precio se calcula en función de la fuente a partir de la cual se realiza la Región de AWS solicitud (fuente). Región de AWS Esto significa que las organizaciones pueden beneficiarse de una mayor resiliencia con costes aún más bajos. Este modelo de precios convierte a la inferencia global entre regiones en una solución rentable para las organizaciones que buscan optimizar sus despliegues de IA generativa. Al mejorar la utilización de los recursos y permitir un mayor rendimiento sin costes adicionales, ayuda a las organizaciones a maximizar el valor de su inversión en Amazon Bedrock.
+ **Supervisión simplificada**: cuando se utiliza la inferencia global entre regiones CloudWatch y se CloudTrail siguen registrando las entradas de registro en su fuente Región de AWS, lo que simplifica la observabilidad y la administración. A pesar de que sus solicitudes se procesan en diferentes países del Regiones de AWS mundo, usted mantiene una visión centralizada del rendimiento y los patrones de uso de su aplicación a través de las herramientas de monitoreo que ya conoce. AWS 
+ **Flexibilidad de cuotas bajo demanda**: con la inferencia global entre regiones, sus cargas de trabajo ya no están limitadas por la capacidad regional individual. En lugar de restringirse a la capacidad disponible en una determinada capacidad Región de AWS, sus solicitudes se pueden redirigir de forma dinámica a toda la infraestructura global. AWS Esto proporciona acceso a un conjunto de recursos mucho mayor, lo que facilita la gestión de cargas de trabajo de gran volumen y picos de tráfico repentinos.

## Consideraciones sobre la inferencia global entre regiones
<a name="global-cris-considerations"></a>

Tenga en cuenta la siguiente información sobre la inferencia global entre regiones:
+ Los perfiles de inferencia globales entre regiones proporcionan un rendimiento superior al de un perfil de inferencia vinculado a una zona geográfica concreta. Un perfil de inferencia vinculado a una zona geográfica concreta proporciona un rendimiento superior que la inferencia en una sola región.
+ Para ver las cuotas predeterminadas de rendimiento entre regiones cuando se utilizan perfiles de inferencia globales, consulte los valores de **solicitudes de inferencia del modelo entre regiones globales por minuto para \$1\$1Model\$1** y **tokens de inferencia del modelo entre regiones globales para \$1\$1Model\$1** en [Cuotas de servicio de Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#limits_bedrock) en la *Referencia general de AWS *.

  Puede solicitar, ver y administrar las cuotas del perfil de inferencia global entre regiones desde la [consola Service Quotas](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas) o mediante los comandos de AWS CLI en su región de **origen**.

## Requisitos de la política de IAM para la inferencia global entre regiones
<a name="global-cris-iam-setup"></a>

Para habilitar la inferencia global entre regiones para sus usuarios, debe aplicar al rol una política de IAM dividida en tres partes. El siguiente es un ejemplo de una política de IAM para proporcionar un control detallado. `<REQUESTING REGION>`En el ejemplo, puede sustituir la política por la Región de AWS que está utilizando.

```
{
    "Version": "2012-10-17"		 	 	 ,
    "Statement": [
        {
            "Sid": "GrantGlobalCrisInferenceProfileRegionAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:<REQUESTING REGION>:<ACCOUNT>:inference-profile/global.<MODEL NAME>"
            ],
            "Condition": {
                "StringEquals": {
                    "aws:RequestedRegion": "<REQUESTING REGION>"
                }
            }
        },
        {
            "Sid": "GrantGlobalCrisInferenceProfileInRegionModelAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:<REQUESTING REGION>::foundation-model/<MODEL NAME>"
            ],
            "Condition": {
                "StringEquals": {
                    "aws:RequestedRegion": "<REQUESTING REGION>",
                    "bedrock:InferenceProfileArn": "arn:aws:bedrock:<REQUESTING REGION>:<ACCOUNT>:inference-profile/global.<MODEL NAME>"
                }
            }
        },
        {
            "Sid": "GrantGlobalCrisInferenceProfileGlobalModelAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:::foundation-model/<MODEL NAME>"
            ],
            "Condition": {
                "StringEquals": {
                    "aws:RequestedRegion": "unspecified",
                    "bedrock:InferenceProfileArn": "arn:aws:bedrock:<REQUESTING REGION>:<ACCOUNT>:inference-profile/global.<MODEL NAME>"
                }
            }
        }
    ]
}
```

La primera parte de la política permite el acceso al perfil de inferencia regional incluido en su solicitud Región de AWS. La segunda parte proporciona acceso al recurso FM regional. La tercera parte otorga acceso al recurso FM global, lo que permite la capacidad de enrutamiento entre regiones.

Al implementar estas políticas, asegúrese de que los tres nombres de recursos de Amazon (ARNs) de los recursos estén incluidos en sus declaraciones de IAM:
+ El perfil de inferencia regional ARN sigue el patrón. `arn:aws:bedrock:REGION:ACCOUNT:inference-profile/global.MODEL-NAME` Se utiliza para dar acceso al perfil de inferencia global en la fuente. Región de AWS
+ El FM regional utiliza`arn:aws:bedrock:REGION::foundation-model/MODEL-NAME`. Se usa para dar acceso a la FM de la fuente Región de AWS.
+ La FM global requiere`arn:aws:bedrock:::foundation-model/MODEL-NAME`. Esto se utiliza para dar acceso a la FM en diferentes entornos globales Regiones de AWS.

El ARN FM global no tiene ninguna Región de AWS cuenta especificada, lo cual es intencional y obligatorio para la funcionalidad entre regiones.

### Deshabilite la inferencia global entre regiones
<a name="global-cris-iam-disable"></a>

Puede elegir entre dos enfoques principales para implementar políticas de rechazo en el CRIS global para funciones específicas de IAM, cada uno con diferentes casos de uso e implicaciones:
+ **Eliminar una política de IAM**: el primer método consiste en eliminar una o más de las tres políticas de IAM obligatorias de los permisos de usuario. Como el CRIS global requiere que funcionen las tres políticas, si se elimina una política, se denegará el acceso.
+ **Implementar una política de denegación**: el segundo enfoque consiste en implementar una política de denegación explícita que se dirija específicamente a los perfiles de inferencia del CRIS global. Este método proporciona una documentación clara de su intención de seguridad y garantiza que, incluso si alguien añade accidentalmente las políticas de autorización requeridas más adelante, prevalecerá la denegación explícita. La política de denegación debe utilizar una `StringEquals` condición que coincida con el patrón. `"aws:RequestedRegion": "unspecified"` Este patrón se dirige específicamente a los perfiles de inferencia con el `global` prefijo.

Al implementar políticas de rechazo, es crucial entender que el CRIS global cambia el comportamiento del `aws:RequestedRegion` campo. Las políticas Región de AWS de rechazo tradicionales que utilizan `StringEquals` condiciones con Región de AWS nombres específicos, por ejemplo, no `"aws:RequestedRegion": "us-west-2"` funcionarán como se esperaba con el CRIS global, ya que el servicio establece este campo `global` en lugar de en el destino real. Región de AWS Sin embargo, como se mencionó anteriormente, `"aws:RequestedRegion": "unspecified"` tendrá el efecto de denegación.

## Requisitos de la política de control de servicios para la inferencia global entre regiones
<a name="global-cris-scp-setup"></a>

Para obtener conclusiones globales entre regiones, si la política de seguridad de su organización suele bloquear las regiones no utilizadas, debe actualizar las condiciones de SCP específicas de la región para permitir el acceso a ellas. SCPs `"aws:RequestedRegion": "unspecified"` Esta condición es específica de la inferencia global entre regiones de Amazon Bedrock y garantiza que las solicitudes se puedan enrutar a todas las regiones comerciales compatibles. AWS 

El siguiente ejemplo de SCP bloquea todas las llamadas a la AWS API fuera de las regiones aprobadas y, al mismo tiempo, permite las llamadas de inferencia transregional global de Amazon Bedrock que se utilizan `"unspecified"` como región para el enrutamiento global:

```
{
    "Version": "2012-10-17"		 	 	 ,
    "Statement": [
        {
            "Sid": "DenyAllOutsideApprovedRegions",
            "Effect": "Deny",
            "Action": "*",
            "Resource": "*",
            "Condition": {
                "StringNotEquals": {
                    "aws:RequestedRegion": [
                        "us-east-1",
                        "us-east-2",
                        "us-west-2",
                        "unspecified"
                    ]
                }
            }
        }
    ]
}
```

### Deshabilite la inferencia global entre regiones
<a name="global-cris-disable"></a>

Las organizaciones con requisitos de cumplimiento o residencia de datos deben evaluar si la inferencia global transregional se ajusta a su marco de cumplimiento, ya que las solicitudes pueden procesarse en otras regiones AWS comerciales compatibles. Para deshabilitar explícitamente la inferencia global entre regiones, implemente la siguiente política de SCP:

```
{
    "Effect": "Deny",
    "Action": "bedrock:*",
    "Resource": "*",
    "Condition": {
        "StringEquals": {
            "aws:RequestedRegion": "unspecified"
        },
        "ArnLike": {
            "bedrock:InferenceProfileArn": "arn:aws:bedrock:*:*:inference-profile/global.*"
        }
    }
}
```

Este SCP niega explícitamente la inferencia global entre regiones porque `"aws:RequestedRegion"` es `"unspecified"` y la `"ArnLike"` condición se dirige a los perfiles de inferencia con el `global` prefijo en el ARN.

### AWS Implementación de la Torre de Control
<a name="control-tower-scp"></a>

Se desaconseja encarecidamente la edición manual SCPs gestionada por AWS Control Tower, ya que puede provocar desviaciones. En su lugar, utilice los mecanismos proporcionados por la Torre de Control para gestionar estas excepciones. Los principios básicos implican ampliar los controles de denegación de regiones existentes o habilitar las regiones y, posteriormente, aplicar una política de bloqueo condicional y personalizada.

Para obtener una step-by-step guía detallada sobre la implementación de la inferencia entre regiones con Control Tower, consulte la entrada del blog Habilitar la [inferencia entre regiones de Amazon Bedrock](https://aws.amazon.com/blogs/machine-learning/enable-amazon-bedrock-cross-region-inference-in-multi-account-environments/) en entornos de múltiples cuentas. Esto incluye ampliar la denegación de regiones existente SCPs, habilitar las regiones denegadas con la personalización SCPs y utilizar las personalizaciones para la Torre de AWS Control (cFCT) para implementar la personalización SCPs como infraestructura como código.

## El límite de solicitudes aumenta para la inferencia global entre regiones
<a name="global-cris-quotas"></a>

Al utilizar perfiles de inferencia CRIS globales, puede utilizar el CRIS global de más de 20 fuentes compatibles. Regiones de AWS Como este será un límite global, las solicitudes para ver, administrar o aumentar las cuotas de los perfiles de inferencia globales entre regiones se deben realizar a través de la consola Service Quotas o la interfaz de línea de AWS comandos (AWS CLI) de la fuente solicitada. Región de AWS

Complete los siguientes pasos para solicitar un aumento del límite:

1. Inicie sesión en la consola de Service Quotas de su AWS cuenta.

1. En el panel de navegación, elija **Servicios de AWS **.

1. En la lista de servicios, busque y elija **Amazon Bedrock**.

1. En la lista de cuotas de Amazon Bedrock, utilice el filtro de búsqueda para encontrar las cuotas CRIS globales específicas. Por ejemplo:
   + Símbolos de inferencia del modelo global transregional por minuto para Anthropic Claude Sonnet 4.5 V1

1. Seleccione la cuota que quiere aumentar.

1. Elija **Solicitud de aumento a nivel de cuenta**.

1. Introduzca el nuevo valor de cuota que desee.

1. Elija **Solicitar** para enviar la solicitud.

Al calcular el aumento de cuota necesario, recuerda tener en cuenta la tasa de agotamiento, que se define como la velocidad a la que las fichas de entrada y salida se convierten en cuotas de uso simbólicas para el sistema de regulación. Los siguientes modelos tienen una **tasa de agotamiento de 5 veces para las fichas de salida (1 ficha de salida consume 5 fichas de** tus cuotas):
+ Claude Opus 4 antrópico
+ Soneto antrópico de Claude 4.5
+ Soneto antrópico de Claude 4
+ Soneto antrópico Claude 3.7

En todos los demás modelos, la velocidad de consumo es de **1:1** (1 token de salida consume 1 token de su cuota). En el caso de los tokens de entrada, la relación entre el token y la cuota es de 1:1. El cálculo del número total de tokens por solicitud es el siguiente:

`Input token count + Cache write input tokens + (Output token count x Burndown rate)`

## Utilice la inferencia global entre regiones
<a name="global-cris-usage"></a>

Para utilizar la inferencia global entre regiones con el Claude Sonnet 4.5 de Anthropic, los desarrolladores deben completar los siguientes pasos clave:
+ **Utilice el ID del perfil de inferencia global**: al realizar llamadas a la API a Amazon Bedrock, especifique el ID del perfil de inferencia Claude Sonnet 4.5 de Anthropic global (`global.anthropic.claude-sonnet-4-5-20250929-v1:0`) en lugar de un ID de modelo específico. Región de AWS
+ **Configure los permisos de IAM: conceda los permisos** de IAM adecuados para acceder al perfil de inferencia y al posible destino. FMs Regiones de AWS

Se admite la inferencia global entre regiones para:
+ Inferencia de modelos bajo demanda
+ Inferencia en lotes
+ Agentes
+ Evaluación de modelos
+ Administración de peticiones
+ Flujos rápidos

**nota**  
El perfil de inferencia global es compatible con la inferencia de modelos bajo demanda, la inferencia en lotes, los agentes, la evaluación de modelos, la administración de peticiones y los flujos de peticiones.

## Implemente la inferencia global entre regiones
<a name="global-cris-implementation"></a>

Implementar la inferencia global entre regiones con el Claude Sonnet 4.5 de Anthropic es sencillo y solo requiere algunos cambios en el código de la aplicación existente. El siguiente es un ejemplo de cómo actualizar el código en Python:

```
import boto3
import json
bedrock = boto3.client('bedrock-runtime', region_name='us-east-1')
model_id = "global.anthropic.claude-sonnet-4-5-20250929-v1:0"  
response = bedrock.converse(
    messages=[{"role": "user", "content": [{"text": "Explain cloud computing in 2 sentences."}]}],
    modelId=model_id,
)

print("Response:", response['output']['message']['content'][0]['text'])
print("Token usage:", response['usage'])
print("Total tokens:", response['usage']['totalTokens'])
```