Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Regiones y modelos compatibles con los perfiles de inferencia
Para obtener una lista de los códigos de región y los puntos de conexión compatibles con Amazon Bedrock, consulte Amazon Bedrock endpoints and quotas. En este tema se describen los perfiles de inferencia predefinidos que puede utilizar y las regiones y los modelos que admiten perfiles de inferencia de aplicación.
nota
¿Busca identificadores de perfil de inferencia para un modelo específico? Los identificadores del perfil de inferencia y la disponibilidad regional de cada modelo están ahora documentados en la página de detalles del modelo. Visite los modelos de un vistazo y elija el modelo que le interese.
Temas
Perfiles de inferencia entre regiones admitidos
Puede realizar inferencias entre regiones con perfiles de inferencia entre regiones (definidos por el sistema). Cross-Region La inferencia le permite gestionar sin problemas las ráfagas de tráfico no planificadas mediante el uso de la computación en diferentes áreas. Regiones de AWS Con la inferencia entre regiones, puede distribuir el tráfico entre varias Regiones de AWS.
Cross-region Los perfiles de inferencia (definidos por el sistema) reciben el nombre del modelo que admiten y están definidos por las regiones que admiten. Para saber cómo un perfil de inferencia entre regiones gestiona sus solicitudes, consulte las siguientes definiciones:
-
Región de origen: la región desde la que realiza la solicitud de API que especifica el perfil de inferencia.
-
Región de destino: una región a la que el servicio de Amazon Bedrock puede enrutar la solicitud de la región de origen.
Cuando invoca un perfil de inferencia entre regiones en Amazon Bedrock, su solicitud se origina en una región de origen y se enruta automáticamente a una de las regiones de destino definidas en ese perfil, lo que optimiza el rendimiento. Las regiones de destino de los perfiles de inferencia global entre regiones incluyen todas las regiones comerciales.
nota
Las regiones de destino de un perfil de inferencia interregional pueden incluir regiones opcionales, que son regiones que debe habilitar de forma explícita a nivel de organización. Cuenta de AWS Para obtener más información, consulta Cómo activar o desactivar tu cuenta Regiones de AWS. Si utiliza un perfil de inferencia entre regiones, su solicitud de inferencia se puede enrutar a cualquiera de las regiones de destino del perfil, incluso si no ha optado por utilizar dichas regiones en su cuenta.
Las políticas de control de servicios (SCP) y las políticas AWS Identity and Access Management (IAM) funcionan en conjunto para controlar dónde se permite la inferencia entre regiones. Con las SCP, puede controlar qué regiones puede usar Amazon Bedrock para la inferencia y, con las políticas de IAM, puede definir qué usuarios o roles tienen permiso para ejecutar la inferencia. Si alguna región de destino de un perfil de inferencia entre regiones está bloqueada en sus SCP, la solicitud fallará aunque se permita el acceso a otras regiones. Para garantizar un funcionamiento eficiente con la inferencia entre regiones, puede actualizar sus políticas de SCP e IAM para permitir todas las acciones de inferencia requeridas de Amazon Bedrock (por ejemplo, bedrock:InvokeModel* o bedrock:CreateModelInvocationJob) en todas las regiones de destino incluidas en el perfil de inferencia elegido. Para obtener más información, consulte Activación de la inferencia entre regiones de Amazon Bedrock en entornos de varias cuentas
nota
Algunos perfiles de inferencia se enrutan a distintas regiones de destino en función de la región de origen desde la que se llamen. Por ejemplo, si llama a us.anthropic.claude-3-haiku-20240307-v1:0 desde Este de EE. UU (Ohio), puede enrutar las solicitudes a us-east-1, us-east-2 ous-west-2, pero si realiza la llamada desde Oeste de EE. UU. (Oregón), solo puede enrutar las solicitudes a us-east-1 y us-west-2.
Para comprobar si las regiones de origen y destino tienen un perfil de inferencia, puede seguir uno de estos pasos:
-
Amplíe la sección correspondiente de la lista de perfiles de inferencia entre regiones compatibles.
-
Envíe una GetInferenceProfilesolicitud con un punto final del plano de control de Amazon Bedrock desde una región de origen y especifique el nombre del recurso de Amazon (ARN) o el ID del perfil de inferencia en el campo.
inferenceProfileIdentifierEl campomodelsde la respuesta se asigna a una lista de ARN del modelo, en la que puede identificar cada región de destino.
nota
El perfil de inferencia global entre regiones de un modelo específico puede cambiar con el tiempo, ya que AWS añade más regiones comerciales en las que se pueden procesar sus solicitudes. Sin embargo, si un perfil de inferencia está vinculado a una región geográfica (como EE. UU., la UE o APAC), su lista de regiones de destino nunca cambiará. AWS podría crear nuevos perfiles de inferencia que incorporen nuevas regiones. Puede actualizar sus sistemas para usar estos perfiles de inferencia cambiando los ID de su configuración por otros nuevos.
El perfil de inferencia global entre regiones solo se admite actualmente en el modelo Anthropic Claude Sonnet 4 para las siguientes regiones de origen: Oeste de EE. UU. (Oregón), Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Europa (Irlanda) y Asia-Pacífico (Tokio). Las regiones de destino de los perfiles de inferencia global entre regiones incluyen todas las Regiones de AWS comerciales.
importante
Los identificadores del perfil de inferencia interregional de cada modelo, las regiones de origen compatibles, las regiones de destino y el ámbito geográfico (global, estadounidense o europeo) se documentan en la página de detalles del modelo. Para encontrar esta información, visite los modelos de un vistazo y elija el modelo que le interese. En la página del modelo, busca la tabla de disponibilidad regional, en la que se muestran las regiones que admiten In-Region perfiles de inferencia geográficos y globales, y en la sección de identificadores de perfiles de inferencia se enumeran los identificadores exactos que se deben usar en las llamadas a las API.
Si necesita comparar las opciones de residencia de datos en varios modelos para planificar el cumplimiento, consulte la tabla de disponibilidad regional de la página de cada modelo para confirmar que el perfil de inferencia del modelo elegido dirige las solicitudes solo a las regiones que cumplen sus requisitos.
Regiones y modelos compatibles con los perfiles de inferencia de aplicación
Los perfiles de inferencia de aplicaciones se pueden crear para todos los modelos de la siguiente manera: Regiones de AWS
-
ap-northeast-1
-
ap-northeast-2
-
ap-south-1
-
ap-southeast-1
-
ap-southeast-2
-
ca-central-1
-
eu-central-1
-
eu-west-1
-
eu-west-2
-
eu-west-3
-
sa-east-1
-
us-east-1
-
us-east-2
-
us-gov-east-1
-
us-west-2
Los perfiles de inferencia de aplicaciones se pueden crear a partir de la mayoría de los modelos compatibles con Amazon Bedrock. Algunos modelos, como los modelos de incrustación, no admiten perfiles de inferencia. Para comprobar si un modelo específico admite perfiles de inferencia, consulte los modelos de un vistazo.