Profili di inferenza tra Regioni supportati Regioni e modelli supportati per i profili di inferenza delle applicazioni

Regioni e modelli supportati per i profili di inferenza

Per un elenco dei codici e degli endpoint delle Regioni supportati in Amazon Bedrock, consulta Endpoint e quote Amazon Bedrock. Questo argomento descrive i profili di inferenza predefiniti che puoi utilizzare e le Regioni e i modelli che supportano i profili di inferenza delle applicazioni.

Nota

Cerchi gli ID dei profili di inferenza per un modello specifico? Gli ID del profilo di inferenza di ogni modello e la disponibilità regionale sono ora documentati nella pagina di dettaglio del modello. Visita i modelli a colpo d'occhio e scegli il modello che ti interessa.

Argomenti

Profili di inferenza tra Regioni supportati
Regioni e modelli supportati per i profili di inferenza delle applicazioni

Profili di inferenza tra Regioni supportati

È possibile eseguire inferenze tra regioni con profili di inferenza interregionali (definiti dal sistema). Cross-Region l'inferenza consente di gestire senza problemi i picchi di traffico non pianificati utilizzando il calcolo tra diversi. Regioni AWS Con l’inferenza tra Regioni puoi distribuire il traffico tra più Regioni AWS.

Cross-Region i profili di inferenza (definiti dal sistema) prendono il nome dal modello che supportano e sono definiti dalle regioni che supportano. Per capire come un profilo di inferenza interregionale gestisce le tue richieste, consulta le seguenti definizioni:

Regione di origine: Regione da cui effettui la richiesta API che specifica il profilo di inferenza.
Regione di destinazione: Regione in cui il servizio Amazon Bedrock può instradare la richiesta dalla Regione di origine.

Quando invochi un profilo di inferenza tra Regioni in Amazon Bedrock, la richiesta proviene da una Regione di origine e viene automaticamente instradata a una delle Regioni di destinazione definite nel profilo, ottimizzando le prestazioni. Le Regioni di destinazione per i profili di inferenza tra Regioni globali includono tutte le Regioni commerciali.

Nota

Le regioni di destinazione in un profilo di inferenza interregionale possono includere regioni opzionali, ovvero regioni che è necessario abilitare esplicitamente a livello di organizzazione. Account AWS Per ulteriori informazioni, consulta Abilita o disabilita Regioni AWS nel tuo account. Quando utilizzi un profilo di inferenza tra Regioni, la richiesta di inferenza può essere instradata a una qualsiasi delle Regioni di destinazione nel profilo, anche se non hai aderito a tali Regioni nell’account. Le richieste di input e i risultati di output possono essere archiviati nelle Regioni opzionali per scopi di rilevamento degli abusi.

Le politiche di controllo dei servizi (SCP) e le politiche AWS Identity and Access Management (IAM) collaborano per controllare dove è consentita l'inferenza tra regioni. Utilizzando policy di controllo dei servizi, puoi controllare quali Regioni può utilizzare Amazon Bedrock per l’inferenza, mentre attraverso policy IAM puoi definire quali utenti o ruoli sono autorizzati a eseguire l’inferenza. Se una Regione di destinazione in un profilo di inferenza tra Regioni è bloccata nelle policy di controllo dei servizi, la richiesta avrà esito negativo anche se le altre Regioni restano consentite. Per garantire un funzionamento efficiente con l'inferenza tra regioni, puoi aggiornare le tue policy SCP e IAM per consentire tutte le azioni di inferenza Amazon Bedrock richieste (ad esempio, bedrock:InvokeModel* obedrock:CreateModelInvocationJob) in tutte le regioni di destinazione incluse nel profilo di inferenza scelto. Per ulteriori informazioni, consulta Enabling Amazon Bedrock cross-Region inference in multi-account environments.

Nota

Alcuni profili di inferenza vengono instradati verso Regioni di destinazione diverse, a seconda della Regione di origine da cui vengono chiamati. Ad esempio, se effettui la chiamata da us.anthropic.claude-3-haiku-20240307-v1:0 da Stati Uniti orientali (Ohio), le richieste possono essere instradate verso us-east-1, us-east-2 o us-west-2, mentre per una chiamata effettuata da Stati Uniti occidentali (Oregon), le richieste possono essere instradate solo verso us-east-1 e us-west-2.

Per controllare le Regioni di origine e di destinazione di un profilo di inferenza, puoi effettuare una delle operazioni seguenti:

Espandi la sezione corrispondente nell'elenco dei profili di inferenza interregionali supportati.
Invia una GetInferenceProfilerichiesta con un endpoint del piano di controllo Amazon Bedrock da una regione di origine e specifica l'Amazon Resource Name (ARN) o l'ID del profilo di inferenza nel campo. inferenceProfileIdentifier Il campo models nella risposta è mappato a un elenco di ARN di modelli, in cui puoi individuare ogni Regione di destinazione.

Nota

Il profilo di inferenza globale interregionale per un modello specifico può cambiare nel tempo man mano che vengono AWS aggiunte altre regioni commerciali in cui è possibile elaborare le richieste. Tuttavia, se un profilo di inferenza è legato a un'area geografica (ad esempio Stati Uniti, UE o APAC), l'elenco delle regioni di destinazione non cambierà mai. AWS potrebbe creare nuovi profili di inferenza che incorporano nuove regioni. Puoi aggiornare i sistemi in modo che utilizzino questi profili di inferenza modificando gli ID nella configurazione con quelli nuovi.

Il profilo di inferenza globale interregionale è attualmente supportato solo sul Anthropic Claude Sonnet 4 modello per le seguenti regioni di origine: Stati Uniti occidentali (Oregon), Stati Uniti orientali (Virginia settentrionale), Stati Uniti orientali (Ohio), Europa (Irlanda) e Asia Pacifico (Tokyo). Le Regioni di destinazione per il profilo di inferenza globale includono tutte le Regioni AWS commerciali.

Importante

Gli ID del profilo di inferenza interregionale di ogni modello, le regioni di origine supportate, le regioni di destinazione e l'ambito geografico (globale, statunitense o UE) sono documentati nella pagina di dettaglio del modello. Per trovare queste informazioni, consulta la sezione Modelli a colpo d'occhio e scegli il modello che ti interessa. Nella pagina del modello, cerca la tabella di disponibilità regionale, che mostra le regioni che supportano i profili di inferenza In-Region, Geo e Global, mentre la sezione Inference profile IDs elenca gli ID esatti da utilizzare nelle chiamate API.

Se hai bisogno di confrontare le opzioni di residenza dei dati tra più modelli per la pianificazione della conformità, consulta la tabella di disponibilità regionale nella pagina di ciascun modello per confermare che il profilo di inferenza del modello scelto indirizzi le richieste solo verso le regioni che soddisfano i tuoi requisiti.

Regioni e modelli supportati per i profili di inferenza delle applicazioni

I profili di inferenza delle applicazioni possono essere creati per tutti i modelli nei seguenti modi: Regioni AWS

ap-northeast-1
ap-northeast-2
ap-south-1
ap-southeast-1
ap-southeast-2
ca-central-1
eu-central-1
eu-west-1
eu-west-2
eu-west-3
sa-east-1
us-east-1
us-east-2
us-gov-east-1
us-west-2

I profili di inferenza delle applicazioni possono essere creati dalla maggior parte dei modelli supportati in Amazon Bedrock. Alcuni modelli, come i modelli di incorporamento, non supportano i profili di inferenza. Per verificare se un modello specifico supporta i profili di inferenza, consulta i modelli in sintesi.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Profili di inferenza

Prerequisiti