Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Regioni e modelli supportati per i profili di inferenza
Per un elenco dei codici e degli endpoint delle Regioni supportati in Amazon Bedrock, consulta Endpoint e quote Amazon Bedrock. Questo argomento descrive i profili di inferenza predefiniti che puoi utilizzare e le Regioni e i modelli che supportano i profili di inferenza delle applicazioni.
Nota
Cerchi gli ID dei profili di inferenza per un modello specifico? Gli ID del profilo di inferenza di ogni modello e la disponibilità regionale sono ora documentati nella pagina di dettaglio del modello. Visita i modelli a colpo d'occhio e scegli il modello che ti interessa.
Argomenti
Profili di inferenza tra Regioni supportati
È possibile eseguire inferenze tra regioni con profili di inferenza interregionali (definiti dal sistema). Cross-Region l'inferenza consente di gestire senza problemi i picchi di traffico non pianificati utilizzando il calcolo tra diversi. Regioni AWS Con l’inferenza tra Regioni puoi distribuire il traffico tra più Regioni AWS.
Cross-region i profili di inferenza (definiti dal sistema) prendono il nome dal modello che supportano e sono definiti dalle regioni che supportano. Per informazioni sul modo in cui un profilo di inferenza tra Regioni gestisce le richieste, leggi le definizioni seguenti:
-
Regione di origine: Regione da cui effettui la richiesta API che specifica il profilo di inferenza.
-
Regione di destinazione: Regione in cui il servizio Amazon Bedrock può instradare la richiesta dalla Regione di origine.
Quando invochi un profilo di inferenza tra Regioni in Amazon Bedrock, la richiesta proviene da una Regione di origine e viene automaticamente instradata a una delle Regioni di destinazione definite nel profilo, ottimizzando le prestazioni. Le Regioni di destinazione per i profili di inferenza tra Regioni globali includono tutte le Regioni commerciali.
Nota
Le regioni di destinazione in un profilo di inferenza interregionale possono includere regioni opzionali, ovvero regioni che è necessario abilitare esplicitamente a livello di organizzazione. Account AWS Per ulteriori informazioni, consulta Abilita o disabilita Regioni AWS nel tuo account. Quando utilizzi un profilo di inferenza tra Regioni, la richiesta di inferenza può essere instradata a una qualsiasi delle Regioni di destinazione nel profilo, anche se non hai aderito a tali Regioni nell’account.
Le politiche di controllo dei servizi (SCP) e le politiche AWS Identity and Access Management (IAM) collaborano per controllare dove è consentita l'inferenza tra regioni. Utilizzando policy di controllo dei servizi, puoi controllare quali Regioni può utilizzare Amazon Bedrock per l’inferenza, mentre attraverso policy IAM puoi definire quali utenti o ruoli sono autorizzati a eseguire l’inferenza. Se una Regione di destinazione in un profilo di inferenza tra Regioni è bloccata nelle policy di controllo dei servizi, la richiesta avrà esito negativo anche se le altre Regioni restano consentite. Per assicurare il funzionamento efficiente con l’inferenza tra Regioni, puoi aggiornare le policy di controllo dei servizi e IAM in modo da consentire tutte le azioni di inferenza Amazon Bedrock richieste, ad esempio bedrock:InvokeModel* o bedrock:CreateModelInvocationJob, in tutte le Regioni di destinazione incluse nel profilo di inferenza scelto. Per ulteriori informazioni, consulta Enabling Amazon Bedrock cross-Region inference in multi-account environments
Nota
Alcuni profili di inferenza vengono instradati verso Regioni di destinazione diverse, a seconda della Regione di origine da cui vengono chiamati. Ad esempio, se effettui la chiamata da us.anthropic.claude-3-haiku-20240307-v1:0 da Stati Uniti orientali (Ohio), le richieste possono essere instradate verso us-east-1, us-east-2 o us-west-2, mentre per una chiamata effettuata da Stati Uniti occidentali (Oregon), le richieste possono essere instradate solo verso us-east-1 e us-west-2.
Per controllare le Regioni di origine e di destinazione di un profilo di inferenza, puoi effettuare una delle operazioni seguenti:
-
Espandi la sezione corrispondente nell’elenco dei profili di inferenza tra Regioni supportati.
-
Invia una GetInferenceProfilerichiesta con un endpoint del piano di controllo Amazon Bedrock da una regione di origine e specifica l'Amazon Resource Name (ARN) o l'ID del profilo di inferenza nel campo.
inferenceProfileIdentifierIl campomodelsnella risposta è mappato a un elenco di ARN di modelli, in cui puoi individuare ogni Regione di destinazione.
Nota
Il profilo di inferenza globale interregionale per un modello specifico può cambiare nel tempo man mano che vengono AWS aggiunte altre regioni commerciali in cui è possibile elaborare le richieste. Tuttavia, se un profilo di inferenza è legato a un'area geografica (come Stati Uniti, UE o APAC), l'elenco delle regioni di destinazione non cambierà mai. AWS potrebbe creare nuovi profili di inferenza che incorporano nuove regioni. Puoi aggiornare i sistemi in modo che utilizzino questi profili di inferenza modificando gli ID nella configurazione con quelli nuovi.
Il profilo di inferenza tra Regioni globale è attualmente supportato solo nel modello Anthropic Claude Sonnet 4 per queste Regioni di origine: Stati Uniti occidentali (Oregon), Stati Uniti orientali (Virginia settentrionale), Stati Uniti orientali (Ohio), Europa (Irlanda) e Asia Pacifico (Tokyo). Le Regioni di destinazione per il profilo di inferenza globale includono tutte le Regioni AWS commerciali.
Importante
Gli ID dei profili di inferenza interregionali di ogni modello, le regioni di origine supportate, le regioni di destinazione e l'ambito geografico (globale, statunitense o UE) sono documentati nella pagina di dettaglio del modello. Per trovare queste informazioni, consulta la sezione Modelli a colpo d'occhio e scegli il modello che ti interessa. Nella pagina del modello, cerca la tabella di disponibilità regionale, che mostra le regioni che supportano i profili di inferenza In-Region, Geo e Global, mentre la sezione Inference profile IDs elenca gli ID esatti da utilizzare nelle chiamate API.
Se hai bisogno di confrontare le opzioni di residenza dei dati tra più modelli per la pianificazione della conformità, consulta la tabella di disponibilità regionale nella pagina di ciascun modello per confermare che il profilo di inferenza del modello scelto indirizzi le richieste solo verso le regioni che soddisfano i tuoi requisiti.
Regioni e modelli supportati per i profili di inferenza delle applicazioni
I profili di inferenza delle applicazioni possono essere creati per tutti i modelli nei seguenti modi: Regioni AWS
-
ap-northeast-1
-
ap-northeast-2
-
ap-south-1
-
ap-southeast-1
-
ap-southeast-2
-
ca-central-1
-
eu-central-1
-
eu-west-1
-
eu-west-2
-
eu-west-3
-
sa-east-1
-
us-east-1
-
us-east-2
-
us-gov-east-1
-
us-west-2
I profili di inferenza delle applicazioni possono essere creati dalla maggior parte dei modelli supportati in Amazon Bedrock. Alcuni modelli, come i modelli di incorporamento, non supportano i profili di inferenza. Per verificare se un modello specifico supporta i profili di inferenza, consulta i modelli in sintesi.