Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Unterstützte Regionen und Modelle für Inferenzprofile
Eine Liste der in Amazon Bedrock unterstützten Regionscodes und Endpunkte finden Sie unter Endpunkte und Kontingente von Amazon Bedrock. In diesem Thema werden vordefinierte Inferenzprofile beschrieben, die Sie verwenden können, sowie die Regionen und Modelle, die Anwendungsinferenzprofile unterstützen.
Anmerkung
Suchen Sie nach Inferenzprofil-IDs für ein bestimmtes Modell? Die Inferenzprofil-IDs und die regionale Verfügbarkeit der einzelnen Modelle sind jetzt auf der Detailseite des Modells dokumentiert. Sehen Sie sich Modelle auf einen Blick an und wählen Sie das Modell aus, an dem Sie interessiert sind.
Themen
Unterstützte regionsübergreifende Inferenzprofile
Mit regionsübergreifenden (systemdefinierten) Inferenzprofilen können Sie regionsübergreifende Inferenzen durchführen. Cross-Region Inferenz ermöglicht es Ihnen, ungeplante Datenverkehrsspitzen nahtlos zu bewältigen, indem Sie Rechenleistung auf verschiedene Arten nutzen. AWS-Regionen Mit regionsübergreifender Inferenz können Sie den Datenverkehr auf mehrere AWS-Regionen verteilen.
Cross-region (systemdefinierte) Inferenzprofile werden nach dem Modell benannt, das sie unterstützen, und durch die Regionen definiert, die sie unterstützen. Um zu verstehen, wie ein regionenübergreifendes Inferenzprofil Ihre Anforderungen verarbeitet, lesen Sie die folgenden Definitionen:
-
Quellregion – Die Region, aus der Sie die API-Anfrage stellen, die das Inferenzprofil spezifiziert.
-
Zielregion – Eine Region, an die der Amazon-Bedrock-Service die Anforderung aus der Quellregion weiterleiten kann.
Wenn Sie ein regionenübergreifendes Inferenzprofil in Amazon Bedrock aufrufen, stammt Ihre Anforderung aus einer Quellregion und wird automatisch an eine der in diesem Profil definierten Zielregionen weitergeleitet, wodurch die Leistung optimiert wird. Die Zielregionen für globale regionenübergreifende Inferenzprofile umfassen alle kommerziellen Regionen.
Anmerkung
Die Zielregionen in einem regionsübergreifenden Inferenzprofil können Opt-in-Regionen enthalten. Dabei handelt es sich um Regionen, die Sie explizit auf oder Organisationsebene aktivieren müssen. AWS-Konto Weitere Informationen finden Sie unter AWS-Regionen In Ihrem Konto aktivieren oder deaktivieren. Bei Verwendung eines regionsübergreifenden Inferenzprofils kann Ihre Inferenzanforderung an eine der Zielregionen im Profil weitergeleitet werden, auch wenn Sie sich in Ihrem Konto nicht für solche Regionen angemeldet haben.
Die Richtlinien für Service Control Policies (SCPs) und AWS Identity and Access Management (IAM) kontrollieren gemeinsam, wo regionsübergreifende Inferenzen zulässig sind. Mithilfe von Service-Kontrollrichtlinien können Sie steuern, welche Regionen Amazon Bedrock für Inferenzen verwenden kann, und mithilfe von IAM-Richtlinien können Sie definieren, welche Benutzer oder Rollen zum Ausführen von Inferenzen berechtigt sind. Wenn eine Zielregion in einem regionsübergreifenden Inferenzprofil in Ihren Service-Kontrollrichtlinien blockiert ist, schlägt die Anforderung fehl, auch wenn andere Regionen weiterhin zulässig sind. Zum Sicherstellen eines effizienten Betriebs mit regionenübergreifender Inferenz können Sie Ihre SCP- und IAM-Richtlinien aktualisieren, um alle erforderlichen Amazon-Bedrock-Inferenzaktionen (z. B. bedrock:InvokeModel* oder bedrock:CreateModelInvocationJob) in allen Zielregionen zuzulassen, die in Ihrem ausgewählten Inferenzprofil enthalten sind. Weitere Informationen finden Sie unter Aktivieren der regionsübergreifenden Amazon-Bedrock-Inferenz in Umgebungen mit mehreren Konten
Anmerkung
Einige Inferenzprofile werden an unterschiedliche Zielregionen weitergeleitet, je nachdem, aus welcher Quellregion Sie sie aufrufen. Wenn Sie beispielsweise us.anthropic.claude-3-haiku-20240307-v1:0 von USA Ost (Ohio) aus aufrufen, können Anforderungen an us-east-1, us-east-2 oder us-west-2 weitergeleitet werden. Wenn Sie den Parameter jedoch von USA West (Oregon) aus aufrufen, können Anforderungen nur an us-east-1 und us-west-2 weitergeleitet werden.
Um die Quell- und Zielregionen für ein Inferenzprofil zu überprüfen, können Sie einen der folgenden Schritte ausführen:
-
Erweitern Sie den entsprechenden Abschnitt in der Liste der unterstützten regionsübergreifenden Inferenzprofile.
-
Senden Sie eine GetInferenceProfileAnfrage mit einem Endpunkt der Amazon Bedrock-Steuerebene aus einer Quellregion und geben Sie den Amazon-Ressourcennamen (ARN) oder die ID des Inferenzprofils in das
inferenceProfileIdentifierFeld ein. Das Feldmodelsin der Antwort wird einer Liste von Modell-ARNs zugeordnet, in der Sie die jeweilige Zielregion identifizieren können.
Anmerkung
Das globale regionsübergreifende Inferenzprofil für ein bestimmtes Modell kann sich im Laufe der Zeit ändern, da weitere kommerzielle Regionen AWS hinzugefügt werden, in denen Ihre Anfragen bearbeitet werden können. Wenn ein Inferenzprofil jedoch an eine Region gebunden ist (z. B. USA, EU oder APAC), ändert sich die Liste der Zielregionen nicht. AWS könnte neue Inferenzprofile erstellen, die neue Regionen einbeziehen. Sie können Ihre Systeme so aktualisieren, dass diese Inferenzprofile verwendet werden, indem Sie die IDs in Ihrer Einrichtung auf die neuen IDs ändern.
Das globale regionenübergreifende Inferenzprofil wird derzeit nur für das Anthropic Claude Sonnet 4-Modell für die folgenden Quellregionen unterstützt: USA West (Oregon), USA Ost (Nord-Virginia), USA Ost (Ohio), Europa (Irland) und Asien-Pazifik (Tokio). Die Zielregionen für das globale Inferenzprofil umfassen alle kommerziellen AWS-Regionen.
Wichtig
Die regionsübergreifenden Inferenzprofil-IDs der einzelnen Modelle, die unterstützten Quellregionen, die Zielregionen und der geografische Geltungsbereich (global, USA oder EU) sind auf der Detailseite des Modells dokumentiert. Diese Informationen finden Sie unter Modelle auf einen Blick und wählen Sie das Modell aus, an dem Sie interessiert sind. Suchen Sie auf der Modellseite nach der Tabelle Regionale Verfügbarkeit. Sie zeigt, welche Regionen geografische und globale Inferenzprofile unterstützen In-Region, und im Abschnitt Inferenzprofil-IDs sind die genauen IDs aufgeführt, die in API-Aufrufen verwendet werden sollen.
Wenn Sie die Optionen für die Datenresidenz in mehreren Modellen für die Compliance-Planung vergleichen müssen, überprüfen Sie die regionale Verfügbarkeitstabelle auf den Seiten der einzelnen Modelle, um sicherzustellen, dass das Inferenzprofil Ihres ausgewählten Modells Anfragen nur an Regionen weiterleitet, die Ihren Anforderungen entsprechen.
Unterstützte Regionen und Modelle für Anwendungsinferenzprofile
Anwendungs-Inferenzprofile können im Folgenden für alle Modelle erstellt werden: AWS-Regionen
-
ap-northeast-1
-
ap-northeast-2
-
ap-south-1
-
ap-southeast-1
-
ap-southeast-2
-
ca-central-1
-
eu-central-1
-
eu-west-1
-
eu-west-2
-
eu-west-3
-
sa-east-1
-
us-east-1
-
us-east-2
-
us-gov-east-1
-
us-west-2
Anwendungs-Inferenzprofile können aus den meisten in Amazon Bedrock unterstützten Modellen erstellt werden. Einige Modelle, wie z. B. das Einbetten von Modellen, unterstützen keine Inferenzprofile. Um zu überprüfen, ob ein bestimmtes Modell Inferenzprofile unterstützt, sehen Sie sich Modelle auf einen Blick an.