Überlegungen zu regionsübergreifenden Inferenzen IAM-Richtlinienanforderungen für geografische regionsübergreifende Inferenz Anforderungen an die Service Control-Richtlinie für geografische regionsübergreifende Inferenzen Verwenden Sie geografische regionsübergreifende Inferenz

Geografische regionsübergreifende Inferenz

Regionsübergreifende geografische Inferenz hält die Datenverarbeitung innerhalb bestimmter geografischer Grenzen (USA, EU, APAC usw.) und bietet gleichzeitig einen höheren Durchsatz als Inferenz mit einer einzelnen Region. Diese Option ist ideal für Unternehmen mit Anforderungen an die Datenresidenz und Compliance-Vorschriften.

Überlegungen zu regionsübergreifenden Inferenzen

Beachten Sie die folgenden Informationen zur regionsübergreifenden geographischen Inferenz:

Cross-Region Inferenzanfragen für ein an eine bestimmte Region gebundenes Inferenzprofil (z. B. USA, EU und APAC) werden innerhalb der Region gespeichert, die Teil der Region istAWS-Regionen, in der sich die Daten ursprünglich befinden. Beispielsweise wird eine in den USA gestellte Anfrage innerhalb der USA aufbewahrt. AWS-Regionen Standardmäßig bleiben die Daten nur in der Quellregion gespeichert, aber Ihre Eingabeaufforderungen und Ausgabeergebnisse können sich während der regionsübergreifenden Inferenz außerhalb Ihrer Quellregion bewegen. Soweit wir Daten zur Missbrauchserkennung speichern, werden Ihre Eingabeaufforderungen und Ausgabeergebnisse in der Zielregion gespeichert. Missbrauchserkennung von Amazon BedrockWeitere Informationen darüber, welche Modelle Speicherplatz benötigen, finden Sie unter. Alle Daten werden bei der Übertragung über das sichere Netzwerk von Amazon verschlüsselt.
Die Standardkontingente für den regionsübergreifenden Durchsatz bei der Verwendung von Inferenzprofilen, die an eine bestimmte Region gebunden sind (z. B. USA, EU und APAC), finden Sie in der Allgemeinen Referenz unter Cross-region Modellinferenzanfragen pro Minute für $ {Model} und Cross-region Modellinferenz-Token pro Minute für $ {Model} -Werte in Amazon Bedrock Service-Kontingente. AWS

IAM-Richtlinienanforderungen für geografische regionsübergreifende Inferenz

Damit ein IAM-Benutzer oder eine IAM-Rolle ein regionsübergreifendes geografisches Inferenzprofil aufrufen kann, müssen Sie Zugriff auf die folgenden Ressourcen gewähren:

Das geografiespezifische regionsübergreifende Inferenzprofil (diese Profile haben geografische Präfixe wie,,) us eu apac
Das Basismodell in der Quellregion
Das Gründungsmodell in allen Zielregionen, die im geografischen Profil aufgeführt sind

Die folgende Beispielrichtlinie gewährt die erforderlichen Berechtigungen zur Verwendung des Claude Sonnet 4.5-Foundation-Modells mit einem geografisch übergreifenden Inferenzprofil für die USA, wobei sich die Quellregion us-east-1 und die Zielregionenus-east-1,, us-east-2 und befinden: us-west-2


{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Sid": "GrantGeoCrisInferenceProfileAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:us-east-1:<ACCOUNT_ID>:inference-profile/us.anthropic.claude-sonnet-4-5-20250929-v1:0"
            ]
        },
        {
            "Sid": "GrantGeoCrisModelAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:us-east-1::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0",
                "arn:aws:bedrock:us-east-2::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0",
                "arn:aws:bedrock:us-west-2::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0"
            ],
            "Condition": {
                "StringEquals": {
                    "bedrock:InferenceProfileArn": "arn:aws:bedrock:us-east-1:<ACCOUNT_ID>:inference-profile/us.anthropic.claude-sonnet-4-5-20250929-v1:0"
                }
            }
        }
    ]
}

Die erste Anweisung gewährt bedrock:InvokeModel API-Zugriff auf das Geographic Cross-Region-Inferenzprofil für Anfragen, die aus der anfragenden Region stammen. Die zweite Anweisung gewährt bedrock:InvokeModel API-Zugriff auf das Foundation-Modell sowohl in der anfragenden Region als auch in allen im Inferenzprofil aufgeführten Zielregionen.

Anforderungen an die Service Control-Richtlinie für geografische regionsübergreifende Inferenzen

Viele Organizations implementieren regionale Zugriffskontrollen im Rahmen von Service Control Policies in AWS Organisationen aus Sicherheits- und Compliance-Gründen. Wenn die Sicherheitsrichtlinie Ihrer Organisation SCPs verwendet, um ungenutzte Regionen zu blockieren, müssen Sie sicherstellen, dass Ihre Region-specific SCP-Bedingungen den Zugriff auf alle Zielregionen zulassen, die im geografisch übergreifenden Inferenzprofil für Ihre Quellregion aufgeführt sind.

Für regionsübergreifende geografische Inferenzen müssen Sie die Beziehung zwischen Ihrer Quellregion (wo Sie den API-Aufruf tätigen) und den Zielregionen (an die Anfragen weitergeleitet werden können) verstehen. Lesen Sie in der Dokumentation zum Inferenzprofil nach, um alle Zielregionen für Ihre Quellregion zu identifizieren, und stellen Sie dann sicher, dass Ihre SCPs den Zugriff auf all diese Zielregionen ermöglichen.

Wenn Sie beispielsweise von us-east-1 (Quellregion) aus anrufen und das geografische Profil US Anthropic Claude Sonnet 4.5 verwenden, können Anfragen an us-east-1, us-east-2 und us-west-2 (Zielregionen) weitergeleitet werden. Wenn ein SCP den Zugriff nur auf us-east-1 einschränkt, schlägt die regionsübergreifende Inferenz fehl, wenn versucht wird, nach us-east-2 oder us-west-2 zu routen. Daher müssen Sie alle drei Zielregionen in Ihrem SCP zulassen, unabhängig davon, aus welcher Region Sie anrufen.

Denken Sie bei der Konfiguration von SCPs für den Ausschluss von Regionen daran, dass das Blockieren einer beliebigen Zielregion im Inferenzprofil verhindert, dass regionsübergreifende Inferenzen ordnungsgemäß funktionieren, selbst wenn Ihre Quellregion weiterhin zugänglich ist. Informationen zu den SCP-Anforderungen für globale regionsübergreifende Inferenz finden Sie unter. Anforderungen an die Service Control-Richtlinie für globale regionsübergreifende Inferenz

Um die Sicherheit zu erhöhen, sollten Sie erwägen, die bedrock:InferenceProfileArn Bedingung zu verwenden, um den Zugriff auf bestimmte Inferenzprofile zu beschränken. Auf diese Weise können Sie Zugriff auf die erforderlichen Regionen gewähren und gleichzeitig einschränken, welche Inferenzprofile verwendet werden können.

Verwenden Sie geografische regionsübergreifende Inferenz

Um die regionsübergreifende geografische Inferenz zu verwenden, fügen Sie ein Inferenzprofil hinzu, wenn Sie die Modellinferenz auf folgende Weise ausführen:

On-demand Modellinferenz — Geben Sie die ID des Inferenzprofils an, die modelId beim Senden einer InvokeModel, InvokeModelWithResponseStreamConverse oder -Anforderung verwendet wird. ConverseStream Ein Inferenzprofil definiert eine oder mehrere Regionen, an die es Inferenzanforderungen weiterleiten kann, die aus Ihrer Quellregion stammen. Die Verwendung von regionsübergreifender Inferenz erhöht den Durchsatz und die Leistung, da die Rechenleistung für alle im Inferenzprofil definierten Regionen genutzt wird. Weitere Informationen finden Sie unter Inferenzanfragen stellen.
Batch-Inferenz — Senden Sie Anfragen asynchron mit Batch-Inferenz, indem Sie modelId beim Senden einer Anfrage die ID des Inferenzprofils angeben. CreateModelInvocationJob Durch die Verwendung eines Inferenzprofils können Sie die Rechenleistung für mehrere Aufgaben verwenden AWS-Regionen und so schnellere Verarbeitungszeiten für Ihre Batch-Jobs erzielen. Nach Abschluss des Auftrags können Sie die Ausgabedateien aus dem Amazon-S3-Bucket in der Quellregion abrufen.
Agenten – Geben Sie die ID des Inferenzprofils in das Feld foundationModel der Anforderung CreateAgent ein. Weitere Informationen finden Sie unter Manuelles Erstellen und Konfigurieren von Agenten.
Generierung von Antworten in der Wissensdatenbank – Sie können eine regionenübergreifende Inferenz verwenden, wenn Sie nach der Abfrage einer Wissensdatenbank eine Antwort generieren. Weitere Informationen finden Sie unter Testen Ihrer Wissensdatenbank mit Abfragen und Antworten.
Modellbewertung – Sie können ein Inferenzprofil als Modell zur Bewertung senden, wenn Sie einen Auftrag zur Modellbewertung übermitteln. Weitere Informationen finden Sie unter Die Leistung von Amazon-Bedrock-Ressourcen bewerten.
Prompt-Management – Sie können eine regionenübergreifende Inferenz verwenden, wenn Sie eine Antwort für einen Prompt generieren, die Sie im Prompt-Management erstellt haben. Weitere Informationen finden Sie unter Erstellen und Speichern wiederverwendbarer Prompts mit dem Prompt-Management in Amazon Bedrock.
Prompt-Abläufe – Sie können eine regionenübergreifende Inferenz verwenden, wenn Sie eine Antwort für einen Prompt generieren, die Sie inline in einem Prompt-Knoten in einem Prompt-Ablauf definiert haben. Weitere Informationen finden Sie unter Erstellen eines durchgängigen Workflows mit generativer KI mit Amazon Bedrock Flows.

Weitere Informationen zur Verwendung eines Inferenzprofils zum Senden von Modellaufrufanforderungen über Regionen hinweg finden Sie unter So verwenden Sie ein Inferenzprofil beim Modellaufruf.

Weitere Informationen zur regionsübergreifenden Inferenz finden Sie unter Erste Schritte mit regionsübergreifender Inferenz in Amazon Bedrock.

Ausführliche Informationen zur globalen regionsübergreifenden Inferenz, einschließlich IAM-Einrichtung und Verwaltung von Servicekontingenten, finden Sie unter. Globale regionsübergreifende Inferenz

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Cross-Region Folgerung

Globale regionsübergreifende Inferenz